分类
摘要:
本文介绍
说实话,这个需求头一次碰到,我相信对于大多数朋友来说,也是头一次碰到。“提取excel文本框中的内容”,对,你没有听错!我也不知道你碰到过没有,但是这确实是一位朋友提出的很好的问题。
说实话,Python操作excel的库很多,但是我几乎没有找到实现这个需求的api。比如说,我最常使用的openpyxl... 阅读原文
2021-04-09 18:27:05 阅读(1583) 评论(0)
摘要:
Gensim库简介
机器学习算法需要使用向量化后的数据进行预测,对于文本数据来说,因为算法执行的是关于矩形的数学运算,这意味着我们必须将字符串转换为向量。从数学的角度看,向量是具有大小和方向的几何对象,不需过多地关注概念,只需将向量化看作一种将单词映射到数学空间的方法,同时保留其本身蕴含的信息。
Gensim是世界上... 阅读原文
2021-04-09 16:45:08 阅读(1764) 评论(0)
摘要:
概述
国家统计局的公开数据真实性强,宏观且与我们的生活息息相关。
因此,采集此数据作为数据分析实验的数据再好不过。
采集过程
采集各种公开数据的第一步就是分析网页。
上面的图是国家统计局年度数据的界面。 左边是数据分类的树形菜单,右边是每个菜单点击之后显示的数据,可以设置年份来过滤数据。
采集数据分类树
根据页面的... 阅读原文
2021-04-09 15:31:09 阅读(1801) 评论(0)
摘要:
Anaconda
目录
Anaconda
学习地址
为什么要学习数据分析
下载
下载地址
更改工作目录
基本使用
认识jupyter notebook
学习地址
【python教程】数据分析——numpy、pandas、matplotlib
为什么要学习数据分析
有岗位需求
是paython数据... 阅读原文
2021-04-09 14:55:03 阅读(1683) 评论(0)
摘要:
matplotlib基本要点
目录
matplotlib基本要点
什么是matplotlib为什么要学习matplotlib
matplotlib基本要点
简单使用:假设一天中每隔两小时range(2,26,2)的气温℃分别是[15,13,14.5,17,20,25,26,26,27,22,18,15]
... 阅读原文
2021-04-09 13:47:15 阅读(1578) 评论(0)
摘要:
数据合并(pd.merge)
根据单个或多个键将不同DataFrame的行连接起来
类似数据库的连接操作
pd.merge:(left, right, how='inner',on=None,left_on=None, right_on=None )left:合并时左边的DataFrameright:合并... 阅读原文
2021-04-08 22:48:10 阅读(1615) 评论(0)
摘要:
是的,它是在2.5版中添加表达式语法为:
a if condition else b
第一condition被评估,则恰好中的任一个a或b进行评估并返回基于所述布尔值condition。如果condition为True,a则被评估并返回但b被忽略,否则b被评估为返回但a被忽略。
这允许发生短路,因为conditio... 阅读原文
2021-04-08 21:30:01 阅读(1887) 评论(0)
摘要:
数据清洗是数据分析关键的一步,直接影响之后的处理工作
数据需要修改吗?有什么需要修改的吗?数据应该怎么调整才能适用于接下来的分析和挖掘?
是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作
1. 处理缺失数据:
pd.fillna()
pd.dropna()
2. 数据转换
2.1 处理重复... 阅读原文
2021-04-08 16:38:08 阅读(1705) 评论(0)
摘要:
python推导式初学python,可以评论互相交流,# 列表推导式格式:# 格式:[表达式 for 变量 in 旧列表] 不带条件# [表达式 for 变量 in 旧列表 if 条件] 带条件#将1-100之间能被3和5整除的数,组成一个新的列表# newlist = [i for i in range(1,10... 阅读原文
2021-04-08 14:51:03 阅读(1882) 评论(0)
摘要:
csv文件
读取csv文件read_csv(file_path or buf,usecols,encoding):file_path:文件路径,usecols:指定读取的列名,encoding:编码
data = pd.read_csv('d:/test_data/food_rank.csv',encod... 阅读原文
2021-04-07 22:27:07 阅读(2893) 评论(0)