分类
摘要:
目录
1 重复值判断和查看
2 重复值删除
3 异常值初步查看代码
数据源:
df= pd.DataFrame({'k1': [ 's1']* 3 + ['s2']* 5,'k2' : [1, 1, 2, 3, 3, 4, 4,4]})
df
1 重复值判断和查看
df.duplicated(subse... 阅读原文
2021-06-15 18:18:02 阅读(43) 评论(0)
摘要:
一、案例场景
字段login_place,一共267725行记录,随机15条记录如下:
后续数据分析工作需要用到地理维度进行分析,所以需要把login_place字段进行拆分成:国家、省份、地区。
二、初步方案
第三方中文分词库:jieba,可以对文本进行拆分。使用参考资料:jieba库的使用。初步方案:
... 阅读原文
2021-06-15 14:02:07 阅读(49) 评论(0)
摘要:
产生需求的原因:
最近都在使用python做一些小demo,尤其是经常会用python做一些关于数据处理的操作,于是就产生问题:怎么才能让处理数据时有更好的且直接能上手的案例呢?换言之就是python有什么“奇淫技巧”可以帮助我快速处理数据呢?于是搜集一些案例,结合自己实际工作需要,将这些案例做成连续更新篇,今天来讲... 阅读原文
2021-06-15 13:40:01 阅读(41) 评论(0)
摘要:
目录
一.Pycharm 设置字体大小/风格
二.Pycharm 设置背景颜色
三.Pycharm 设置开发模板
四.猜你喜欢
零基础 Python 学习路线推荐 : Python 学习目录 >> Python 基础入门
一.Pycharm 设置字体大小/风格
选择 File –> sett... 阅读原文
2021-06-15 11:29:10 阅读(52) 评论(0)
摘要:
目录
1.报错介绍
2.关键报错信息
3.报错分析
4.解决方案1
5.解决方案2
1.报错介绍
博主今日在使用pycharm虚拟环境创建Django工程时,使用下图方式创建Django工程时,
出现的错误如下所示:
2.关键报错信息
其中关键的报错大概如下所示:
WARNING: pip i... 阅读原文
2021-06-14 17:45:18 阅读(58) 评论(0)
摘要:
目录
一、time模块常用方法
二、datetime模块
1 date类:datetime.date(year, month, day)
2 time类
3 datetime类
4 timedelta类
5 tzinfo类
一、time模块
time模块功能接近于操作系统层面。有些函数是平台... 阅读原文
2021-06-13 20:54:05 阅读(55) 评论(0)
摘要:
网站截图:
源代码:
1 import re
2 import requests
3 import pymysql
4 from bs4 import BeautifulSoup
5 import lxml
6 import traceback
7 import time... 阅读原文
2021-06-13 19:54:03 阅读(42) 评论(0)
摘要:
记录在我使用python过程中用到的文件操作,我使用python主要是用来解决自动化的问题,不仅仅是工作上的问题也有解决我自己自动化的工具,python是可以跨平台的而bat脚本只能在windows上跑
路径转义符
对于路径中含有转义字符,在路径字符串前加 r,比如 filepath = r'E:\Code\test... 阅读原文
2021-06-13 14:26:02 阅读(50) 评论(0)
摘要:
选址问题是要选择设施位置使目标达到最优,是数模竞赛中的常见题型。
小白不一定要掌握所有的选址问题,但要能判断是哪一类问题,用哪个模型。
进一步学习 PuLP工具包中处理复杂问题的字典格式快捷建模方法。
欢迎关注『Python小白的数学建模课 @ Youcans』系列,每周持续更新
1. 选址问题
选址问题是指在某个... 阅读原文
2021-06-13 13:47:02 阅读(56) 评论(0)
摘要:
前言
这两年,新冠肺炎肆虐而来,随着确诊人数的不断上升,全世界的人都陷入了恐慌中。我们经常能在手机、电视上看到各个地区疫情的情况,但那些数据大多数都是零碎的,我们不可能去记住每个数据,但我们可以用爬虫爬取各个地区发出的新闻数据,再将这些数据进行整理分析。所以我们在疫情期间可以通过访问一个网站,就能知道各个地区的疫情情... 阅读原文
2021-06-13 12:48:25 阅读(58) 评论(0)