摘要: 目录 1 重复值判断和查看 2 重复值删除 3 异常值初步查看代码 数据源: df= pd.DataFrame({'k1': [ 's1']* 3 + ['s2']* 5,'k2' : [1, 1, 2, 3, 3, 4, 4,4]}) df 1 重复值判断和查看 df.duplicated(subse... 阅读原文
2021-06-15 18:18:02 阅读(43) 评论(0)
摘要: 一、案例场景 字段login_place,一共267725行记录,随机15条记录如下:   后续数据分析工作需要用到地理维度进行分析,所以需要把login_place字段进行拆分成:国家、省份、地区。 二、初步方案   第三方中文分词库:jieba,可以对文本进行拆分。使用参考资料:jieba库的使用。初步方案: ... 阅读原文
2021-06-15 14:02:07 阅读(49) 评论(0)
摘要: 产生需求的原因: 最近都在使用python做一些小demo,尤其是经常会用python做一些关于数据处理的操作,于是就产生问题:怎么才能让处理数据时有更好的且直接能上手的案例呢?换言之就是python有什么“奇淫技巧”可以帮助我快速处理数据呢?于是搜集一些案例,结合自己实际工作需要,将这些案例做成连续更新篇,今天来讲... 阅读原文
2021-06-15 13:40:01 阅读(41) 评论(0)
摘要: 目录 一.Pycharm 设置字体大小/风格 二.Pycharm 设置背景颜色 三.Pycharm 设置开发模板 四.猜你喜欢 零基础 Python 学习路线推荐 : Python 学习目录 >> Python 基础入门 一.Pycharm 设置字体大小/风格 选择 File –> sett... 阅读原文
2021-06-15 11:29:10 阅读(52) 评论(0)
摘要: 目录 1.报错介绍 2.关键报错信息 3.报错分析 4.解决方案1 5.解决方案2 1.报错介绍 博主今日在使用pycharm虚拟环境创建Django工程时,使用下图方式创建Django工程时, 出现的错误如下所示: 2.关键报错信息 其中关键的报错大概如下所示: WARNING: pip i... 阅读原文
2021-06-14 17:45:18 阅读(58) 评论(0)
摘要: 目录 一、time模块常用方法 二、datetime模块 1 date类:datetime.date(year, month, day) 2 time类 3 datetime类 4 timedelta类 5 tzinfo类 一、time模块   time模块功能接近于操作系统层面。有些函数是平台... 阅读原文
2021-06-13 20:54:05 阅读(55) 评论(0)
摘要: 网站截图:        源代码: 1 import re 2 import requests 3 import pymysql 4 from bs4 import BeautifulSoup 5 import lxml 6 import traceback 7 import time... 阅读原文
2021-06-13 19:54:03 阅读(42) 评论(0)
摘要: 记录在我使用python过程中用到的文件操作,我使用python主要是用来解决自动化的问题,不仅仅是工作上的问题也有解决我自己自动化的工具,python是可以跨平台的而bat脚本只能在windows上跑 路径转义符 对于路径中含有转义字符,在路径字符串前加 r,比如 filepath = r'E:\Code\test... 阅读原文
2021-06-13 14:26:02 阅读(50) 评论(0)
摘要: 选址问题是要选择设施位置使目标达到最优,是数模竞赛中的常见题型。 小白不一定要掌握所有的选址问题,但要能判断是哪一类问题,用哪个模型。 进一步学习 PuLP工具包中处理复杂问题的字典格式快捷建模方法。 欢迎关注『Python小白的数学建模课 @ Youcans』系列,每周持续更新 1. 选址问题 选址问题是指在某个... 阅读原文
2021-06-13 13:47:02 阅读(56) 评论(0)
摘要: 前言 这两年,新冠肺炎肆虐而来,随着确诊人数的不断上升,全世界的人都陷入了恐慌中。我们经常能在手机、电视上看到各个地区疫情的情况,但那些数据大多数都是零碎的,我们不可能去记住每个数据,但我们可以用爬虫爬取各个地区发出的新闻数据,再将这些数据进行整理分析。所以我们在疫情期间可以通过访问一个网站,就能知道各个地区的疫情情... 阅读原文
2021-06-13 12:48:25 阅读(58) 评论(0)