分类
摘要:
第一次爬取的网站就是豆瓣电影 Top 250,网址是:https://movie.douban.com/top250?start=0&filter=
分析网址'?'符号后的参数,第一个参数'start=0',这个代表页数,‘=0’时代表第一页,‘=25’代表第二页。。。以此类推
一、分析网页:
网页图片
... 阅读原文
2017-12-21 07:44:03 阅读(788) 评论(0)
摘要:
在前面的一篇博文中关于计算房价中我们也大致提到了标准化的概念,也就是比如对于影响房价的参数中有面积和户型,面积的取值范围可以很广,它可以从0-500平米,而户型一般也就1-5。
标准化就是要把这两种参数的取值范围处于一个相对接近的地位,这样在进行梯度下降的计算中能够比较稳定地朝下落方向走,而不至于某个参数一调整步子迈... 阅读原文
2017-12-20 22:47:04 阅读(804) 评论(0)
摘要:
命名规范:总体原则,新编代码必须按下面命名风格进行,现有库的编码尽量保持风格。1 尽量单独使用小写字母‘l’,大写字母‘O’等容易混淆的字母。2 模块命名尽量短小,使用全部小写的方式,可以使用下划线。3 包命名尽量短小,使用全部小写的方式,不可以使用下划线。4 类的命名使用CapWords的方式,模块内部使用的类采用... 阅读原文
2017-12-20 22:26:02 阅读(766) 评论(0)
摘要:
2017.12.20 Python 文件I/O 1.open参数及Character作用
open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)
========= =========... 阅读原文
2017-12-20 20:43:01 阅读(775) 评论(0)
摘要:
module定义
对于可复用的函数集,可以对其进行分组,整合到一个或者若干个.py文件中,而在python中,一个.py文件就叫做一个模块。变量,函数。
module注意点
为了避免命名冲突,python中引入目录组织的方式,这里称之为包(package)
每个包下都会有一个__init__.py文件,这个文件... 阅读原文
2017-12-20 19:20:01 阅读(800) 评论(0)
摘要:
h1 { background-color: #C0C0C0 }
python 介绍
一、简介
Python(英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/),是一种广泛使用的高级编程语言,属于通用型编程语言,由Guido van Rossum 创造,第一版发布于 1991 年。作为一种解释型语言,P... 阅读原文
2017-12-20 18:32:02 阅读(757) 评论(0)
摘要:
1.为什么学习Python
入门简单
就业方便
前景无限
2. Python安装
1.Linux系统自带Python
centos7自带Python2.7
centos6.5自带Python2.6直接输入Python就可以进入Python界面
2. Windows系统安装
官方链接:https://www.... 阅读原文
2017-12-20 17:20:03 阅读(799) 评论(0)
摘要:
好几天没写blog了,今天整理整理。写blog一定要坚持下去。
Python解释器
#!/usr/bin/env python
#-*-coding:utf-8-*-
# 无效的内容,只做注释用(单行注释)
""" """ 多行注释(三引号)
例:
"""
1... 阅读原文
2017-12-20 16:42:01 阅读(771) 评论(0)
摘要:
想要爬取动态网页,很莫名的click失效。被这个问题困扰了很久,基本上把网上提到的所有方法试遍了,最终终于有个方法成功了,在这里总结一下。
这是我想要点击的网页,初始时实在0.5km上,它的class属性是‘on’,想要点击到2km
方法一:直接用webdriver的click方法,失效。
browser.f... 阅读原文
2017-12-20 16:16:02 阅读(791) 评论(0)
摘要:
pycharm常用快捷键
1、编辑(Editing)
Ctrl + Space 基本的代码完成(类、方法、属性)Ctrl + Alt + Space 快速导入任意类Ctrl + Shift + Enter 语句完成Ctrl + P 参数信息(在方法中调用参数)Ctrl + Q 快速查看... 阅读原文
2017-12-20 15:45:03 阅读(828) 评论(0)