分类
摘要:
1.任务目标:
爬取新浪新闻AFCCL的文章:文章标题、时间、来源、内容、评论数等信息。
2.目标网页:
http://sports.sina.com.cn/z/AFCCL/
3.网页分析
4.源代码:
#!/usr/bin/env/python
# coding:utf-8
import... 阅读原文
2017-09-03 15:45:05 阅读(818) 评论(0)
摘要:
1 while True:
2 for i in["/","-","\\","|"]:
3 print "%s\r" %i,
阅读原文
2017-09-03 13:54:01 阅读(836) 评论(0)
摘要:
一、socketserver模块
之前的例子中的C/S架构只能实现同一时刻只有一台客户端可以和服务端进行数据交互,我们可以通过socketserver模块实现并发。
基于tcp的套接字,关键就是两个循环,一个链接循环,一个通信循环。socketserver模块分为两大类,server类解决链接问题,reque... 阅读原文
2017-09-03 12:37:06 阅读(851) 评论(0)
摘要:
python的文件操纵方法:
file.readline() 读取下一行文件,返回含有内容的字符串
file.readlines() 读取整个文件,返回一个字符串列表
file.read() 读取整个文件,返回一个字符串
f = open("filename","mode") 打开一个文件,mode 有:"... 阅读原文
2017-09-03 07:12:02 阅读(795) 评论(0)
摘要:
要自己写一个存储系统,可以依照以下步骤:
1.写一个继承自django.core.files.storage.Storage的子类。
from django.core.files.storage import Storage
class MyStorage(Storage):
...
2.Django必... 阅读原文
2017-09-03 06:00:04 阅读(809) 评论(0)
摘要:
进程:qq要以一个整体的形式暴露给操作系统管理,里面包含对各种资源的调用,内存的对各种资源管理的集合,就可称之为进程。
线程:是操作系统最小的调度单位,是一串指令的集合。
进程:要操作CPU,必须要先创建一个线程,进程不能单独执行,进程执行是调动线程,至少要有一个线程;
进程是资源的集合,线程是最小的单位,所有速度没... 阅读原文
2017-09-02 23:22:01 阅读(792) 评论(0)
摘要:
在Django模板中可能会出现访问多个URL指向同一函数,为减少代码可以利用正则表达式实现
url(r'^remove_userinfo(?P<nid>\d+)/',views.removeuserinfo,name='reinfo'),
(?P<nid>\d+)表示此部分的名称为nid,... 阅读原文
2017-09-02 22:28:01 阅读(797) 评论(0)
摘要:
字符串内置方法的使用
设置字符串:st=‘hello kitty’
1、统计元素个数
Print(st.count(‘l’)) #结果为2
2、首字母大写
Print(st.capitalize()) #结果为Hello kitty
3、居中
Print(st.center(2... 阅读原文
2017-09-02 22:15:01 阅读(724) 评论(0)
摘要:
我的第一篇博客,哈哈哈,记录一下我的Python进阶之路!
今天写了一个简单的爬虫。
使用python的requests 和BeautifulSoup模块,Python 2.7.12可在命令行中直接使用pip进行模块安装。爬虫的核心是利用BeautifulSoup的select语句获取需要的信息。
pip insta... 阅读原文
2017-09-02 19:55:03 阅读(851) 评论(0)
摘要:
承接上文,发现在使用Python C/C++ API扩展Python模块时,总要在各种各样的地方考虑到引用计数问题,稍不留神可能会导致扩展的模块存在内存泄漏。引用计数问题是C语言扩展Python模块最头疼的地方,需要由程序员对使用的每个C API都要充分了解,甚至要熟悉源码才能精确掌握什么时候引用计数加一... 阅读原文
2017-09-02 18:08:01 阅读(811) 评论(0)