摘要: 1.任务目标: 爬取新浪新闻AFCCL的文章:文章标题、时间、来源、内容、评论数等信息。 2.目标网页: http://sports.sina.com.cn/z/AFCCL/ 3.网页分析 4.源代码: #!/usr/bin/env/python # coding:utf-8 import... 阅读原文
2017-09-03 15:45:05 阅读(818) 评论(0)
摘要: 1 while True: 2 for i in["/","-","\\","|"]: 3 print "%s\r" %i,   阅读原文
2017-09-03 13:54:01 阅读(836) 评论(0)
摘要: 一、socketserver模块   之前的例子中的C/S架构只能实现同一时刻只有一台客户端可以和服务端进行数据交互,我们可以通过socketserver模块实现并发。   基于tcp的套接字,关键就是两个循环,一个链接循环,一个通信循环。socketserver模块分为两大类,server类解决链接问题,reque... 阅读原文
2017-09-03 12:37:06 阅读(851) 评论(0)
摘要: python的文件操纵方法: file.readline()    读取下一行文件,返回含有内容的字符串 file.readlines() 读取整个文件,返回一个字符串列表 file.read()  读取整个文件,返回一个字符串 f = open("filename","mode")  打开一个文件,mode 有:"... 阅读原文
2017-09-03 07:12:02 阅读(795) 评论(0)
摘要: 要自己写一个存储系统,可以依照以下步骤: 1.写一个继承自django.core.files.storage.Storage的子类。 from django.core.files.storage import Storage class MyStorage(Storage): ... 2.Django必... 阅读原文
2017-09-03 06:00:04 阅读(809) 评论(0)
摘要: 进程:qq要以一个整体的形式暴露给操作系统管理,里面包含对各种资源的调用,内存的对各种资源管理的集合,就可称之为进程。 线程:是操作系统最小的调度单位,是一串指令的集合。 进程:要操作CPU,必须要先创建一个线程,进程不能单独执行,进程执行是调动线程,至少要有一个线程; 进程是资源的集合,线程是最小的单位,所有速度没... 阅读原文
2017-09-02 23:22:01 阅读(792) 评论(0)
摘要: 在Django模板中可能会出现访问多个URL指向同一函数,为减少代码可以利用正则表达式实现 url(r'^remove_userinfo(?P<nid>\d+)/',views.removeuserinfo,name='reinfo'), (?P<nid>\d+)表示此部分的名称为nid,... 阅读原文
2017-09-02 22:28:01 阅读(797) 评论(0)
摘要: 字符串内置方法的使用 设置字符串:st=‘hello kitty’ 1、统计元素个数 Print(st.count(‘l’))          #结果为2 2、首字母大写 Print(st.capitalize())            #结果为Hello kitty 3、居中 Print(st.center(2... 阅读原文
2017-09-02 22:15:01 阅读(724) 评论(0)
摘要: 我的第一篇博客,哈哈哈,记录一下我的Python进阶之路! 今天写了一个简单的爬虫。 使用python的requests 和BeautifulSoup模块,Python 2.7.12可在命令行中直接使用pip进行模块安装。爬虫的核心是利用BeautifulSoup的select语句获取需要的信息。 pip insta... 阅读原文
2017-09-02 19:55:03 阅读(851) 评论(0)
摘要:       承接上文,发现在使用Python C/C++ API扩展Python模块时,总要在各种各样的地方考虑到引用计数问题,稍不留神可能会导致扩展的模块存在内存泄漏。引用计数问题是C语言扩展Python模块最头疼的地方,需要由程序员对使用的每个C API都要充分了解,甚至要熟悉源码才能精确掌握什么时候引用计数加一... 阅读原文
2017-09-02 18:08:01 阅读(811) 评论(0)