摘要: 1 背景 在这一系列开始前我们就说过,简单的爬虫很容易,但是要完成一个高效健壮的爬虫不是一个简单的事情,这一系列我们已经明白了爬虫相关的如下核心知识点。 基于上面这几篇其实我们把爬虫当作自己便利的开发工具来使用基本上是够了(譬如老板让你定期留意观察自己做的应用功能上线后的用户行为数据,方便开发把握功能潜在风险,这个... 阅读原文
2018-05-22 12:52:03 阅读(777) 评论(0)
摘要:   基于密度的聚类算法是数据挖掘技术中被广泛使用的一类方法,其核心思想是用密度邻域和核心点阈值来计算书记空间中的数据点分布情况。该算法可以找出形状不规则(oddly-shaped)的cluser,且聚类时不需事先知道cluser的个数。   DBSCAN,即Density-Dased Spatial Cluster... 阅读原文
2018-05-22 12:12:04 阅读(712) 评论(0)
摘要: 加载C库更简单的方法是使用如下几个预先创建的类实例。 ctypes.cdllctypes.oledllctypes.windllctypes.pydllctypes.pythonapi 上面的代码输出“Message is Hello World”。另外,ctypes还允许在Python中定义结构和联合等其... 阅读原文
2018-05-22 10:29:03 阅读(774) 评论(0)
摘要: 1 import redis 2 3 #连接 4 r=redis.StrictRedis(host="localhost",port=6379,password="sunck") 5 6 #方法1:根据数据类型得不同,调用响应的方法 7 #写 8 r.set("p1","goo... 阅读原文
2018-05-22 09:28:04 阅读(745) 评论(0)
摘要: 人们为什么使用Python? 之所以选择Python的主要因素有以下几个方面: 软件质量:在很大程度上,Python更注重可读性、一致性和软件质量,从而与脚本语言世界中的其他工具区别开发。此外,Python支持软件开发的高级重用机制。例如面向对象程序设计。 提高开发者的效率:相对于C、c++、Java等编译... 阅读原文
2018-05-22 07:46:11 阅读(760) 评论(0)
摘要: 前言 本文的标题是『完整』。所谓『完整』,大意是想表达:提炼出一组最小的经验组合,并且能够快速应用于工程中,能 work,甚至能完美地 work。这篇文章就是想要做到『如何能完美地work』。 初衷 最原始的初衷就是:『现在的,是不完美的,不系统的』。 一是:Python 官方对 logging 这个库的使用,介绍... 阅读原文
2018-05-22 06:05:11 阅读(781) 评论(0)
摘要:   长期枯燥的生活,敲代码的时间三天两头往吸烟室跑,被项目经理抓去训话。  “入门”是学习Python最重要的阶段,虽然这个过程也许会非常缓慢。当你心里有一个目标时,那么你学习起来就不会像别人学习的学习进度一样慢慢学习,你会为了这个目标而奋斗。其实有人说这样的学习方式会导致我们的基础不够扎实,但是说心里话,我特别推... 阅读原文
2018-05-22 06:00:10 阅读(793) 评论(0)
摘要: 是不是很简单?比urllib2和urllib简单直观的多?!那请接着看快速指南吧。 3. 快速指南 3.1 发送请求 发送请求很简单的,首先要导入requests模块: 前两个例子很正常,能正常打开的返回200,不能正常打开的返回404。但第三个就有点奇怪了,那个是百度搜索结果中的302跳转地... 阅读原文
2018-05-22 00:50:05 阅读(802) 评论(0)
摘要: 520这一天,也是网络情人节。就在今天,python聊天机器人竟然对我表白了,并且还自动地和微信里面的所有人和群聊天。一时间,所有人以为我变成了聊天达人。具体什么情况,我们慢慢看看怎么实现的。 运行环境 运行平台:Mac Python版本:Python3.6 IDE:spyder from wxpy impor... 阅读原文
2018-05-21 23:33:05 阅读(779) 评论(0)
摘要: 1 ajax原理 Ajax(Asynchronous JavaScript and XML (异步的JavaScript和XML)),是一种快速创建 动态网页的技术,目的是显示动态局部刷新.通过XMLHttpResponse对象来向服务器发起异步请求,从服务器获取数据. (1) 异步的javascript: ... 阅读原文
2018-05-21 22:11:02 阅读(771) 评论(0)