分类
摘要:
以前写的太烂了,这次基本把之前的代码全部重构了一遍。github地址是:NetCloud.下面是简单的介绍以及quick start.
NetCloud——一个完善的网易云音乐综合爬虫Python库
目前只需要使用命令pip3 install netcloud 即可以完成模块的安装,支持Windows与Linux... 阅读原文
2019-01-22 08:46:02 阅读(5157) 评论(0)
摘要:
什么是机器学习?
1、监督学习
监督学习定义:用已有的数据集包括输入、输出,进行模型函数的训练;然后把新的输入数据带入模型函数,预测数据输出。
监督学习分类:监督学习分为两类,线性回归和逻辑回归(简称:回归和分类)。函数的输出可以是一个连续的值(称为回归分析);或者是预测一个分类标签(如:判断一个学生是否被录取,... 阅读原文
2019-01-22 07:10:03 阅读(2474) 评论(0)
摘要:
最近看 Redis 的实现原理,其中讲到 Redis 中的有序数据结构是通过跳跃表来进行实现的。第一次听说跳跃表的概念,感到比较新奇,所以查了不少资料。其中,网上有部分文章是按照如下方式描述跳跃表的:
这种描述便于理解,很容易让人理解到跳跃表是建立了类似索引的东西,从而提高效率的。但是,这样描述给人的感觉是,数据有... 阅读原文
2019-01-22 06:56:03 阅读(2991) 评论(0)
摘要:
windows环境下multiprocessing报如下异常信息:
RuntimeError:
An attempt has been made to start a new process before the current process has finished its bootstrappi... 阅读原文
2019-01-22 06:00:05 阅读(3266) 评论(0)
摘要:
数据预处理
如何对数据进行预处理,提高数据质量,是数据分析中重要的问题。
1.数据合并
堆叠合并数据,堆叠就是简单地把两个表拼在一起,也被称为轴向链接,绑定或连接。依照轴的方向,数据堆叠可分为横向堆叠和纵向堆叠。
1.横向堆叠,即将两个表在x轴向拼接在一起。可以使用concat函数完成。
... 阅读原文
2019-01-22 00:06:08 阅读(2810) 评论(0)
摘要:
示例1:
import threadingfrom time import sleepclass forThread(threading.Thread): def __init__(self, event): threading.Thread.__init__(self) sel... 阅读原文
2019-01-21 22:43:04 阅读(5666) 评论(0)
摘要:
最近学完python基础知识,就想着做一个游戏玩玩,于是就在https://www.pygame.org/docs/学着做了个贪吃蛇游戏。
首先要导入模块。
1 import pygame
2 import sys
3 from pygame.locals import *
4 import time
5 impo... 阅读原文
2019-01-21 22:09:40 阅读(3966) 评论(0)
摘要:
def estType():
eventList = [1, 'Tom', {'name': 'Lucy', 'age': 16, 'grade': 98}]
print(type(eventList[0]) is int)
print(type(eventList[1]) is int)
... 阅读原文
2019-01-21 21:06:02 阅读(3415) 评论(0)
摘要:
本人最开始的的环境为:win10 + 32位的python
最近想学习一下爬虫,听说某些库需要64的python才能实现(本人也是小白,只是平时喜欢折腾,这里是听说,暂时没有能力解释),无奈之下只好卸载重装,期间发现大家都说Anaconda这个环境好,于是。。。
这里介绍了很多我安装时遇到的问题,以及怎么解决... 阅读原文
2019-01-21 19:10:42 阅读(3766) 评论(0)
摘要:
本人最开始的的环境为:win10 + 32位的python
最近想学习一下爬虫,听说某些库需要64的python才能实现(本人也是小白,只是平时喜欢折腾,这里是听说,暂时没有能力解释),无奈之下只好卸载重装,期间发现大家都说Anaconda这个环境好,于是。。。
这里介绍了很多我安装时遇到的问题,以及怎么解决... 阅读原文
2019-01-21 19:09:55 阅读(2823) 评论(0)