分类
摘要:
这是一次课程作业,实现有点粗糙。有更好的方案,欢迎交流。
我们需要评估每两个用户之间的相似度,以此来发现社区。现在我们以每对用户的共同关注人数量作为评估标准。
原始数据格式:
关注人_id:粉丝_1_id 粉丝_2_id
希望得到的输出格式是
用户_id:相似的人_1_id 相似的人_2_id
使用... 阅读原文
2019-05-24 14:14:03 阅读(1947) 评论(0)
摘要:
爬虫是什么?
网络就如同蜘蛛网,而数据相当于里面的节点,爬虫如同蜘蛛,通过节点去获取蜘蛛网上的内容,获取想要的数据信息
获取网页数据方式:
1、浏览器访问——下载网页数据
2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地
其中第二种方式就是爬虫的整体流程
首先先了解下关于网页必备... 阅读原文
2019-05-24 12:17:01 阅读(1601) 评论(0)
摘要:
pygame.display.flip()和pygame.display.update()的用法上的区别:
资料一、
资料二、
(资料最后更新时间:2019年1月9日)
阅读原文
2019-05-24 12:12:07 阅读(2139) 评论(0)
摘要:
pandas读取excel的类型是dataFrame,然后提取每一列是一个Series类型
Series类型包括index和values两部分
a = pd.Series({'a':1,'b':5})
a.index
a.values
Index(['a', 'b'], dtype='object')
array([... 阅读原文
2019-05-24 11:55:55 阅读(2195) 评论(0)
摘要:
字符串类型内置方法
按索引取值
切片
长度len
成员用算in\not in
移除空白strip
切分split
循环for
lstrip\rstrip
lower upper
startswith endswith
rsplit
join
replace
isdigit
msg ='Helle John'
pr... 阅读原文
2019-05-24 10:10:01 阅读(1900) 评论(0)
摘要:
题目:给你一根长度为n的绳子,请把绳子剪成m段 (m和n都是整数,n>1并且m>1)每段绳子的长度记为k[0],k[1],…,k[m].请问k[0]k[1]…*k[m]可能的最大乘积是多少?例如,当绳子的长度为8时,我们把它剪成长度分别为2,3,3的三段,此时得到的最大乘积是18.
解题思路:动态规划
#... 阅读原文
2019-05-24 08:52:04 阅读(2111) 评论(0)
摘要:
当列表包含非常多元素时,会占用大量存储空间,而如果仅需访问前面几个元素,则后面绝大多数元素占用的空间都被浪费了 如果列表元素可以按照某种算法推算出来,则可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间 在Python中,这种一边循环一边计算的机制,称为生成器(generator... 阅读原文
2019-05-24 06:57:02 阅读(2158) 评论(0)
摘要:
列表生成式,即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式运用列表生成式,可以快速生成list,可以通过一个list推导出另一个list可通过循环来达到list生成list目的,但列表生成式更加简洁但是,列表容量是有限的,会受到内存限制
使用示例:
... 阅读原文
2019-05-24 06:00:28 阅读(2111) 评论(0)
摘要:
关于力扣刷题注意事项:有些题目要求原数据上修改,就没必要返还任何数值不要怀疑程序为什么给你报错,肯定你逻辑措了
一.只涉及到(字符串,数组,矩阵的算法)
力扣题目汇总(机器人返回原点,按奇偶排序,数字的补数)
力扣题目汇总(重复N次元素,反转字符串,斐波那契数)
力扣题目汇总(反转字符串中的单词,EXCEL表列序号,... 阅读原文
2019-05-24 00:30:01 阅读(2139) 评论(0)
摘要:
#%%
#载入数据 、查看相关信息
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder
print('第一步:加载、查看数据')
file_path = r'D:\trai... 阅读原文
2019-05-24 00:00:05 阅读(2684) 评论(0)