摘要: 这是一次课程作业,实现有点粗糙。有更好的方案,欢迎交流。 我们需要评估每两个用户之间的相似度,以此来发现社区。现在我们以每对用户的共同关注人数量作为评估标准。 原始数据格式: 关注人_id:粉丝_1_id 粉丝_2_id 希望得到的输出格式是 用户_id:相似的人_1_id 相似的人_2_id   使用... 阅读原文
2019-05-24 14:14:03 阅读(1947) 评论(0)
摘要: 爬虫是什么? 网络就如同蜘蛛网,而数据相当于里面的节点,爬虫如同蜘蛛,通过节点去获取蜘蛛网上的内容,获取想要的数据信息 获取网页数据方式: 1、浏览器访问——下载网页数据 2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地 其中第二种方式就是爬虫的整体流程   首先先了解下关于网页必备... 阅读原文
2019-05-24 12:17:01 阅读(1601) 评论(0)
摘要: pygame.display.flip()和pygame.display.update()的用法上的区别: 资料一、     资料二、 (资料最后更新时间:2019年1月9日) 阅读原文
2019-05-24 12:12:07 阅读(2139) 评论(0)
摘要: pandas读取excel的类型是dataFrame,然后提取每一列是一个Series类型 Series类型包括index和values两部分 a = pd.Series({'a':1,'b':5}) a.index a.values Index(['a', 'b'], dtype='object') array([... 阅读原文
2019-05-24 11:55:55 阅读(2195) 评论(0)
摘要: 字符串类型内置方法 按索引取值 切片 长度len 成员用算in\not in 移除空白strip 切分split 循环for lstrip\rstrip lower upper startswith endswith rsplit join replace isdigit msg ='Helle John' pr... 阅读原文
2019-05-24 10:10:01 阅读(1900) 评论(0)
摘要: 题目:给你一根长度为n的绳子,请把绳子剪成m段 (m和n都是整数,n>1并且m>1)每段绳子的长度记为k[0],k[1],…,k[m].请问k[0]k[1]…*k[m]可能的最大乘积是多少?例如,当绳子的长度为8时,我们把它剪成长度分别为2,3,3的三段,此时得到的最大乘积是18. 解题思路:动态规划 #... 阅读原文
2019-05-24 08:52:04 阅读(2111) 评论(0)
摘要: 当列表包含非常多元素时,会占用大量存储空间,而如果仅需访问前面几个元素,则后面绝大多数元素占用的空间都被浪费了 如果列表元素可以按照某种算法推算出来,则可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间 在Python中,这种一边循环一边计算的机制,称为生成器(generator... 阅读原文
2019-05-24 06:57:02 阅读(2158) 评论(0)
摘要: 列表生成式,即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式运用列表生成式,可以快速生成list,可以通过一个list推导出另一个list可通过循环来达到list生成list目的,但列表生成式更加简洁但是,列表容量是有限的,会受到内存限制   使用示例: ... 阅读原文
2019-05-24 06:00:28 阅读(2111) 评论(0)
摘要: 关于力扣刷题注意事项:有些题目要求原数据上修改,就没必要返还任何数值不要怀疑程序为什么给你报错,肯定你逻辑措了 一.只涉及到(字符串,数组,矩阵的算法) 力扣题目汇总(机器人返回原点,按奇偶排序,数字的补数) 力扣题目汇总(重复N次元素,反转字符串,斐波那契数) 力扣题目汇总(反转字符串中的单词,EXCEL表列序号,... 阅读原文
2019-05-24 00:30:01 阅读(2139) 评论(0)
摘要: #%% #载入数据 、查看相关信息 import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder print('第一步:加载、查看数据') file_path = r'D:\trai... 阅读原文
2019-05-24 00:00:05 阅读(2684) 评论(0)