分类
摘要:
#!/usr/bin/env python
# -*- coding:utf-8 -*-
# __author__ = "blzhu"
"""
python study
Date:2017
"""
import pymysql
# import MySQLdb #python2中的产物
try:
# 获取... 阅读原文
2017-06-20 08:15:02 阅读(805) 评论(0)
摘要:
抓取四川大学公共管理学院官网(http://ggglxy.scu.edu.cn)所有的新闻咨询.
实验流程
1.确定抓取目标.2.制定抓取规则.3.'编写/调试'抓取规则.4.获得抓取数据
1.确定抓取目标
我们这次需要抓取的目标为四川大学公共管理学院的所有新闻资讯.于是我们需要知道公管学院官网的布局结构.
微信截... 阅读原文
2017-06-20 06:32:12 阅读(854) 评论(0)
摘要:
[TOC]
如何构建一个系统,用于从非结构化的文本中提取结构化的信息和数据?哪些方法使用这类行为?哪些语料库适合这项工作?是否可以训练和评估模型?
信息提取,特别是结构化信息提取,可以类比数据库的记录。对应的关系绑定了对应的数据信息。针对自然语言这类非结构化的数据,为了获取对应关系,应该搜索实体对应的特殊关系,并... 阅读原文
2017-06-20 06:00:03 阅读(987) 评论(0)
摘要:
socket套接字:为了使2个不同应用程序进行通信。
两种套接字类型:基于文件的和基于网络的
1.基于文件(AF_LOCAL或AF_UNIX):代表Unix
2.面向网络(AF_INET):代表因特网
面向连接的套接字(SOCK_STREAM):TCP
面向无连接的套接字(SOCK_DGRAM):UDP
Python... 阅读原文
2017-06-19 22:41:03 阅读(827) 评论(0)
摘要:
我们可以用一段代码来实现我们需要的功能,但是当我们需要重复使用这段代码时,复制粘贴并不是一个酷的方法,我们可以用到函数来实现这一需求
一、函数定义
函数是逻辑结构化和过程化的一种编程方法,通过一个函数名封装好一串用来完成某一特定功能的代码
函数的定义:
def 函数名(参数1,参数2....):
''注释''... 阅读原文
2017-06-19 20:46:03 阅读(841) 评论(0)
摘要:
高级FTP服务器1. 用户加密认证2. 多用户同时登陆3. 每个用户有自己的家目录且只能访问自己的家目录4. 对用户进行磁盘配额、不同用户配额可不同5. 用户可以登陆server后,可切换目录6. 查看当前目录下文件7. 上传下载文件,保证文件一致性8. 传输过程中现实进度条9.支持断点续传10.用户操作日志服务端 ... 阅读原文
2017-06-19 17:55:04 阅读(902) 评论(0)
摘要:
README:
1. 员工信息表程序,实现增删改查操作:
1).可进行模糊查询,语法至少支持下面3种: select name,age from staff_table where age > 22 select * from staff_table where dept = "IT" ... 阅读原文
2017-06-19 16:30:03 阅读(804) 评论(0)
摘要:
求网友给链接我来抓
抓取验证码的链接
json数据的链接
js生成的链接
以及一些典型的难抓的网页链接都可以给我,我都可以抓取到,
想写些博客,来记录下
阅读原文
2017-06-19 13:18:03 阅读(950) 评论(0)
摘要:
本节内容
Python介绍
安装
Hello World程序
变量
用户输入
模块初识
数据类型初识
数据运算
表达式if ...else语句
表达式for 循环
break and continue
表达式while 循环
一、 Python介绍
目前Python主要应用领域:
云计算: 云计算最火的语言... 阅读原文
2017-06-19 12:50:07 阅读(888) 评论(0)
摘要:
一:前言
本次爬取的是喜马拉雅的热门栏目下全部电台的每个频道的信息和频道中的每个音频数据的各种信息,然后把爬取的数据保存到mongodb以备后续使用。这次数据量在70万左右。音频数据包括音频下载地址,频道信息,简介等等,非常多。昨天进行了人生中第一次面试,对方是一家人工智能大数据公司,我准备在这大二的暑假去实习,他们... 阅读原文
2017-06-18 23:44:13 阅读(918) 评论(0)