You are on page 1of 4

北京博宏科睿教育科技有限公司 博宏科睿 [2018]第(06)号

关于举办“Python 爬虫与文本实例技术与应用”培训班通知

各科研院所单位:
随着互联网的发展,网络信息呈现指数式增长,要在短时间内获取大量信息,网络爬虫无疑是一
种最适合的方法。通过爬虫获取的海量信息,我们可以对其进行进一步的分析:市场预测、文本分
析、机器学习方法等。
Python 作为一门脚本语言,它灵活、易用、易学、适用场景多,实现程序快捷便利,早已经成为
程序员们的一门编程利器。Python 这门编程语言包罗万象,可以说掌握了 python,除了一些特殊环
境和高度的性能要求,你可以用它做任何事。为提升相关科技工作者的技术水平,北京博宏科睿教
育科技有限公司特举办 2018 年第二期“Python 爬虫与文本挖掘实例技术与应用”培训班,本次培训
从爬虫的基本知识入手,使用 Python 作为实现工具,一步步讲述网络爬虫的实现,具体内容如下:
【培训目标】
1.让学员尽快掌握 python 语言的基本结构与语法与数据类型,模块、基本用法,熟悉函数,类设
计,包的使用及基本的编程方法;
2.理解 python 数据挖掘与分析技术在当代各种大数据相关产品中的应用,并掌握该领域最关键技
术的原理以及技术应用过程;
3. 能开发出一些实际的应用项目并初步胜任 Python 的数据挖掘和机器学习工作;
4. 通过紧密结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,进而有效提升学
员解决科研及教学中实际问题的能力同时提升其从数据角度去思考的能力。
【培训费用】
RMB:3900 元/人(含报名费、培训费、教材资料费、场地费、午餐费、证书办理费等)培训期间可统
一协助安排食宿,费用自理。
颁发证书:参加相关培训学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据挖掘应用工程师》职业水平证书。

请学员自备一寸照片一张(背后标注姓名及身份证号)办理证书需要,报到当天交由会务组人员。

【时间地点】
2018 年 6 月 21 日----6 月 24 日 北 京*东城区北三环东路
(时间安排:第一天报到、授课三天)

北京博宏科睿教育科技有限公司
二零一八年五月二十六日
附件一:

“Python 爬虫与文本挖掘实例技术与应用”培训班事宜
【邀请老师】
刘老师:对外经济贸易大学大数据系副教授,海归计算机专业博士,讲授计算机应用基础、数
据结构、计算机网络、智能计算、Python 与大数据分析等课程。其研究内容涉及:科技金融(基于机
器学习的选股策略研究,信用逾期预测)图像分析理解,文本分析,智能硬件,数据挖掘、机器学
习、手写识别等内容。曾获得过 ImageCLEF2012 Photo annotation task 国际图像分类竞赛中获得第
一名,ImageCLEF2015 Scalable Concept Image Annotation Task(text-base) 第四名。
【培训对象】
从事金融、医疗、保险、生态、卫生、计量、统计、银行、通信、环境、基金等与数据分析统计
相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕
士、博士等相关人员,以及广大 Python 爱好者。
【培训方式】

(一) 课程讲座;
(二)专题小组研讨与案例讲解分析结合;
(三)欢迎学员带着在工作中遇到的实际问题与老师一起探讨;
(四)培训教室提供操作电脑,无需自带笔记本。

【报名方式】
报名表请传真或电子邮件至会务处。传真:010-51702355 或邮件:edu@bohongkerui.com 报名
成功后会务组将以电话或电子邮件方式通知您,并提前一周发 报到通知(详细会议地点及乘车路线),
具体安排见第二轮通知,名额有限,报名从速。
注:学员于报到当天领取发票和纸质邀请函及上课教材。
【课程主题】
(1)、Python 入门基础; (2)、正则表达式简介;
(3)、Python 爬虫技术入门; (4)、Python 爬虫核心技术;
(5)、Python 爬虫技术进阶; (6)、文本挖掘入门;
(7)、深度学习入门; (8)、基于 LSTM 的文本情感分析;
(9)、疑难问题与答疑 (具体研讨内容见附件 2)

【联系方式】

联系人: 杨 博 手 机:173-4654-1086 157-2664-3071


电话/传真:010-51702355 E-mail: edu@bohongkerui.com
附件二:

课程安排 课程主题 课程内容


1.初识 Python:开发环境安装与使用
2.基本概念
3.基本数据结构(元组、列表、字符串、字典)
第一章
4.Python 基本语法:(条件、循环、函数、类、模块)
Python 基础
5.类介绍
6.Python 文件操作实战
7.Python 异常处理实战
1.正则表达式简介
2.正则表达式应用(re 模块,re.compile,re.find,re.search)
第一天 第二章
3.正则表达式匹配过程
Python 基础与 正则表达式简介
4.利用 API 进行数据采集
爬虫入门
5.正则表达式解释 HTML
1.什么是爬虫
2.爬虫的分类和使用范围
第三章
3.爬虫基本框架
Python 爬虫技术入门
4.urllib,urllib2 模块(urllib2.urlopen,urllib2.Request)
5.手动编写简单爬虫
案例一:爬取葡萄酒品质分析数据,然后对数据进行整理汇总,可视化展示.
案例二:抓取分析手机号码.
案例三:手动编写简单爬虫并实战.
1.抓取策略和 ULR 去重 2.数据存储
第四章
3.数据解释和提取 4.模拟登陆及验证码识别
Python 爬虫技术
5.爬虫的攻防之道与可视化爬虫
1.著名爬虫框架介绍
第二天 (portia,Pyspider,Newspaper,Python-goose)
第五章
Python 爬虫技 2.Scrapy 爬虫框架
Python 爬虫技术进阶
术进阶 (spider,engine,scheduler,downloader,item pipeline)
3. Scrapy 开发流程
4. Scrapy 与 Urllib 的整合使用
案例一:提取当当书目信息,然后对数据进行整理汇总,可视化展示.
案例二:应用 Scrapy 爬取名人名言
1.介绍文本分词的方法
第六章
2. 按词性提取关键词
文本挖掘入门
Jieba 模块,nltk 模块(jieba.cut,jieba.cut_for_search())
第七章 1.深度学习的前世今生
第三天 深度学习入门 2.人工神经网络 ANN TensorFlow 模块,keras 模块
文本分析基础
1.什么是 LSTM 2.文本的情感分析
和进阶 第八章
3.从用户评价中提取用户对事物的评价
基于 LSTM 的文本情感分析
4.分析用户对产品的态度和情感
案例一:手写数字图像识别
案例二:提取用户对事物的评价和对产品的态度和情感
疑难解答 学员可结合自身感兴趣需要解决的疑难问题,可带着相关问题咨询授课老师。
附件三:
“Python 爬虫与文本挖掘实例技术与应用”培训班回执表
(传真电话:010—51702355)(多人报名此表可复制填写)

单 位 信 息
开票抬头 所属行业

纳税人识别号

开票项目 □会议费 □培训费 □资料费 □会务费 选 择 √

单位地址 邮 编

联 系 人 部 门 职 务

办公电话 手 机 邮 箱


需求反馈

人 员 信 息
姓名 性别 部门 职务/职称 手机 邮箱 传真

□是 □否
()单间()标间
会议费用: 房 间 预 订 √
万 仟 佰 拾 元 入住时间( )
入住天数( )
咨询顾问: 杨 博 手 机: 173-4654-1086 157-2664-3071

咨询热线: 010-51702355 邮 箱: edu@bohongkerui.com

缴费方式:√ □ 银行转账 □ 缴纳现金 □ 现场刷卡

户 名: 北京博宏科睿教育科技有限公司

帐 号: 1100 1094 1000 5300 8453

开 户 行:中国建设银行北京古城支行

You might also like