设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1552|回复: 0

Python数据分析学习路径图

[复制链接]

168

主题

398

金钱

605

积分

初级用户

发表于 2016-6-29 17:02:36 | 显示全部楼层 |阅读模式
来源:http://www.gooseeker.com/doc/article-268-1.html


由于Python拥有非常丰富的库,使其在数据分析领域也有广泛的应用。由于Python本身有十分广泛的应用,本期Python数据分析路线图主要从数据分析从业人员的角度讲述Python数据分析路线图。整个路线图计划分成16周,120天左右。主要学习内容包括四大部分:

1)Python工作环境及基础语法知识了解(包括正则表达式相关知识学习);
2)数据采集相关知识(python爬虫相关知识);
3)数据分析学习;
4)数据可视化学习。



Python工作环境及基础语法知识了解

      对于Python基础语法学习部分,学习周期大概为4周,需要的相关资源在网络上都能找到免费的资源,而且质量都不错。相关中文资源如下:

1.python工作集成环境包


2.python数据分析相关库(Pandas/Numpy/Scipy/Matplotlib)


      如果安装了上面集成工作包,则下面的包不需要重新安装了。关于包的安装方法在学习资源图书中都有介绍,通常安装库采用pip方法,也可以用pip list查询系统安装了哪些库。

3.学习资源
  • 图书:
1)Python基础教程(第2版)
2)深入浅出Head First python(中文版)

  • 在线教程:
1)廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/ ... 9df42a6d3a2e542c000
2)正则式学习:http://wiki.jikexueyuan.com/proj ... 6c7f8cf8ac272215946

  • 视频教程:
1)慕课网python入门:http://www.imooc.com/learn/177
2)慕课网python进阶:http://www.imooc.com/learn/317
3)正则式学习视频:http://www.imooc.com/learn/550

数据采集学习


      对于数据采集部分的学习主要是通过python爬虫的学习了解基本的外部数据采集情况,当然也可以借助别人写好的规则库直接完成某些数据的采集。这部分内容的学习周期大概也为四周,需要的相关资源在网络上都能找到免费的资源,而且质量都不错。相关中文资源如下:
  • GooSeeker的开源Python即时网络爬虫:
1.开源Python爬虫的技术资料:http://www.gooseeker.com/doc/thread-1824-1-1.html

2.开源Python爬虫的讨论社区:http://www.gooseeker.com/doc/forum-59-1.html
  • 爬虫学习在线教程:
1.Python爬虫入门一之综述:http://cuiqingcai.com/927.html
2.Python爬虫入门二之爬虫基础了解:http://cuiqingcai.com/942.html
3.Python爬虫入门三之Urllib库的基本使用:http://cuiqingcai.com/947.html
4.Python爬虫入门四之Urllib库的高级用法:http://cuiqingcai.com/954.html
5.Python爬虫入门五之URLError异常处理:http://cuiqingcai.com/961.html
6.Python爬虫入门六之Cookie的使用:http://cuiqingcai.com/968.html
7.Python爬虫入门七之正则表达式:http://cuiqingcai.com/977.html
8.Python爬虫实战一之爬取糗事百科段子:http://cuiqingcai.com/990.html
9.Python爬虫实战二之爬取百度贴吧帖子:http://cuiqingcai.com/993.html
10.Python爬虫实战三之计算大学本学期绩点:http://cuiqingcai.com/997.html
11.Python爬虫实战四之抓取淘宝MM照片::http://cuiqingcai.com/1001.html
12.Python爬虫进阶一之爬虫框架Scrapy安装配置:http://cuiqingcai.com/912.html
  • 视频教程:
Python简单爬虫开发:http://www.imooc.com/learn/563


数据分析



      Python数据分析的学习主要是对相关库的使用,比如数据整理需要用到numpy和pandas库,数据描述与分析分析则主要用到pandas库,从某种程度上讲,利用python进行数据分析的学习过程就是对库的学习过程。由于有了前面2部分内容的学习基础,本部分内容的建议学习练习时间也为4周,相关免费学习资源如下:
  • 图书:
利用python进行数据分析
  • 视频:
用python玩转数据:https://www.coursera.org/learn/hipython


数据可视化


      Python数据可视化学习的过程就是学习matplotlib库的过程,matplotlib库包含有丰富的数据可视化资源,地图、3D等等都有涉及,如果有前面3部分的学习经验的话,这部分内容在4周内也能解决。相关中文学习资源如下:
  • 图书:
Python数据可视化编程实战
  • 在线教程:
1.利用Python绘图和可视化(1):http://www.lovedata.cn/ec/Python/2016/0118/7732.html
2.利用Python绘图和可视化(2):http://www.lovedata.cn/ec/Python/2016/0118/7733.html

      至此,Python数据分析相关学习内容介绍完了,上面介绍的多种资源,每个阶段只需选择其中的一种进行深入即可,更多更深的内容则需要自己去实践摸索。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表