Python数据可视化分析系列教程
前言
因为内部学习的需要,前几天花了些时间重新学习了数据可视化及其Python实现的相关内容,自己也梳理了一下Python数据可视化的知识脉络。基于Jupyter Lab和Reveal.js 做了几个幻灯片,与大家一起分享。
内容介绍
整个系列可以叫作“Python数据可视化入门”,都是些入门的东西比较基础,希望能起到抛砖引玉的作用。一共包含五个幻灯片分别是:
之所以如此组织,也是希望能够首先了解数据可视化的一般概念,在此基础上再去学习具体各种库的用法,最后又回到可视化的实践上来,形成一个相对完整的闭环。
需要说明的是,之所以选择matplotlib、plotnine和Plotly三个包来介绍主要出于一下考虑:
- matplotlib是Python中最基础、最流行、最重要的可视化包;
- plotnine基于图形语法(与R ggplot2类似),很有特色和学习价值;
- plotly不同于前两者是交互式可视化包,功能十分强大,且具有较为完整的生态;
- 三个包各有千秋,具有比较广泛的代表性,可以在此基础上继续延伸学习。
感兴趣的话,不妨花些时间去看看具体的内容。其中难免有疏漏错误之处,欢迎批评指正,也希望能一起交流进步。
内容来源
我在准备幻灯片的过程中,越发认识到数据可视化是一门巨大的学问,所以也不断地去学习相关资料。有关数据可视化、Python可视化的资料在互联网上俯拾皆是,给了我很大的帮助。而我也将其中较为契合或者优质的内容摘录到幻灯片中。
对于这些引用的材料,我本应该一一注明出处和来源,并根据原作者的许可情况加以使用。囿于时间精力所限,只整理了一小部分,未来如果有发现违背使用规范的,希望能随时与我联系。
以下为部分参考资料,感谢原作者的付出!
- http://pythonplot.com/
- https://www.kaggle.com/residentmario/grammar-of-graphics-with-plotnine-optional/
- https://www.coursera.org/learn/datavisualization
- https://www.coursera.org/specializations/data-science-python
- https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/
- https://www.slideshare.net/ssuser5e7722/matplotlib-basic-v01?qid=f8d08631-6a3f-453c-9d4a-a6a1fe44435d&v=&b=&from_search=12
- https://www.slideshare.net/coolzzzx/python-introduction-and-data-visualization-publish?qid=f8d08631-6a3f-453c-9d4a-a6a1fe44435d&v=&b=&from_search=1
- https://madlogos.github.io/R_Tutorial/A03 Visualization/A03_02_visualDesign.html
- https://www.ershicimi.com/p/1cb765baa949f78016d5b1af9b27ceda
- https://datacarpentry.org/python-ecology-lesson/07-visualization-ggplot-python/index.html
- https://www.experfy.com/blog/what-are-the-ingredients-of-a-terrible-data-story/
- https://cfss.uchicago.edu/slides/visualizations-and-the-grammar-of-graphics/#10
- https://www.slideshare.net/kesarifms/grammar-of-graphics-the-secret-sauce-of-powerful-data-stories
- https://www.slideshare.net/hadley/grammar-of-graphics-past-present-future
- http://liyangbit.com/pythonvisualization/Plotly-Express-introduction-cn/
- https://cloud.tencent.com/developer/article/1439757
- https://zhuanlan.zhihu.com/p/111099751
- https://kyso.io/KyleOS/cufflinks-intro?utm_campaign=News&utm_medium=Community&utm_source=DataCamp.com
- http://www.voycn.com/article/pythondongtaikeshihuacufflinks
- https://www.williamrchase.com/slides/ggplot_intro.html#1
- https://mschermann.github.io/data_viz_reader/patterns.html#choosing-the-right-baseline-in-data-visualization
- https://coolinfographics.com/dataviz-guides
- https://blog.hubspot.com/marketing/types-of-graphs-for-data-visualization
- https://infogram.com/page/choose-the-right-chart-data-visualization
- https://zhuanlan.zhihu.com/p/82236659
- http://www.sthda.com/english/articles/32-r-graphics-essentials/129-visualizing-multivariate-categorical-data/
- https://www.toptal.com/designers/data-visualization/data-visualization-best-practices
- https://www.webdatarocks.com/blog/power-of-data-visualization-and-charts/
- http://jcsites.juniata.edu/faculty/rhodes/ida/graphicalIntRedes.html
- https://antv-2018.alipay.com/zh-cn/vis/chart/index.html
- http://tuzhidian.com/?common=LineLike
- https://help.tableau.com/current/pro/desktop/zh-cn/what_chart_example.htm#分布
- 数据可视化,陈为、沈则潜,电子工业出版社,2013
- 数据之美,邱南森(Nathan Yau),中国人民大学出版社,2014