Python数据可视化分析系列教程

前言

因为内部学习的需要,前几天花了些时间重新学习了数据可视化及其Python实现的相关内容,自己也梳理了一下Python数据可视化的知识脉络。基于Jupyter Lab和Reveal.js 做了几个幻灯片,与大家一起分享。

内容介绍

整个系列可以叫作“Python数据可视化入门”,都是些入门的东西比较基础,希望能起到抛砖引玉的作用。一共包含五个幻灯片分别是:

之所以如此组织,也是希望能够首先了解数据可视化的一般概念,在此基础上再去学习具体各种库的用法,最后又回到可视化的实践上来,形成一个相对完整的闭环。

需要说明的是,之所以选择matplotlib、plotnine和Plotly三个包来介绍主要出于一下考虑:

  • matplotlib是Python中最基础、最流行、最重要的可视化包;
  • plotnine基于图形语法(与R ggplot2类似),很有特色和学习价值;
  • plotly不同于前两者是交互式可视化包,功能十分强大,且具有较为完整的生态;
  • 三个包各有千秋,具有比较广泛的代表性,可以在此基础上继续延伸学习。

感兴趣的话,不妨花些时间去看看具体的内容。其中难免有疏漏错误之处,欢迎批评指正,也希望能一起交流进步。

内容来源

我在准备幻灯片的过程中,越发认识到数据可视化是一门巨大的学问,所以也不断地去学习相关资料。有关数据可视化、Python可视化的资料在互联网上俯拾皆是,给了我很大的帮助。而我也将其中较为契合或者优质的内容摘录到幻灯片中。

对于这些引用的材料,我本应该一一注明出处和来源,并根据原作者的许可情况加以使用。囿于时间精力所限,只整理了一小部分,未来如果有发现违背使用规范的,希望能随时与我联系。

以下为部分参考资料,感谢原作者的付出!

  1. http://pythonplot.com/
  2. https://www.kaggle.com/residentmario/grammar-of-graphics-with-plotnine-optional/
  3. https://www.coursera.org/learn/datavisualization
  4. https://www.coursera.org/specializations/data-science-python
  5. https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/
  6. https://www.slideshare.net/ssuser5e7722/matplotlib-basic-v01?qid=f8d08631-6a3f-453c-9d4a-a6a1fe44435d&v=&b=&from_search=12
  7. https://www.slideshare.net/coolzzzx/python-introduction-and-data-visualization-publish?qid=f8d08631-6a3f-453c-9d4a-a6a1fe44435d&v=&b=&from_search=1
  8. https://madlogos.github.io/R_Tutorial/A03 Visualization/A03_02_visualDesign.html
  9. https://www.ershicimi.com/p/1cb765baa949f78016d5b1af9b27ceda
  10. https://datacarpentry.org/python-ecology-lesson/07-visualization-ggplot-python/index.html
  11. https://www.experfy.com/blog/what-are-the-ingredients-of-a-terrible-data-story/
  12. https://cfss.uchicago.edu/slides/visualizations-and-the-grammar-of-graphics/#10
  13. https://www.slideshare.net/kesarifms/grammar-of-graphics-the-secret-sauce-of-powerful-data-stories
  14. https://www.slideshare.net/hadley/grammar-of-graphics-past-present-future
  15. http://liyangbit.com/pythonvisualization/Plotly-Express-introduction-cn/
  16. https://cloud.tencent.com/developer/article/1439757
  17. https://zhuanlan.zhihu.com/p/111099751
  18. https://kyso.io/KyleOS/cufflinks-intro?utm_campaign=News&utm_medium=Community&utm_source=DataCamp.com
  19. http://www.voycn.com/article/pythondongtaikeshihuacufflinks
  20. https://www.williamrchase.com/slides/ggplot_intro.html#1
  21. https://mschermann.github.io/data_viz_reader/patterns.html#choosing-the-right-baseline-in-data-visualization
  22. https://coolinfographics.com/dataviz-guides
  23. https://blog.hubspot.com/marketing/types-of-graphs-for-data-visualization
  24. https://infogram.com/page/choose-the-right-chart-data-visualization
  25. https://zhuanlan.zhihu.com/p/82236659
  26. http://www.sthda.com/english/articles/32-r-graphics-essentials/129-visualizing-multivariate-categorical-data/
  27. https://www.toptal.com/designers/data-visualization/data-visualization-best-practices
  28. https://www.webdatarocks.com/blog/power-of-data-visualization-and-charts/
  29. http://jcsites.juniata.edu/faculty/rhodes/ida/graphicalIntRedes.html
  30. https://antv-2018.alipay.com/zh-cn/vis/chart/index.html
  31. http://tuzhidian.com/?common=LineLike
  32. https://help.tableau.com/current/pro/desktop/zh-cn/what_chart_example.htm#分布
  33. 数据可视化,陈为、沈则潜,电子工业出版社,2013
  34. 数据之美,邱南森(Nathan Yau),中国人民大学出版社,2014