引言

“科学素质”一次译自英文“Scientific Literacy”，由美国教育家、化学家、哈佛大学前校长柯南特（Conant）于1952年提出。在此基础上，芝加哥大学教授J.D.米勒于20世纪60年代创立了公民科学素质测评体系，即“米勒”体系，并得到了广泛的应用。

2016年4月，科技部发布《中国公民科学素质基准》，即中国公民应具备的基本科学技术知识和能力的标准，在网上引发了一定的争议。大家关于“什么是科学素质”、“如何评价公民科学素质”、“中美公民科学素质差距”等有一些的讨论。

阅读全文 »

引言

很久之前（2017年11月）写过一个用Python爬虫去Airbnb网站上抓取民宿信息，当时就觉得这个网站的信息实在是隐藏得太深了。结果最近发现，现在又不能了：Airbnb的网页用了大量的JS来动态生成，直接解析网页，拿不到什么有用的信息。

道高一尺，魔高一丈。为了解决动态网页的爬取，也有许多方法，例如我们前面针对Wunderground用Selenium解析。由于Airbnb需要爬取的网页数目比较多，为了提高稳定性，我们采用Scrapy+Splash的方法来解析动态网页，在这个过程中也发现，如果可以找到网页请求的API，用API实际上更加方便。

阅读全文 »

引言

天气数据作为一类重要的数据资源，在各个行业有着广泛而且重要的应用。通常来说，天气预报的数据作为公共资源是非常容易获取的，但是如果想知道大范围、长时间的气象历史数据，还是需要费一番周折的。

网上也有一些可以获取历史气象数据的API，例如AccuWWeather、Darksky和OpenWeatherMap等，但是免费版的一般会限制调用次数，而收费版的并不在初学者的考虑范围之内。由于很多气象网站也提供历史数据，而网页的访问通常不限次数（只要不是太过分的话），所以为了解决这个问题，我们可以通过抓取网页，然后提取和整体我们需要的数据。

资本资产定价模型（Capital Asset Pricing Model，CAPM），是由美国学者威廉·夏普（William Sharpe）、林特尔（John Lintner）、特里诺（Jack Treynor）和莫辛（Jan Mossin）等人在现代投资组合理论的基础上发展起来的，是现代金融市场价格理论的支柱，广泛应用于投资决策和公司理财领域。资本资产定价模型中，所谓资本资产主要指的是股票资产，而定价则试图解释资本市场如何决定股票收益率，进而决定股票价格。

CAPM大概是资产定价中使用最广泛的模型，它的之所以如此流行有一下几个原因。

阅读全文 »

Python金融分析（四）：开放数据源

发表于 2019-03-15 分类于他山攻错 Disqus：

前言

自从我们的社会进入所谓的“信息时代”以来，我们已经被大量的信息或数据所吞没。出于这个原因，对拥有数据处理技能的人员，如商业分析师和数据科学家的需求大大增加。

Kane(2006) 提出了“开源金融”的概念。主要有三个部分组成：

阅读全文 »

北远山村

中美公民科学素质差距很大吗？

引言

Splash-Scrapy爬取Airbnb数据

引言

天气数据的爬取与可视化

引言

Python金融分析（十）：贝叶斯线性回归

引言

贝叶斯统计

Python金融分析（九）：投资组合优化

引言

投资组合优化

Python金融分析（八）：正态性检验

引言

Python金融分析（七）：常用数学工具

引言

Python金融分析（六）：多因子模型简介

引言

Fama-French三因子模型

Python金融分析（五）：CAPM模型简介

前言

Python金融分析（四）：开放数据源

前言