北远山村

老年之家

引言

全球最大的民宿平台、“共享经济”的引领者——Airbnb已经诞生超过10年了,并且根据官方信息将在2019年完成上市。作为一只独角兽,Airbnb赚足了眼球:在风靡全球的同时,在进入中国市场却明显水土不服;在带来诸多便利的同时,也存在安全、隐私等方面的隐患;在市值高涨的呼声中,批评和争议也不绝于耳……

当然,不管怎么样,Airbnb目前来看还是一个很不错的平台,尤其是上面汇聚了大量的数据可以用于分析和研究。前面我们已经介绍了如何使用Scrapy、Splash和Airbnb API获取Airbnb上的数据,但是还有很多数据是通过爬虫难以获得的。幸运的是,有一个叫做“InsideAirbnb”(http://insideairbnb.com) 的网站,提供了独立的、第三方、非营利的分析工具和数据。因此,我们从上面下载了北京的相关数据,用来作为分析的示例。

阅读全文 »

引言

本篇为我的好友阿池撰写的一篇小文章,行文风趣流畅,即使当作轶闻野史来看也是不错的,何况能从中学到点东西呢~

(本文的素材主要来自ASQ2016年的一篇案例研究文章,研究者历时3年访谈了诺基亚高管、中层共计76轮次,资料整理后又向被访者和组织内的“包打听”求证,资料翔实难得)

阅读全文 »

引言

“科学素质”一次译自英文“Scientific Literacy”,由美国教育家、化学家、哈佛大学前校长柯南特(Conant)于1952年提出。在此基础上,芝加哥大学教授J.D.米勒于20世纪60年代创立了公民科学素质测评体系,即“米勒”体系,并得到了广泛的应用。

2016年4月,科技部发布《中国公民科学素质基准》,即中国公民应具备的基本科学技术知识和能力的标准,在网上引发了一定的争议。大家关于“什么是科学素质”、“如何评价公民科学素质”、“中美公民科学素质差距”等有一些的讨论。

阅读全文 »

引言

很久之前(2017年11月)写过一个用Python爬虫去Airbnb网站上抓取民宿信息,当时就觉得这个网站的信息实在是隐藏得太深了。结果最近发现,现在又不能了:Airbnb的网页用了大量的JS来动态生成,直接解析网页,拿不到什么有用的信息。

道高一尺,魔高一丈。为了解决动态网页的爬取,也有许多方法,例如我们前面针对Wunderground用Selenium解析。由于Airbnb需要爬取的网页数目比较多,为了提高稳定性,我们采用Scrapy+Splash的方法来解析动态网页,在这个过程中也发现,如果可以找到网页请求的API,用API实际上更加方便。

阅读全文 »

引言

天气数据作为一类重要的数据资源,在各个行业有着广泛而且重要的应用。通常来说,天气预报的数据作为公共资源是非常容易获取的,但是如果想知道大范围、长时间的气象历史数据,还是需要费一番周折的。

网上也有一些可以获取历史气象数据的API,例如AccuWWeather、Darksky和OpenWeatherMap等,但是免费版的一般会限制调用次数,而收费版的并不在初学者的考虑范围之内。由于很多气象网站也提供历史数据,而网页的访问通常不限次数(只要不是太过分的话),所以为了解决这个问题,我们可以通过抓取网页,然后提取和整体我们需要的数据。

阅读全文 »

引言

每年的9月份,杨振宁会为清华的大一新生上一堂课,回顾他波澜壮阔的一生,回味物理学尤其是高能物理学的黄金岁月,然后告诫大家,个人的奋斗必须要与历史的进程结合起来。

事实的确如此,在经历了20世纪50~70年代的黄金时代以后,物理学家纷纷投身到金融行业,即“Rocket Scientists on Wall Street”,强大的智力支持确实让现代金融在数理基础上实现了腾飞。

阅读全文 »

引言

正如在CAPM介绍中所提到的,CAPM虽然简单易用,但是存在许多局限性。而单因子模型,可以作为更加复杂的模型的扩展基础。接下来,我们重点介绍Fama-French三因子模型、Fama-French-Carhart四因子模型以及Fama-French五因子模型。在这些多因子模型的基础上,我们可以发现,通过添加我们认为有用的其他因子,我们可以定制自己的多因子模型。此外,我们还会简单讨论一下夏普比率、特雷诺比率和詹森指数等指标。

Fama-French三因子模型

阅读全文 »
0%