北远山村

老年之家

前面主要是以气温作为对象进行极值分析,接下来我们以降水量作为对象,介绍水文学中常用的DDF和IDF曲线分析。

IDF/DDF介绍

强度-时间-频率(intensity-duration-frequency,IDF)或深度持续时间频率(depth-duration-frequency,DDF)曲线, 顾名思义,是将降雨强度/深度,与其持续时间和发生频率联系起来的数学函数。IDF和DDF曲线是水资源管理中最常用的工具之一,通常用于水文学的洪水预报和土木工程中的城市排水设计。此外,处于对降水的时间集中或者时间结构分析的需要,IDF曲线也在水文气象学分析中得到应用。

阅读全文 »

在前面的工作中,我们采用不同的极值分布对时间序列数据记进行了极值分析,并通过假设检验的方法选择了最优的分布。在这一部分,我们将采用bootstrap方法确定选择的最优分布的置信区间。

前序工作铺垫

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
from matplotlib.legend_handler import HandlerLine2D
from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 15, 9

import seaborn as sns

import lmoments3
from lmoments3 import distr

from plotnine.ggplot import *
from plotnine.qplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.facets import *
from plotnine.scales import *
from plotnine.themes.theme import *


%matplotlib inline

阅读全文 »

极大似然拟合概率分布

对数据集应用概率模型是解释数据集的一个好方法,但是,如何找到一个合适的模型本身就是一项工作。在选定模型之后,还要将其与数据进行比较或者检验。在这个例子当中,我们针对statsmodels自带的数据集“心脏移植后存活时间(1967-1974)”,采用极大似然估计的方法拟合概率分布。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import numpy as np
import pandas as pd
import scipy.stats as st
import statsmodels.datasets as datasets

from plotnine.ggplot import *
from plotnine.qplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.facets import *
from plotnine.scales import *
from plotnine.themes import *


import plotly.graph_objs as go
import plotly.offline as py_offline
import plotly.plotly as py
from plotly import tools

py_offline.init_notebook_mode()
%matplotlib inline
阅读全文 »

在第一部分,我们用GEV分布对北京的年最高气温进行了拟合。在这一部分,我们将采用更多的分布进行拟合,并采用KS检验选择其中最优的一个。

读取数据

1
2
3
4
5
6
7
8
9
10
11
12
import pandas as pd
import numpy as np
from plotnine.ggplot import *
from plotnine.qplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.facets import *
from plotnine.scales import *
from plotnine.themes import *

%matplotlib inline
阅读全文 »

以前做多元统计的时候,主要关注正常数据而非极端数据的分布,极值分析刚好相反,算是给我一个新的视角,所以做了一些学习。

介绍

极值分析(Extreme value analysis, EVA),是一个主要用来估计比历史观测到的事件更加极端的事件的概率的方法,广泛用于金融、工程、气象、水文、海洋等诸多领域。

阅读全文 »

风玫瑰图在风力发电、气象、城市规划乃至保险等领域有着广泛应用,本文简单介绍了风玫瑰图的作图过程和简要的可视化与分析思路。

风玫瑰图

风玫瑰图(wind rose plot)作为一种气象科学的专用图表,是用来定量分析气象要素中风的一种工具。同时,风玫瑰图作为风电场建设前期必不可少的步骤——“风能资源评估”的主要工具,也越来越受到能源部门的建设者和规划者的重视。在风玫瑰图的极坐标系上,每一部分的长度表示该风向出现的频率,最长的部分表示该风向出现的频率最高。风玫瑰图通常分16个方向,也有的再细分为32个方向。因图形似玫瑰花朵,故此得名。

阅读全文 »

标准化降水和蒸散量指数(SPEI)在农业、气象、水文乃至保险等领域有着广泛应用,本文简单介绍了几种主流的干旱指数,并以SPEI为例介绍了数据的获取、处理和展示过程。

干旱指数

干旱作为一种极端气候事件和自然灾害,一直以来是造成农业损失和环境破坏的重要原因,对经济、农业、水资源、旅游乃至生态系统等不同领域造成巨大影响。

阅读全文 »

如果说plotly提供了强大的交互式作图工具,那么我认为plotnine则是静态作图的绝佳选择(至少从现阶段和趋势来看问题不大),所以我觉得Python数据可视化掌握三个工具应该就不错了:Matplotlib, Plotly和plotnine。这个文档简单整理了一些plotnine的基本用法,方便自己学习使用。

以下内容主要参考 http://pythonplot.com/

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import pandas as pd
import numpy as np

import plotly.plotly as py
import plotly.offline as py_offline
import plotly.graph_objs as go

from plotnine.ggplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.data import *
from plotnine.facets import *
from plotnine.scales import *
阅读全文 »

每次到年底,就会涌现出各种书单:“十大好书”、“十大必读”、“你看过了吗?”……明年,啊不,2019年打算认真看点书,东拼西凑地拉了个单子,不要求自己真的都读了,但愿能起到一点督促自己的作用。

瞎扯几句

原来总是吹嘘自己多么多么爱读书,领悟得多么多么快,懂得多么多么多,仔细详细,真正的读书人会把这些拿出来晒么?工作快两年了,年龄见长,见识却不见增长,意气风发不再,无端焦虑多了不少。

阅读全文 »
0%