北远山村

老年之家

引言

本文将介绍ArcGIS的Python API,以及ArcGIS API的安装、使用和分析等。ArcGIS API for Python是一个用于处理地图和地理空间数据的Python库。我们可以用conda在本地安装API,然后与Esri的云GIS进行交互(无论是ArcGIS Online(SaaS)还是Portal for ArcGIS(为组织部署本地私有云))。ArcGIS API能够配合Jupter使用,为使用Python脚本进行基于网络的地图分析提供了现代化的解决方案。

ArcGIS API for Python和ArcGIS Online介绍

阅读全文 »

引言

前面已经介绍了如何安装PostGIS、创建数据表、添加数据并执行基本的空间查询。我们将在此基础上进一步学习如何使用地理空间数据库进行分析和地图可视化。我们将采用美国新墨西哥州Albuquerque的犯罪数据作为例子完成一系列的分析和图表报告。

具体而言,在这篇Notebook里,我们打算创建一个关于犯罪的仪表盘(crime dashboard),大概可以分为三步:

阅读全文 »

引言

本文主要介绍矢量数据的处理和地理空间分析,主要用到Shapely、OGR和GeoPandas三个库,展示如何用这三个库执行基本的地理空间分析,以及更加复杂的数据科学任务,主要内容包括:

  • 读写、创建、操作矢量数据
  • 矢量数据的地图可视化
  • 使用地图投影、执行空间操作
  • 矢量几何和属性数据分析
阅读全文 »

接着前面对DDF分析的余温,这一部分简单介绍与其十分相像的IDF分析。

引言

降水强度是指单位时间的降水量。通常以毫米/日、毫米/小时、毫米/10分钟为单位,还可根据应用部门的专门需要而定。在桥梁、涵洞等工程中所取时段较短(几分钟至几小时),在农业上有的选取时段较长(旬、月或作物生长发育期)。

阅读全文 »

前面主要是以气温作为对象进行极值分析,接下来我们以降水量作为对象,介绍水文学中常用的DDF和IDF曲线分析。

IDF/DDF介绍

强度-时间-频率(intensity-duration-frequency,IDF)或深度持续时间频率(depth-duration-frequency,DDF)曲线, 顾名思义,是将降雨强度/深度,与其持续时间和发生频率联系起来的数学函数。IDF和DDF曲线是水资源管理中最常用的工具之一,通常用于水文学的洪水预报和土木工程中的城市排水设计。此外,处于对降水的时间集中或者时间结构分析的需要,IDF曲线也在水文气象学分析中得到应用。

阅读全文 »

在前面的工作中,我们采用不同的极值分布对时间序列数据记进行了极值分析,并通过假设检验的方法选择了最优的分布。在这一部分,我们将采用bootstrap方法确定选择的最优分布的置信区间。

前序工作铺垫

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
from matplotlib.legend_handler import HandlerLine2D
from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 15, 9

import seaborn as sns

import lmoments3
from lmoments3 import distr

from plotnine.ggplot import *
from plotnine.qplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.facets import *
from plotnine.scales import *
from plotnine.themes.theme import *


%matplotlib inline

阅读全文 »

极大似然拟合概率分布

对数据集应用概率模型是解释数据集的一个好方法,但是,如何找到一个合适的模型本身就是一项工作。在选定模型之后,还要将其与数据进行比较或者检验。在这个例子当中,我们针对statsmodels自带的数据集“心脏移植后存活时间(1967-1974)”,采用极大似然估计的方法拟合概率分布。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import numpy as np
import pandas as pd
import scipy.stats as st
import statsmodels.datasets as datasets

from plotnine.ggplot import *
from plotnine.qplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.facets import *
from plotnine.scales import *
from plotnine.themes import *


import plotly.graph_objs as go
import plotly.offline as py_offline
import plotly.plotly as py
from plotly import tools

py_offline.init_notebook_mode()
%matplotlib inline
阅读全文 »

在第一部分,我们用GEV分布对北京的年最高气温进行了拟合。在这一部分,我们将采用更多的分布进行拟合,并采用KS检验选择其中最优的一个。

读取数据

1
2
3
4
5
6
7
8
9
10
11
12
import pandas as pd
import numpy as np
from plotnine.ggplot import *
from plotnine.qplot import *
from plotnine.geoms import *
from plotnine.coords import *
from plotnine.labels import *
from plotnine.facets import *
from plotnine.scales import *
from plotnine.themes import *

%matplotlib inline
阅读全文 »
0%