「地理空間情報」とは？地理空間情報データの可視化、統計モデル作成など、「R」の使い方とともに、基礎から手を動かしながら学びたいあなたにおすすめの本はこちらです

６章では、Rでのプログラミングがサクッと学べます

Rでのプログラムの基本的な内容（条件文、ループ）
関数の定義方法

などが学べ、最後に

空間データに関する関数の記述方法

を学べ、地図の塗り分けなどができるようになります。

カットシステム

RStudioではじめるRプログラミング入門

オライリージャパン

Rプログラミング本格入門: 達人データサイエンティストへの道

共立出版

Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド

９章では、インターネット上のデータをRで自動収集する方法が学べます

データ解析を行う上で、最初に必要となるのが

データの準備

です。

データ分析手法は、理論や数式、分析・可視化などを綺麗な世界（？）だとすると、データの準備は泥臭い世界と言えます。

生データは、データを解析するまでに様々な工夫や手間がかかります。

本章では、それらを改善するための方法として、

Rを使ったデータの収集の効率化手法が学べます。

通常のデータアクセスだけでなく、グーグルマップへのアクセスなど、

地理空間情報特有のデータのダウンロード方法

などもRコードとともにわかりやすく解説されています。

以上４つの章だけで、Rについての基本操作を身につけることができます。

空間データ以外の分析でも、Rを活用できるようになるわけです。

シーアンドアール研究所

共立出版

【改訂新版】[オープンデータ+QGIS]統計・防災・環境情報がひと目でわかる地図の作り方

Rを使った地理情報データ解析の解説

地理情報のデータ解析についての解説は、以下の構成になっています。

地理情報データについて
Rを地理空間情報システム（GIS）として活用する方法
ポイントパターン解析
地理空間属性分析
局所的な地理空間分析

地理情報データについて

本章では、地理情報データについて

操作のやり方
地図の表示方法
空間データの記述統計、プロット

をRで手を動かしながら学べます。

まず、地図表示のやり方が、

地理情報の重ね合わせ（オーバーレイ）
地図の装飾
地図の保存

として解説され、例えば、地図上に道路を重ね合わせる、といった操作を学べます。

地理情報データの基本操作を身につけることができます。

技術評論社

五訂版 GISと地理空間情報: ArcGIS 10.7とArcGIS Pro 2.3の活用

次に、地図表示の一歩先として、

地図上に属性を表示する方法

について解説されています。

属性表示では、

地図上のある区域の人口や収入
犯罪の起きた場所

といった空間情報を地図とともに表示する方法が学べます。

地図情報と自分が表示した空間データを用意したら、

これらの知識で、複数の空間情報データを１枚の地図に重ねて可視化することができるようになります。

Rを地理空間情報システム（GIS）として活用する方法

地理情報データの解析では、生データをGISを用いて前処理することがあります。

GISにはArcGISやQGISなどがあります。

古今書院

これで使えるQGIS入門―地図データの入手から編集・印刷まで (Introduction to QGIS)

Rを用いて同様の前処理を実行することができます。

例えば、

複数の地理空間情報から共通する部分を抽出する
対象領域の周囲も含めて解析にゆとりを持たせる（バッファの追加）
対象領域中の点データの数や対象領域の面積の取得と距離の計算

など、地理情報データ解析で必要となるデータの前処理ができるようになります。

また、地理空間情報データの形式には、ベクター形式とラスター形式があるのですが、

ベクターとラスターの相互変換のやり方

も解説されています。

どちらかの形式のデータがある場合に、分析しやすい形式へ変換してから解析することができるようになります。

ナカニシヤ出版

スマホとPCで見るはじめてのGIS: 「地理総合」でGISをどう使うか

古今書院

フィールドデータによる統計モデリングとAIC ＩＳＭシリーズ：進化する統計数理

ポイントパターン解析

ポイントパターン解析とは、

ポイントデータ（点データ）について、
空間的パターン（ランダムなのか、クラスターがあるのか、など）

を調べる方法です。

近代科学社

メッシュ統計 (統計学One Point 15)

共立出版

ポアソン分布・ポアソン回帰・ポアソン過程統計スポットライト・シリーズ

近代科学社

医学統計学シリ-ズ: 疾病地図と疾病集積性を中心として (7)

「カーネル密度推定」は、

ランダムなポイントパターンについて、

その強度を、なめらかに表示する方法

の１つです（それぞれのデータは互いに独立と仮定しています）。

データ数が比較的少なくても使えるメリットがあります。

データ数がもう少し多ければ、ヘキサゴナルビニングが使えます。

「ヘキサゴナルビニング」は、ポイントデータを６角形の区域に分けてカウントします。

通常の統計でのヒストグラムのイメージで理解すると分かりやすいかと思います。

ヒストグラムでの各階級が、ヘキサゴナルビニングでの６角形に対応しています。

カウントした数の大小で色を変えて地図上に表示します。

地図上でのポイントデータの分布を可視化することができます。

加えて、二次解析について解説があります。

「二次解析」とは、各データの空間的な関連性を分析する方法です（各データが独立でなく、強度は一定と仮定しています）。

二次解析でわかることとしては、例えば、

ある地域で特定の伝染病が起きた時、その近辺で伝染病が起こりやすいかどうか

を調べることができます。

近場で伝染するのは当たり前じゃん

と思われるかもしれませんが、私たちが思いもよらない

特有の地理的要因があぶり出される

ことがあるかもしれません。

また、仮説があればそれが正しいかを調べることもできます。

このように、疾病の空間的な分析は「空間疫学」と呼ばれています。

朝倉書店

他にも、

マーク付きポイントデータへの二次解析
データにない地点でのマークの補間
クリギング補間

について、Rのコードとともにわかりやすく解説されています。

「マーク付きポイントデータ」とは、マークがついたポイントデータのことです。

「マーク」とは、場所や時間などのデータの基本変数の他の属性データのことです。

例えば、野生動物の発見場所の地理空間情報データがあったとします。

そのデータには、発見された場所というデータ以外にも、

どんな動物だったか
何頭だったか
いつだったか

のような情報も合わせて記録されているかもしれません。

（東京都多摩市・シカ・１頭・2016/6/8）

のようなデータです。

このポイントデータは、場所以外の情報（シカ、１頭、2016/6/8）を持っているので、マーク付きポイントデータと呼ばれます。

手元にあるデータの中には、属性の値がない地点が含まれることがあります。

例えば、以下のデータがあるとします。

（東京都多摩市・シカ・１頭・2016/6/8）

（東京都大田区・クマ・１頭・2016/10/21）

（東京都中央区・なし・１頭・2017/11/1）

・・・・・

（東京都荒川区・シカ・１頭・2018/3/11）

2017/11/1のデータには、どんな野生動物だったかが記録されていません。

属性値がない地点のマークの属性を、他のデータから推定するための手法が「補間」になります。

A市の山にこれだけの野生動物がいるなら、

隣のB市の山には、〇〇頭いるだろう

といった感じです。

この空間補間にはいろいろな手法があり、

ここでは逆距離補間法やクリギング補間法などが解説されています。

本章をやることで、マーク付きポイントデータの地理空間データの解析ができるようになり、

データがない場所での属性を推定できるようになります。

地理空間属性分析

「地理空間属性分析」とは、

地理空間と関連付けられたデータの属性についてのデータ分析

です。

ポイントパターン解析では、データはランダムで動的と考えていました。

地理空間属性は、非ランダムで静的とみなします。

非ランダムとは相関があるということです。

地理空間なので、空間的な相関がある、とも言えます。

地理空間属性分析では、非ランダム・静的なデータとして解析が行われます。

地理空間属性分析について大きく２つ解説があります。

(1), 地理空間属性値のモデル化

地理空間情報データ（観測値）は、位置によってモデル化することができます。

例えば、ある地点の不動産価格は、

位置を考慮した平均値と分散を持つ正規分布としてモデル化

することができる場合があります。

(2), 地理空間情報データ同士の相関をモデル化

地理空間情報データ（観測値）の相関は、

位置同士の距離に依存するとしてモデル化
ポリゴン同士の隣接関係に基づいてモデル化

といった方法があります。

一般的な統計モデルでは、各観測値は互いに独立していると仮定されていることが多いかと思います。

一方、地理空間情報データの場合は、各観測値は、空間的な相関を持つことがあるため、そこに注意してモデル化する必要があります。

空間的な自己相関があるかどうか
あるならどの程度あるのか
どの地域とどの地域には相関があるのか

といったことを考慮しながらモデル化します。

空間的自己相関を調べるには、例えば、

隣接ポリゴンの観測値の加重平均（平均値ラグ）のプロット

（Moranプロットまたは Moran 散布図とも呼ばれます）

をすることで、

空間的自己相関を視覚的にも調べることができます。

他にも、空間自己相関の指標である

「Moran I 統計量」

（通常の統計でのピアソンの相関係数のようなもの）の求め方などが解説されています。

加えて、空間的自己相関がある場合のデータについての回帰モデル

「空間自己回帰モデル」

の解説がされています。

空間自己回帰モデルとは、例えば、地域 m の属性値を、m が隣接する地域（2, 3, 4,・・・・n）から回帰するためのモデルです。

実例を通じて説明され、手を動かしながら学べます。

局所的な地理空間分析

上で説明した分析では、地理的な影響は均一と仮定されていました。

しかじ現実には、地域によって影響が異なることが考えられます（異質性といいます）。

異質性があるかどうかを調べるには、「ローカル Moran I 統計量」を計算する方法があります。

異質性を考慮したモデルには、「地理的加重回帰モデル」などがあります。

これは空間回帰モデルの各係数を地域ごとに異なるとしてモデル化する方法になります。

これらがRでの計算方法など、具体例とともみわかりやすく解説されています。

各章には練習問題がついており、各章の内容の理解度を確かめることができます。

加えて、練習問題の解答が巻末に丁寧にわかりやすく解説されています。

教科書的な部分で理論的な考え方を学び
Rのコードを理解しながら手を動かして学び
練習問題とわかりやすい解説で理解を確かめる

のように、独学の方でもつまづかずにやり通すことができます。

さらに、付録も充実しています。

sfパッケージの解説
型の変換
座標参照系の変換
コロプレス図の描き方

といった地理空間情報データ分析で重要となる基礎知識もシッカリと解説されています。

というわけで、本書は、

Rの使い方
Rによる地理空間情報データ解析の方法

の両方学べるお得な１冊で、

初心者のあなたの独学にもおすすめの本となっています。

共立出版

こちらもございます↓

朝倉書店

〔完全解説〕地理情報プログラミングの基本と応用

技術評論社

地理空間データ分析 (Rで学ぶデータサイエンス 7)

共立出版

勁草書房

地理空間分析 (シリーズ〈人文地理学〉 3)

朝倉書店

森北出版

地域研究のための空間データ分析入門: QGISとPostGISを用いて

古今書院

経済・政策分析のためのGIS入門 2:空間統計ツールと応用: ArcGIS Pro対応

古今書院

地理空間情報を活かす授業のためのGIS教材

古今書院

都市空間と産業集積の経済地理分析 (法政大学比較経済研究所研究シリーズ29)

日本評論社

古今書院

点過程の時系列解析 (統計学One Point 14)

共立出版

Mastering Geospatial Development with QGIS 3.x: An in-depth guide to becoming proficient in spatial data analysis using QGIS 3.4 and 3.6 with Python, 3rd Edition

Packt Publishing

PostGIS Cookbook - Second Edition: Store, organize, manipulate, and analyze spatial data

Packt Publishing

Manning Publications

GeoServer Beginner's Guide - Second Edition: Share geospatial data using Open Source standards

Packt Publishing

Geoprocessing with Python

Manning Publications

Learning Geospatial Analysis with Python: Understand GIS fundamentals and perform remote sensing data analysis using Python 3.7, 3rd Edition

Packt Publishing