「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊はこちらです

Correspondence Analysis recommended books R

「コレスポンデンス分析(対応分析)」とは、ザックリ言うと、データの軸を変えて、別の見方をする方法です。

データを別の視点でみることによって、そのデータの新たな一面を知りたい、というときに役立つ手法といえます。

 

少し詳しくいうと、コレスポンデンス分析とは、多次元の質的データの相関構造を調べるのが目的で、新しい軸を作成し、その軸を使って、データの見えにくかった特徴を明らかにする手法とも言えます。

 

主成分分析を学んだ方なら、質的なデータに対する主成分分析が、コレスポンデンス分析(対応分析)だと理解すればわかりやすいかもしれません。

主成分分析は、”量的なデータ”の相関構造を明らかにする手法で、コレスポンデンス分析では、”質的データ”に対して同じようなことをやります。なので、コレスポンデンス分析は、主成分分析の質的データバージョンといえるわけです。

 

これらの手法は、「データを少ない次元に射影して、新しい合成変数(軸)を作成し、その新しい軸を使って、データの中にある隠れた構造をわかりやすくする」という共通の考え方にもとづいています。

なので、コレスポンデンス分析(対応分析)がよくわからないなぁ〜という方は、主成分分析を学んでみるのもいいかもしれません。

ちなみに「主成分分析」については、1番下におすすめ記事がありますので、よかったらご覧ください。

 

コレスポンデンス分析ってどんなとこで役に立つの?

 

と思われるかもしれません。

 

コレスポンデンス分析は、たとえば、アンケート調査などで活躍します。

アンケート調査では、クロス集計をよく使うのですが、クロス集計とコレスポンデンス分析は相性がいいんです。なので、コレスポンデンス分析は、アンケート調査をするなら、ぜひ身につけておきたい手法の1つといえます。

アンケート調査については、1番下におすすめ記事がございますので、よかったらご覧ください。

 

ちなみに、コレスポンデンス分析は、別名、対応分析とも呼ばれたりします。

また、数理的な面から、同じ仕組みを使っている手法として、「数量化III類」「双対尺度法」「最適尺度法」「等質性分析」「主成分尺度分析」など手法があります。

 

そんなにあるの!

 

という方もおられるかもしれません。

質的データの分析を理解したいときに、次元を減らすような手続きがされているなら、コレスポンデンス分析のようなことをしているのかな?と考えるのが役に立つかもしれません。

そう考えることで、知りたい分析の内容をサクッと理解できるかもしれません。

 

 

というわけで、本記事では、「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊をご紹介します。

 

本記事の概要

「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊はこちらです

1冊目はこちら 【統計の基礎からコレスポンデンス分析までエクセルで学びたいならこちら】

Excelで学ぶコレスポンデンス分析

本書は、コレスポンデンス分析や数量化III類をエクセルでできるようになる1冊です。統計の基礎から学べる点も初学者でも学びやすいように工夫されています。

統計の基礎知識として、データの分類から分散・標準偏差、基準化とそれらのエクセルでのやり方、確率密度関数として正規分布、標準正規分布、カイ二乗分布、t分布、F分布、指数分布、ワイブル分布とエクセルでの表現方法、相関分析として、単相関係数、相関比、クラメールの連関係数とそれらのエクセルでの実行方法、独立性の検定として、検定とは?から、独立性の検定、帰無仮説と対立仮説、P値と検定の手順、検定の結論の表現とエクセルによる計算などが学べます。

その後、コレスポンデンス分析の計算方法やアドインソフトの使い方、エクセルでの計算について解説があります。加えて、数量化III類の計算方法とエクセルでの実装について学べます。

付録として、フィッシャーの正確検定も学べるのがうれしいところです。

 

 

 

2冊目はこちら 【コレスポンデンス分析を、最短でサクッと理解するにはこちら】

多変量解析がわかる (ファーストブック)

本書は、多変量解析の主な手法をわかりやすく解説した1冊で、エクセルによるやり方も角手法ごとに示されていて、理論の概要とエクセルによる実行の両方を学ぶことができます。

コレスポンデンス分析では数量化III類との関係が説明されていて、まずは数量化III類から読み、その後コレスポンデンス分析を学ぶと理解が早いかと思います。

数量化III類、コレスポンデンス分析について、同じ例で説明してあるので理解しやすく、それらの違いも理解できます。忘年会の料理の希望を年代別に聞いたアンケート調査のデータをもとに、考え方や結果の分析、エクセルでのやり方を学べます。

コレスポンデンス分析の原理は、クロス集計表からの相関図の相関係数を最大化することで、そのように項目を並べ替える手法ということを具体例を通じてサクッと理解させてくれます。

 

 

 

 

3冊目はこちら 【コレスポンデンス分析の理論よりも、まずはやり方や結果の有効活用を身につけたいあなたはこちら】

例題とExcel演習で学ぶ多変量解析: 因子分析・コレスポンデンス分析・クラスター分析 編”

本書は、多変量解析を目の前の仕事や研究などにサクッと応用することができることを目的にした1冊です。そのため、数式などによる詳しい理論というよりも、実際のやり方や得られた結果の意味や活用についてしっかり学べるように工夫されています。分析は、エクセルの分析ツール、もしくは株式会社アイスタットさんが開発したソフトで手を動かしながら学ぶことができます。

加えて、コレスポンデンス分析だけでなく、多変量解析の概要で、どんなデータに使えるのか、どの方法を使えるのかなども学べます。多変量解析でよく使う、主成分分析や因子分析、クラスター分析、共分散構造分析も学べるお得な1冊となっています。付録にベクトルと行列の解説や、エクセルでの行列計算、エクセルでの分析ツール、マルチ多変量ソフトウェアの解説があり、理解を深めてくれるおすすめの本となっています。

 

 

 

 

4冊目はこちら 【コレスポンデンス分析の理論やSAS, SPSS, Rによる実践も身につく教科書的な1冊はこちら】

対応分析入門 原理から応用まで 解説◆Rで検算しながら理解する

本書は、対応分析(コレスポンデンス分析)の基礎から学べ、具体例を通じた応用例も示され、統計解析ソフトのSASやSPSS、Rを使った実践方法も紹介されています。副題の通り、対応分析の原理から応用までシッカリ学べる教科書的な1冊です。

対応分析は、大きな表のカテゴリカル変数(質的変数)間の関係をグラフィカルに表現でき、
変数間の関係を視覚的に理解できる手法です。その分析手法は比較的シンプルで、カテゴリー変数の相対度数と周辺度数を計算し、各点間の距離を算出します。その距離をもとに、元のデータを、よりわかりやすい最適なn-次元空間に変換します。この最適の基準には、各因子を説明する慣性(分散)が最大になることとして計算され、これは主成分分析と同じ思想ということがわかるかと思います。

具体的な応用例として5つあげられており、①レジャー活動と職業の関係、②犯罪のタイプと居住地域、③疾病・年齢・性別データの縮減、④生活保護受給者のタイプと人口特性、⑤生活水準調査からのデータからジェンダー・年齢・飲酒頻度について、対応分析と対数線形モデルの連携の仕方が解説されています。

対数線形モデルはカテゴリカル変数の分析によく使われますが、対応分析とはそれぞれの手法の強みが違いますので、それらの連携が学べるのがうれしいところです。
データの多くがノルウェイ統計局により行われた健康調査1985や生活レベル調査1995を基礎に行われていて、医学統計や社会統計などの分野の方だけでなく、その他の分野の方にも身近でわかりやすい具体例となっています。

 

 

 

 

5冊目はこちら 【コレスポンデンス分析を、特にマーケティングに活かしたい方はこちら】

現代マーケティング・リサーチ — 市場を読み解くデータ分析

本書では、コレスポンデンス分析について、その解説とともに、マーケティングに関する具体例が示されています。例としては、東日本と西日本の消費者にカレーの辛みについての嗜好を、甘口・中辛・辛口の3種類から選択してもらい、消費者が好む辛みを調査したデータが使われています。

まずは独立性の検定を使い地域と味の好みの要因が関係あるかどうかを調べ、注目変数間に関連がある場合には、コレスポンデンス分析を用い、どのような関連なのかをさらに深く調べていくことになる、という流れが解説されています。

二元クロス表や独立性の検定の説明に加え、同時確率表や期待度数などの考え方、期待度数と実際に観測された観測度数の差として、クロス表の独立性の検定(ピアソンのカイ二乗検定)が丁寧に説明されています。Rコマンダーによるやり方の解説があり、自分でも手を動かしながら理解することができます。

次に、コレスポンデンス分析を用いて理解を深める分析が行われます。コレスポンデンス分析では質的変数を量的変数に変換し、クロス表の条件下で相関係数が最大になるように量的変数の値を決定する。そしてそれを同じ平面にマッピングする、とサクッと説明されています。この条件付き最大化の詳細は参考文献を参照するようになっていて、クロス表から定義される行列の固有値・固有ベクトルを用いて求めることが出来ることがわかります。多くは2次元平面にマッピングされることが多く、平面上で近い点は関係性が強いものとして解釈されます。

加えて、コレスポンデンス分析の応用例として、家庭用掃除機10ブランドについて、8つの製品評価項目(デザイン・使いやすさ・パワー・静音性・サイズ・手入れのしやすさ・取り回し・満足度)について、5点満点で評価を行ったデータの分析が、Rコマンダーを用いて行われています。

Rコマンダーを用いることで、エクセルのようにマウスで操作でき、非常に手軽に分析できることがみてとれます。コレスポンデンス分析では、パッケージ FactorMineR の Correspondense Analysis (CA) が使われています。さらに続いて、コレスポンデンス分析の結果に対してクラスター分析を行う手順が示されており、各項目の関連性が、視覚的にパッと見てわかる図として出力されています。比較として、デジタルカメラでの製品評価の分析ものっており、見比べることでさらに理解を深めることが可能です。上司や顧客へのプレゼン資料にも使えるような、パッと見てわかりやすい図を書くことができます。

本書はコレスポンデンス分析だけでなく、マーケティングリサーチに関係する内容を調査編・分析編・上級編・補論として一気に学べます。数式もありますが、込み入った詳細は参考文献にゆずることで、スピード感をもって学び、実務に活かせる内容を学び取れる1冊です。

 

 

 

6冊目はこちら 【コレスポンデンス分析含めて、マーケティング関連手法を網羅したいならこちら】

マーケティングリサーチハンドブック―リサーチ理論・実務手順から需要予測・統計解析まで

本書では、コレスポンデンス分析についてサクッと紹介した1冊です。

まず、どんなときに使う手法か、ということで、利用の目的の例や必要なデータ例が簡潔に紹介されています。次にコレスポンデンス分析とは、ということで、クロス集計表のデータを多変量空間にマッピングするものとして説明があり、クロス表を図示してカテゴリー間の関係を視覚的に理解できる方法として有効な旨が述べられています。また数量化III類との共通点に触れられています。

加えて、コレスポンデンス分析の例として、性年齢別広告イメージデータの図示が描かれています。コレスポンデンス分析は表題・表側空間の距離と考えることで、クラスター分析を組み合わせて使うことができ、マーケティングなどで重要なターゲット層と関連するカテゴリーを理解できるメリットが説明されています。

本書は、マーケティングリサーチに必要な基礎知識だけでなく、実務で役に立つ広範囲にわたるマーケティングリサーチの手法が解説されています。データ収集や需要予測、多変量解析、質的分析など、マーケティングに必要な情報が網羅され、初学者から実務者、そして経営者の方など、マーケティングに関わるすべての方にとって手元にあると重宝する1冊となっています。

 

 

 

 

7冊目はこちら 【多重コレスポンデンス分析(多重対応分析)も学びたいあなたはこちら】

定性的データ分析 (シリーズUseful R)

本書では、目的変数なしの定性的データ分析方法として、対応分析が解説されています。シングルの対応分析の考え方から実際のアルゴリズムに加え、多重対応分析についても学べるのが特徴となっています。

ちなみに、対応分析はコレスポンデンス分析とも呼ばれますが、その他にも本質的に同じ考え方に基づいて、別の文脈で開発されたものがあります。数量化III類、双対尺度法、最適尺度法、等質性分析、主成分尺度分析、質的データの要因分析などが提案されています。これらは数理的に同値なので、コレスポンデンス分析を学ぶことで、これらの手法についても理解が促進されます。

本書は、その他の手法についても幅広く学べます。比率検定、独立性分析、重回帰分析、一般化線形モデル、対数線形モデル、ツリーモデル、アンサンブル学習、数量化I類、主成分分析因子分析クラスター分析ネットワーク分析アソシエーション分析などが扱われており、理論とRでの実行方法を学べる1冊となっています。

本書の内容については、詳しくはこちらにございます↓

「定性的データ分析」と統計解析のフリーソフト「R」をサクッと身につけたいあなた、こちらはいかがでしょうか

 

 

 

 

8冊目はこちら 【コレスポンデンス分析を、「R」を使って、具体例で手を動かしながら学べる1冊】

多次元データ解析法 (Rで学ぶデータサイエンス 2)

本書では、「コレスポンデンス分析」は「対応分析」として紹介されていて、両者は同一のモノです。また、ほぼ同じ(数学的に同値な)方法として、「数量化III類」や、「双対尺度法」、「関連分析法」という手法もあります。これらの手法をみたら、同一のものと考えて大丈夫です。

本書では、質的データのクロス集計表や対応分析の考え方を、大学における学生の教員評価データを使って解説されています。アンケート調査の結果がクロス集計表にまとめられており、教員の評価と、その評価の原因(熱心・上手・声大など)との関連性を調べています。

クロス集計表の基準化、同時確率、条件付き確率の説明がありり、基準化したクロス表のデータから得られる行列の分散共分散行列を作成し、その行列の固有値問題を解くことで、主成分分析でいう主成分得点であるカテゴリスコア(または数量化得点)を求めることができる、と解説されています。その後でこれらの操作の数学的な手順が示されています。

また、教員の評価データへの適用も解説と同時並行で行われていて、どの数学的操作でデータがどのように変わっていくのか、1つ1つ確認しながら学ぶことができます。最後に教員評価の数量化得点が2次元にプロットされており、いくつかのクラスターにわかれていることがクリアに見てとれます。

加えて、Rでの実行手順がRコードと結果の表示とともに示されていて、手を動かしながら学ぶことが可能です。ここでは、ライブラリ MASS の corresp()の使い方が示されています。

最後に、より深い理解のためとして、双対性の性質を使った数量化得点の導出方法と、数量化得点の性質について解説されています。実務では(とりあえず)とばしてもいい内容ですが、より詳細に学びたい方にもシッカリ学べる構成になっています。

本書全体としては、理論的な背景から、Rによる実務も学べ、対応分析だけでなく、統計学やRの使い方の基礎から、線形回帰モデル、判別分析法、ロジスティック回帰モデル、主成分分析法、因子分析法、正準相関分析法、多次元尺度法、クラスター分析法など学べるお得な1冊となっています。

ただし大学初年度の線形代数の知識が想定されていますので、初学者の方ならそちらもあわせて学ばれるといいかと思います。

「線形代数」を独学したい人はチェックしてほしい良書、13冊はこちらです

「ベクトル」を学びたい・復習したい方にチェックしてほしい良書、10冊はこちらです

 

 

 

9冊目はこちら【コレスポンデンス分析の具体例を知りたいならこちら】

多変量解析実例ハンドブック

本書は、コレスポンデンス分析の使われている具体例を参照できる1冊です。

  • 自分の分析に参考になる分析例はないかなぁ
  • コレスポンデンス分析はこう使えばいいんだ
  • こういう分野でも活用することができるんだ

など、使い方や応用例をみて、手法の活用力を高めることができます。

コレスポンデンス分析は、上で述べたように、対応分析とも呼ばれますし、その他にも数理的に同じ手法がいくつかあります。ここではそれらを含めて、本書で示されている具体例をサクッとご紹介します。

【生物分野】では、「生物集団の形態分析」として、集団生物学での活用例が示されています。生物集団学では、集団間の違いに着目して研究が行われます。遺伝子の差異だけでなく、形態についても調べられます。ここでは、アユの形態について、数量化III類、クラスター分析、正準判別分析を用いた考察がまとめられています。

【医学分野】では、「健康関連QOLに及ぼす性格特性の影響」として、単に病気でないことを目指すのではなく、心身ともによい状態を目指すには、どのような要員があるのかについて、数量化III類を用いて検討されています。患者の健康関連QOLを数値化して測るために開発された調査票の結果を用いて、性格特性の影響が調べられています。胃がん患者、鍼灸治療患者、健常人のグループごとに、外向性、情動性、タフ性、偽装性の4つの次元を測定し、これらの次元の耐性型と非耐性型、中間型の3つに分類しています。これらの結果から健康関連QOLとの性格特性の関連が分析されています。

【政治・社会分野】では、「国際政治研究者の専攻戦略」として、国際政治研究の動向が調べられています。日本国際政治学会の会員データをもとに、専攻調査と会員属性の関係などが、数量化理論III類やロジスティック回帰分析、分散分析、独立性のカイ二乗検定などを用いて分析されています。

また、もう1つの例として、「数量化理論を用いた住民投票の分析」として、各自治体の市長へのアンケート結果をもとにして、数量化理論を用い、住民投票への態度を決める要因についての分析例が示されています。

【心理分野】では、「センター試験5教科の得点プロフィールに見る受験者の個性」として、その中で浪人経験による学力特性の変化の分析に双対尺度法(数量化III類)が用いられています。各生徒の学力を、得意な科目によって分けた学力型を用いて分類し、それらが浪人経験でどのように変化したかをクロス表を使いまとめられています。クロス表の結果の見通しをよくするために、双対尺度法をもちいて、30の学力型の関係が図示させています。文系・理系を行き来するような変化はまれなことや、外国語が苦手な場合に極端に伸びるのは少ないことなどが見て取れます。

【言語分野】では、「君台観左右帳記」の伝書解析として、文献解析学の例が示されています。芸道伝書の写本群には、複数の原本が存在しています。著者自身により複数の内容の異なる原本が制作され、原本からは転写本の系列などが生じたり、異なる原本が統合されることもあります。このような文書の系統を決める目的で、生物分野の遺伝子や化石、種の分化と同様の手法が活躍します。ここでは「君台観左右帳記」を対象として、写本群の系統分析の例が示されています。それぞれの写本への出現人物のデータを整理して、数量化III類が適用され、各写本の成立順序が分析されています。

また「学術論文数データに関する分割表の対応分析」では、国ごとの研究活動の評価のために、対応分析が使われています。研究活動の客観的評価では、学術雑誌に掲載された論文について、著者・所属国・機関・出版年・主題分類などの属性が分析されます。これらはビブリオメトリックス研究と呼ばれており、研究の客観的評価の指標の1つとて考えられています。ここでは、医学薬学の学術文献について収録論文を7つの分野に分類し、国×分野、年度×分野、年度×国の3通りの分割表をもとにした対応分析の活用例が示されています。

 

本書は、コレスポンデンス分析だけでなく、さまざまな多変量解析の実用例を、豊富な具体例とともに紹介してくれます。自分の分野に近い具体例や、学んでいる手法の様々な使い方、多変量解析の分野横断的な知見などを得ることができる1冊となっています。

 

 

 

というわけで、今回は「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊をご紹介しました。

 

 

 

 

 

こちらもございます↓

 

 

 

「アンケート調査」については、こちらの記事もどうぞ↓

「アンケート調査」をしたいあなたにチェックしてほしい良書、8冊はこちらです

 

 

その他にこちらもございます↓

「テキストマイニング」を学びたいあなたにチェックしてほしい良書、11冊はこちらです

 

「エクセル」で「データ分析」できるようになりたいあなたにチェックしてほしい良書10冊はこちらです

 

「マーケティング」のための「分析」をサクッとできるようになりたい店長さんやエリアマネージャーさんにおすすめの良書7冊はこちらです

 

 

「多変量解析」に興味がある方はこちらをどうぞ

 

「多変量解析」に関係する記事をまとめ

 

 

 

 

「自然言語処理」を学びたい人におすすめの良書、10冊はこちらです

 

「機械学習」に入門したいあなたにチェックしてほしい良書、10冊はこちらです

 

 

↓こちら無料で読めます

(Kindle Unlimited にご登録ください)