クラスタリング

おすすめ

「クラスター分析(クラスタリング)」を学びたいあなたにチェックしてほしい良書、6冊はこちらです

「クラスター分析(クラスタリング)」は、似ているもの同士をまとめて、グループ(クラスターと呼びます)にする手法の総称です。クラスタリングには、階層的なものや非階層的なもの、確率分布を用いたものなど、様々な手法があり、それぞれに長所と短所があ...
R

「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊はこちらです

「コレスポンデンス分析(対応分析)」とは、ザックリ言うと、データの軸を変えて、別の見方をする方法です。データを別の視点でみることによって、そのデータの新たな一面を知りたい、というときに役立つ手法といえます。少し詳しくいうと、コレスポンデンス...
クラスタリング

階層的クラスター分析の「ウォード法(Ward法)」とは?そのクラスタリング・アルゴリズムなど分かりやすくまとめました

前回は、クラスター分析でよく使う「完全連結法」という階層的クラスタリングの手法についてまとめました↓第10回『「階層的クラスタリング」の「完全連結法(CompleteLinkageMethod)」とは?初学者の方でも、わかりやすいようにまと...
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

前回は、クラスター分析でよく使う「最短距離法」という階層的クラスタリングの手法についてまとめました↓第9回『「階層的クラスタリング」の「最短距離法(SingleLinkageMethod)」とは?初学者の方でもわかりやすいようにまとめました...
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

前回は、クラスター分析でよく使う「類似度」を整理整頓した「距離行列」をまとめました。↓第8回『「距離行列」とは?データ分析手法全般でよく使う「類似度」の扱いをシッカリ学びたいあなたはこちらをどうぞ』今回はクラスター分析の手順の③で、実際にク...
アルゴリズム

「距離行列」とは?データ分析手法全般でよく使う「類似度」について学びたいあなたはこちらをどうぞ

前回は、クラスター分析のやり方について3つのポイントでまとめました↓第7回『「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです』今回は、クラスター分析のやり方の2番目をさらに掘り下げようと思います。...
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

前回は、「クラスター分析」で使う素性ベクトルの(特にテキストマイニングの分野で)定番であるTF-IDF法をまとめました。第6回『テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?...
アルゴリズム

テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」を洗練するための2つのテクニックをご紹介しました。第5回『クラスター分析で必要な「素性ベクトル」を洗練する2つのテクニックとは?』(他の過去記事は下にございます)今回は、...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」を洗練する2つのテクニックとは?

前回は、クラスター分析で必要な素性ベクトル(特徴ベクトル)をつくる際のポイント「表記ゆれ」と、それを解決するアルゴリズムである「ステミング」をご紹介しました↓第4回『テキストマイニングなどのクラスター分析で必要な「素性ベクトル」をつくりたい...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」をつくりたいあなたが知らないと損をする必須のテクニックとは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」の作り方をまとめました。第3回『テキストマイニングなどのクラスター分析でも重要な「素性ベクトル」を作るための3つのステップとは?』(それ以外の過去記事は、下にございます)...
アルゴリズム

テキストマイニングなどのクラスター分析でも重要な「素性(そせい)ベクトル」を作るための3つのステップとは?

前回は、クラスター分析するときに必要になる「素性ベクトル(特徴ベクトル)」について、素性ベクトルとは?なぜ必要なの?をまとめました↓第2回『テキストマイニングの「クラスター分析」でも必要な「素性ベクトル」とは?なぜ必要なの?』今回は、「素性...
アルゴリズム

テキストマイニングの「クラスター分析」でも必要な「素性(そせい)ベクトル」とは?なぜ必要なの?

前回の記事で、「クラスター分析とは?」についてまとめました。クラスター分析という言葉を初めて聞いたという方クラスター分析ってどんなものなの?クラスター分析はどう役に立つの?という方は、こちらをどうぞ↓第1回『「クラスター分析」とは?膨大な情...
アルゴリズム

「クラスター分析」とは?膨大な情報の内容を、ラク〜にサクッと理解したいあなたはこちらをどうぞ

インターネットの発展に伴って、膨大な文書データが比較的手軽に入手可能になりました。情報がたくさんあることはいいことではありますが、ヒトの能力を超えた量の情報が日々生産させている中では、情報をシンプルに取捨選択することも重要です。膨大な情報を...