階層的クラスタリング

R

「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

「データマイニング」とは、データの中から、 価値ある情報や規則性を掘り出す(マイニング)技術の総称です。 コンピュータやネットワークの高性能化によって、 ビッグデータと言われるように、大量のデータを集めて、 手軽に分析することができるように...
Java

「機械学習」に入門したいあなたにチェックしてほしい良書、10冊はこちらで

「機械学習」は、近年注目されています。 機械学習は、人工知能技術の中の1つで、人工知能の進歩に大きく貢献しています。 機械学習ってうわさに聞くけど、未経験だし、 機械学習ってむずかしいんでしょ? 数学やアルゴリズムを使いこなさないといけない...
おすすめ

「クラスター分析(クラスタリング)」を学びたいあなたにチェックしてほしい良書、6冊はこちらです

「クラスター分析(クラスタリング)」は、似ているもの同士をまとめて、グループ(クラスターと呼びます)にする手法の総称です。 クラスタリングには、階層的なものや非階層的なもの、確率分布を用いたものなど、様々な手法があり、それぞれに長所と短所が...
R

「R」で「 Webスクレイピング」や「テキストマイニング」をやりたいあなたへの実践ガイドはこちらです

質の高いデータがほしいけど、予算も時間も限られている データは収集するだけでなく、分析して、再現可能な結果を導き、レポートにまとめたい といった悩みをもつ方も多いのではないでしょうか。 Webからデータを収集(クローリング)して、必要な情報...
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

前回は、クラスター分析でよく使う「最短距離法」という階層的クラスタリングの手法についてまとめました↓ 第9回『「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめ...
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

前回は、クラスター分析でよく使う「類似度」を整理整頓した「距離行列」をまとめました。↓ 第8回『「距離行列」とは?データ分析手法全般でよく使う「類似度」の扱いをシッカリ学びたいあなたはこちらをどうぞ』 今回はクラスター分析の手順の③で、 実...
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

前回は、「クラスター分析」で使う素性ベクトルの(特にテキストマイニングの分野で)定番であるTF-IDF法をまとめました。 第6回『テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは...