階層的クラスタリング

R

「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

「データマイニング」とは、データの中から、価値ある情報や規則性を掘り出す(マイニング)技術の総称です。コンピュータやネットワークの高性能化によって、ビッグデータと言われるように、大量のデータを集めて、手軽に分析することができるようになりまし...
Java

「機械学習」に入門したいあなたにチェックしてほしい良書、10冊はこちらで

「機械学習」は、近年注目されています。機械学習は、人工知能技術の中の1つで、人工知能の進歩に大きく貢献しています。機械学習ってうわさに聞くけど、未経験だし、機械学習ってむずかしいんでしょ?数学やアルゴリズムを使いこなさないといけないの?機械...
おすすめ

「クラスター分析(クラスタリング)」を学びたいあなたにチェックしてほしい良書、6冊はこちらです

「クラスター分析(クラスタリング)」は、似ているもの同士をまとめて、グループ(クラスターと呼びます)にする手法の総称です。クラスタリングには、階層的なものや非階層的なもの、確率分布を用いたものなど、様々な手法があり、それぞれに長所と短所があ...
R

「R」で「 Webスクレイピング」や「テキストマイニング」をやりたいあなたへの実践ガイドはこちらです

質の高いデータがほしいけど、予算も時間も限られているデータは収集するだけでなく、分析して、再現可能な結果を導き、レポートにまとめたいといった悩みをもつ方も多いのではないでしょうか。Webからデータを収集(クローリング)して、必要な情報を抽出...
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

前回は、クラスター分析でよく使う「最短距離法」という階層的クラスタリングの手法についてまとめました↓第9回『「階層的クラスタリング」の「最短距離法(SingleLinkageMethod)」とは?初学者の方でもわかりやすいようにまとめました...
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

前回は、クラスター分析でよく使う「類似度」を整理整頓した「距離行列」をまとめました。↓第8回『「距離行列」とは?データ分析手法全般でよく使う「類似度」の扱いをシッカリ学びたいあなたはこちらをどうぞ』今回はクラスター分析の手順の③で、実際にク...
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

前回は、「クラスター分析」で使う素性ベクトルの(特にテキストマイニングの分野で)定番であるTF-IDF法をまとめました。第6回『テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?...