コサイン類似度

アルゴリズム

「距離行列」とは?データ分析手法全般でよく使う「類似度」について学びたいあなたはこちらをどうぞ

前回は、クラスター分析のやり方について3つのポイントでまとめました↓第7回『「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです』今回は、クラスター分析のやり方の2番目をさらに掘り下げようと思います。...
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

前回は、「クラスター分析」で使う素性ベクトルの(特にテキストマイニングの分野で)定番であるTF-IDF法をまとめました。第6回『テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」を洗練する2つのテクニックとは?

前回は、クラスター分析で必要な素性ベクトル(特徴ベクトル)をつくる際のポイント「表記ゆれ」と、それを解決するアルゴリズムである「ステミング」をご紹介しました↓第4回『テキストマイニングなどのクラスター分析で必要な「素性ベクトル」をつくりたい...