ストップワード

アルゴリズム

テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」を洗練するための2つのテクニックをご紹介しました。 第5回『クラスター分析で必要な「素性ベクトル」を洗練する2つのテクニックとは?』 (他の過去記事は下にございます) 今...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」を洗練する2つのテクニックとは?

前回は、クラスター分析で必要な素性ベクトル(特徴ベクトル)をつくる際のポイント 「表記ゆれ」 と、それを解決するアルゴリズムである 「ステミング」 をご紹介しました↓ 第4回『テキストマイニングなどのクラスター分析で必要な「素性ベクトル」を...