Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!

クラスタリング

おすすめ

「クラスター分析(クラスタリング)」を学びたいあなたにチェックしてほしい良書、6冊はこちらです

「クラスター分析(クラスタリング)」は、似ているもの同士をまとめて、グループ(クラスターと呼びます)にする手法の総称です。クラスタリングは、データ分析を行うときの探索的データ分析や、膨大なデータの構造を調べたいときに活躍します。クラスタリングには、階層的なもの・非階層的なもの、確率分布を用いたものなど、様々な手法があり、それぞれに長所と短所があります。そこで本記事では、クラスタリングとは?という方から、クラスタリングをサクッとできるようになりたい方や詳しく学びたいあなたのために、おすすめの良書をご紹介します。
2018.06.24
R

「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊はこちらです

「コレスポンデンス分析」とは、多次元の質的データの相関構造を調べる手法です。新しい軸を作成し、その軸を使って、データの見えにくかった特徴を明らかにすることができます。コレスポンデンス分析は、対応分析、数量化III類、双対尺度法、関連分析法などとも呼ばれ、クロス集計をよく使うアンケート調査などでも活躍します。本記事では、コレスポンデンス分析を使ってみたいあなたのために、初学者が学びやすいもの、実務でサクッと使えるもの、理論やアルゴリズムなど詳しく学べるものなど、コレスポンデンス分析を学びたいあなたのために良書、8冊をご紹介します。
2018.06.09
クラスタリング

階層的クラスター分析の「ウォード法(Ward法)」とは?そのクラスタリング・アルゴリズムなど分かりやすくまとめました

大量のデータを類似したものにグループ分けしたいときには、「クラスター分析」が役に立ちます。基本的なクラスター分析の1つに「階層的クラスタリング」がありますが、その中でおすすめなの手法に「ウォード法(Ward Method)」があります。ウォード法では、偏差平方和(へんさへいほうわ)に基づいてクラスタリングしています。ウォード法ってなに?って方からウォード法の計算方法など、中身を理解して使いたいあなたのためにアルゴリズムなど、わかりやすくまとめました。
2019.01.31
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

「クラスター分析(クラスタリング)」は、大量のデータをグループに分けることで、中身を理解しやすくするためのデータ分析手法です。クラスタリングの中で、「階層的クラスタリング」はよく使われる手法の1つです。階層的クラスタリングにはいろいろなアルゴリズムがあります。今回は「完全連結法(Complete Linkage Method)」というアルゴリズムを紹介し、最短距離法との違いなど、初学者の方が、他のクラスタリングを学ぶ際にも役に立つ情報をわかりやすくまとめました。
2019.02.01
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

クラスター分析は、大量のデータをグループ分けして中身を理解するための方法です。「階層的クラスタリング」はよく使われるクラスター分析の手法の1つで、「最短距離法(Single Linkage Method)」は他の手法を学ぶ際にも役に立ちます。クラスター分析の初学者の方でもわかりやすいように、階層的クラスタリング(最短距離法)についてまとめました
2019.02.01
アルゴリズム

「距離行列」とは?データ分析手法全般でよく使う「類似度」について学びたいあなたはこちらをどうぞ

大量の情報の中から重要な知見をみつけだす「データマイニング」では、「クラスター分析」など、情報の「グループ化」がよく使われます。クラスター分析は、データ分析の初期段階での「探索的データ分析」でも使われるので、クラスター分析をシッカリ学ぶことは「データ分析の基礎」となります。データの特徴を整理してまとめた「距離行列」とはなにか?をシッカリ理解したいあなたや「距離行列の成分」に関する2つの特徴をつかんで、大規模データでも使えるようになりたいあなたはこちらをどうぞ
2019.02.01
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

「クラスター分析」は、コンピュータを使って情報をグルーピングする手法です。大量の情報であっても整理・分類することで、わかりやすく、サクッと理解することができます。情報洪水の中から有用な情報を効率よく見つけ出したいあなたや、クラスター分析を学びたい初学者のあなたにおすすめな「クラスター分析のやり方」、3つのポイントはこちらです
2019.02.01
アルゴリズム

テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?

「素性ベクトル」の作成は、テキストマイニングの「クラスター分析」など必須です。素性ベクトルを作るには多くの方法がありますが、テキストマイニングの初学者ならまずは知っておいた方がいいものや知らないと恥ずかしいものなどがあります。本連載の第6回では素性ベクトル作成でよく使われる定番の方法についてわかりやすくご紹介します。
2019.02.01
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」を洗練する2つのテクニックとは?

「素性ベクトル(特徴ベクトル)」は、「クラスター分析」をする際に必須のデータです。データを素性ベクトルに変換してクラスター分析を行いますが、素性ベクトルへの変換には、知っておかないと失敗するテクニックがあるんです。そこでテキストマイニングなどでクラスター分析をしたいあなたのために、素性ベクトルの作成を洗練する2つのテクニックをわかりやすくまとめました
2019.02.01
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」をつくりたいあなたが知らないと損をする必須のテクニックとは?

「素性ベクトル(特徴ベクトル)」は、クラスター分析をする上で必須のデータです。テキストマイニングなどでクラスータ分析をするときには、文書データを素性ベクトルデータに変換しますが、知らないとうまくいかない、注意すべきポイントがあります。素性ベクトルを作ってクラスター分析をやってみたいあなたはこちらをどうぞ
2019.02.01
アルゴリズム

テキストマイニングなどのクラスター分析でも重要な「素性(そせい)ベクトル」を作るための3つのステップとは?

テキストマイニングなどのクラスター分析では、データをそのままグルーピングするわけではありません。データはまず「素性ベクトル」にしてから、その後クラスター分析を行います。なので、クラスター分析を行うときには、素性ベクトルを作ることは必須になります。素性ベクトルを作るため手順を、3つのステップでサクッと理解したいあなた、こちらはいかがでしょうか
2019.02.01
アルゴリズム

テキストマイニングの「クラスター分析」でも必要な「素性(そせい)ベクトル」とは?なぜ必要なの?

素性ベクトル」は、テキストマイニングのクラスター分析など様々な場面で必要となる重要な概念です。現代は情報過多の時代ですが、情報の非対称性はビジネスの競争優位やアイデアの源泉になったりします。なので、大量の情報を効率的に理解・処理することはとても役立ちます。クラスター分析ができれば、大量の情報を自動的に整理・分類でき、本質的な情報を効率的に得ることができて、うれしいですよね。クラスター分析をするならまず学ばないといけない素性ベクトルとは?なぜ必要なの?についてサクッと学びたいあなたはこちらをどうぞ
2019.02.01
アルゴリズム

「クラスター分析」とは?膨大な情報の内容を、ラク〜にサクッと理解したいあなたはこちらをどうぞ

「クラスター分析」は、情報を整理・分類するためのコンピュータアルゴリズムです。自分で読みながら、膨大な情報を整理・分類することもできますが、時間もかかるし大変ですよね。クラスター分析はコンピュータにやらせるので、サクッとラク〜に整理・分類することができます。クラスター分析は様々なデータに対して使えるので、応用範囲も広く、学んでおいて損はありません。クラスター分析とは?という初学者の方から、そのアルゴリズムや具体例など、クラスター分析をサクッと知っておきたいあなたにはこちらはいかがでしょうか
2019.02.01