クラスター分析

クラスター分析

【クラスタリング ツール】 データ分析のための人気クラスタリングツール17選

近年、データ主導で意思決定を支援する動きが加速しています。 クラスタリングツールの重要性は、大規模なデータセットを分析し、隠れたパターンを明らかにするためにも増しています。 本記事では、あなたの競争力を高めるために使用を検討すべき重要なクラ...
R

「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

「データマイニング」とは、データの中から、 価値ある情報や規則性を掘り出す(マイニング)技術の総称です。 コンピュータやネットワークの高性能化によって、 ビッグデータと言われるように、大量のデータを集めて、 手軽に分析することができるように...
おすすめ

「クラスター分析(クラスタリング)」を学びたいあなたにチェックしてほしい良書、6冊はこちらです

「クラスター分析(クラスタリング)」は、似ているもの同士をまとめて、グループ(クラスターと呼びます)にする手法の総称です。 クラスタリングには、階層的なものや非階層的なもの、確率分布を用いたものなど、様々な手法があり、それぞれに長所と短所が...
アンケート

「重回帰分析」を学びたいあなたにチェックしてほしい良書、10冊はこちらです

「重回帰分析」は、複数のデータ項目(変数・変量)から、なんらかの変量に影響の大きい変量を調べたり、興味ある変量の予測式を求めたりできる手法です。 具体的には、重回帰分析では、データ内の1つの変量に着目し、その変量を残りの変量を用いて(おもに...
おすすめ

「判別分析」を学びたいあなたにチェックしてほしい良書、10冊+α はこちらです

「判別分析」とは、グループ分けされたデータを基に、新しいデータがどのグループに属するかを決める手法です。 判別分析は、1936年のフィッシャーの線形判別関数による論文以降、 機械学習 統計的学習理論 データマイニング パターン認識 ニューラ...
R

「コレスポンデンス分析」を学びたいあなたにチェックしてほしい良書、9冊はこちらです

「コレスポンデンス分析(対応分析)」とは、ザックリ言うと、データの軸を変えて、別の見方をする方法です。 データを別の視点でみることによって、そのデータの新たな一面を知りたい、というときに役立つ手法といえます。 少し詳しくいうと、コレスポンデ...
R

「主成分分析」を学びたいあなたにチェックしてほしい良書、12冊はこちらです

「主成分分析」とは、データの見方を変える方法です。 といっても、データのもつ情報が減ってしまったらもったいないですよね。 なので、 主成分分析は、元のデータがもつ情報を最大限に維持した上で、 扱いやすい別の見方を与えてくれる方法になります。...
アンケート

「アンケート調査」をしたいあなたにチェックしてほしい良書、9冊はこちらです

「アンケート調査」は、質問への回答を「集計・分析」して、有用な知見を見いだすための活動です。 アンケート調査には、スーパーのお客様満足度アンケート調査などの、身近なアンケート調査もあり、「顧客のホンネ」を知りたいときなどに使える方法です。 ...
R

「R」で「 Webスクレイピング」や「テキストマイニング」をやりたいあなたへの実践ガイドはこちらです

質の高いデータがほしいけど、予算も時間も限られている データは収集するだけでなく、分析して、再現可能な結果を導き、レポートにまとめたい といった悩みをもつ方も多いのではないでしょうか。 Webからデータを収集(クローリング)して、必要な情報...
Python

「テキストマイニング」を学びたいあなたにチェックしてほしい良書、12冊はこちらです

「テキストマイニング」とは、テキスト(文書)を分析して、新しい知見を発掘する(マイニング)技術のことです。 テキストマイニングは、学術やビジネスなど、さまざまなところで応用可能です。 テキストマイニングってなに? どんな仕組みになってるの?...
おすすめ

「多変量解析」を独学したいあなたにチェックしてほしい良書、12冊はこちらです

「多変量解析」は、複雑な現実世界のデータから、わたしたちにとって分かりやすい情報を抽出するための分析手法です。 多変量解析は、学術分野だけでなく、ビジネスの世界でも役に立ちます。 近年、大量のデータを集めるのが容易になり、データの中から競争...
エクセル

「多変量解析」を「エクセル」でサクッと実行したいあなたにおすすめの良書、9冊はこちらです

「多変量解析」とは、多くの変数で表現されたデータから、ヒトにとってわかりやすい情報や知識をあぶりだす方法の1つです。 近年データを集めることが容易になりましたが、大量のデータがあるだけでは価値はありません。 実際にビジネスで応用されているよ...
データ分析

「多変量解析」とは?多変量解析に入門したいあなたが最初に読んでおくとよい、おすすめ本はこちらです【多変量解析のはなし】

世の中には複雑でサクッと理解できないことがたくさんあります。 例えばあなたがスーパーの店長だとして、 「お店の商品を、どのように陳列すれば売上が高くなるだろう?」 といった疑問を考えてみます。 多くの要素が絡み合って複雑 多くの可能性がある...
クラスタリング

階層的クラスター分析の「ウォード法(Ward法)」とは?そのクラスタリング・アルゴリズムなど分かりやすくまとめました

前回は、クラスター分析でよく使う「完全連結法」という階層的クラスタリングの手法についてまとめました↓ 第10回『「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいよう...
おすすめ

「マーケティング」のための「分析」をサクッとできるようになりたい店長さんやエリアマネージャーさんにおすすめの良書7冊はこちらです

「マーケティング」に「分析」を活かせれば、 業績向上や、ライバル他社との差別化をはかることができます。 ひとことでマーケティングといっても、非常に幅広い内容を含んでいます。 ここでは、店長さんやエリアマネージャーさんなどが、 ご希望の成果を...
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

前回は、クラスター分析でよく使う「最短距離法」という階層的クラスタリングの手法についてまとめました↓ 第9回『「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめ...
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

前回は、クラスター分析でよく使う「類似度」を整理整頓した「距離行列」をまとめました。↓ 第8回『「距離行列」とは?データ分析手法全般でよく使う「類似度」の扱いをシッカリ学びたいあなたはこちらをどうぞ』 今回はクラスター分析の手順の③で、 実...
アルゴリズム

「距離行列」とは?データ分析手法全般でよく使う「類似度」について学びたいあなたはこちらをどうぞ

前回は、クラスター分析のやり方について3つのポイントでまとめました↓ 第7回『「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです』 今回は、クラスター分析のやり方の2番目をさらに掘り下げようと思いま...
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

前回は、「クラスター分析」で使う素性ベクトルの(特にテキストマイニングの分野で)定番であるTF-IDF法をまとめました。 第6回『テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは...
アルゴリズム

テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」を洗練するための2つのテクニックをご紹介しました。 第5回『クラスター分析で必要な「素性ベクトル」を洗練する2つのテクニックとは?』 (他の過去記事は下にございます) 今...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」を洗練する2つのテクニックとは?

前回は、クラスター分析で必要な素性ベクトル(特徴ベクトル)をつくる際のポイント 「表記ゆれ」 と、それを解決するアルゴリズムである 「ステミング」 をご紹介しました↓ 第4回『テキストマイニングなどのクラスター分析で必要な「素性ベクトル」を...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」をつくりたいあなたが知らないと損をする必須のテクニックとは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」の作り方をまとめました。 第3回『テキストマイニングなどのクラスター分析でも重要な「素性ベクトル」を作るための3つのステップとは?』 (それ以外の過去記事は、下にございま...
アルゴリズム

テキストマイニングなどのクラスター分析でも重要な「素性(そせい)ベクトル」を作るための3つのステップとは?

前回は、クラスター分析するときに必要になる「素性ベクトル(特徴ベクトル)」について、素性ベクトルとは?なぜ必要なの?をまとめました↓ 第2回『テキストマイニングの「クラスター分析」でも必要な「素性ベクトル」とは?なぜ必要なの?』 今回は、「...
アルゴリズム

テキストマイニングの「クラスター分析」でも必要な「素性(そせい)ベクトル」とは?なぜ必要なの?

前回の記事で、「クラスター分析とは?」についてまとめました。 クラスター分析という言葉を初めて聞いたという方 クラスター分析ってどんなものなの? クラスター分析はどう役に立つの? という方は、こちらをどうぞ↓ 第1回『「クラスター分析」とは...
アルゴリズム

「クラスター分析」とは?膨大な情報の内容を、ラク〜にサクッと理解したいあなたはこちらをどうぞ

インターネットの発展に伴って、膨大な文書データが比較的手軽に入手可能になりました。 情報がたくさんあることはいいことではありますが、 ヒトの能力を超えた量の情報が日々生産させている中では、情報をシンプルに取捨選択することも重要です。 膨大な...
おすすめ

「統計学」を「ビジネス」に活かしたいけど、どの本で学べばいいの?ってあなた、こちらはいかがでしょうか

ビジネスに統計学を取り入れたいんだけど、どうしたらいいんだろう? って思われるビジネスパーソンは多いのではないでしょうか。 本屋で統計学の本をみてみても、 どれを選んだらいいのかわからない 数式がたくさん出ていて意味がわからない 統計処理の...
R

「定性的データ分析」と統計解析のフリーソフト「R」をサクッと身につけたいあなた、こちらはいかがでしょうか

最近、「ビッグデータが~」、「人工知能が〜」といったニュースをよく耳にするのではないでしょうか。 じつはこういった技術の裏には、「定性的データ分析」が活躍しています。 たとえば、スマホに搭載されている対話アプリだと、 近所のおいしいお店を教...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑮ 【要因のデータ型を調べる】

こんにちは、ミントです オブジェクトを使うと、数値や文字などを再利用することができました オブジェクトをきちんと扱うには、オブジェクトの「データ型」を意識することが大事でした 今回は、データ型を意識する例として、定性的データ(カテゴリカルデ...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑭ 【オブジェクトの型を学ぶ】

こんにちは、ミントです 今回は、オブジェクトの「型」を学びたいと思います オブジェクトは、計算結果などを入れておく「入れ物」でした 今回の話は、入れ物になにを入れるかによって、入れ物には種類があるんだよ~って話です この入れ物の種類のことを...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑬ 【Rで変数(オブジェクト)をつかってみる】

こんにちは、ミントです 今回は、「R」で、「 変数、またはオブジェクト 」をつかってみたいと思います その前に、まず変数、オブジェクトってなに?って方はこちらをどうぞ   変数 (オブジェクト) ってなに? 以前の記事で、「R」で四則演算を...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑫ 【日本語フォントを設定する】

こんにちは、ミントです 前回までに、Rでの加減乗除やさまざまな関数を計算してきました Rの使い方には少し慣れてきたのではないでしょうか? 今回は少し見方をかえてみようと思います 統計解析では、データを扱いますが、データにはラベルがつけてあり...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑪ 【Rで四捨五入してみる】

こんにちは、ミントです 前回までに、指数関数、対数関数、三角関数など、よくつかう関数についてやりました こういった関数をつかって計算をすると、返ってくる値って、小数点以下の値を含んでいることが多いですよね~ 統計解析でも小数点以下のケタの値...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑩ 【Rで三角関数を計算してみる】

こんにちは、ミントです 前回は、Rで対数関数を計算してみました 指数関数、対数関数とくると、次はなんでしょう? 高校数学を思い出すと、もうひとつ、出てくる関数がありませんか? そうです、三角関数です サイン・コサイン・タンジェント!と覚えた...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑨ 【Rで対数関数を計算してみる】

こんにちは、ミントです 前回は、Rで指数計算をカンタンにできる指数関数の使い方をやりました 指数関数とくれば、次はなんでしょう? そうです!対数関数ですね^^ 対数関数(底がe(ネイピア数)) 対数関数(底が10) というわけで、今回は「 ...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑧ 【Rで指数関数を計算してみる】

こんにちは、ミントです 前回はRをつかって、絶対値を求めてみました 絶対値を求めるための関数を呼び出すだけなので、カンタンでしたね 今回は、「R」 で 指数関数 をつかって、指数の値を求めてみたいと思います! この先は会員限定になります。 ...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑦ 【Rで絶対値を計算してみる】

こんにちは、ミントです 前回は、Rを関数電卓のように使ってみました 今回もRに最初から含まれている関数をつかって、関数の使い方になれてみましょう! Rでつかえる初等関数には、 絶対値を求める関数 があります というわけで、今回は、「 Rで絶...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑥ 【Rを使ってみよう(関数電卓にもなるよ)】

こんにちは、ミントです 前回は、「R」をふつうの電卓として使ってみました Rの操作って意外と簡単だって思われたのではないでしょうか? 今回は、もう少し高度な電卓機能である、「関数」を扱う関数電卓としてRをつかってみようとおもいます 統計解析...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑤ 【Rを使ってみよう(電卓として使えるよ)】

こんにちは、ミントです 前回までに、Rをインストールして、起動して終了するところまでやりました 今回は、Rをつかってみましょう~ということで、カンタンな使い方として、Rを電卓として使ってみます 「R」は統計解析のソフトですが、電卓としても使...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する④【Rの起動と終了をできるようになろう】

こんにちは、ミントです 前回までに、Rをダウンロードして、インストールまでできたと思います じゃあいよいよインストールしたRを立ち上げて、使ってみましょう! また、終わる時にきちんとした終わり方を覚えておくとデータの損失などなくなります と...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する③【Rをインストールしよう】

こんにちは、ミントです 前回「R」をダウンロードしました Rを使うには、ダウンロードだけでなく、インストールが必要です はじめての方も1つ1つみていけばできますので、確実にインストールしていきましょう。 今回はそれを、インストールしたいと思...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する②【Rをダウンロードしよう】

前回は、統計学がデータ活用に必須の知識ということを学びました 今回は、統計解析をできるだけラクにサクッとできる方法を示します。 統計分析は、データを集めて、データを整理し、そして解析、解析結果の解釈、といった流れになります。このプロセスをす...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する①【統計学とは?】

さいきん、こんなワードを聞かない日はないんではないでしょうか 「人工知能が〜」 「データ分析で〜」 「ビッグデータで〜」 これらは表現こそ違いますが、 すべて基礎となっているのは、「統計学」なんです。 「統計学」とは?学ぶメリットとは? 「...