クラスタリング

R

「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

「データマイニング」とは、データの中から、価値ある情報や規則性を掘り出す(マイニング)技術の総称です。コンピュータやネットワークの高性能化によって、ビッグデータと言われるように、大量のデータを集めて、手軽に分析することができるようになりまし...
おすすめ

「クラスター分析(クラスタリング)」を学びたいあなたにチェックしてほしい良書、6冊はこちらです

「クラスター分析(クラスタリング)」は、似ているもの同士をまとめて、グループ(クラスターと呼びます)にする手法の総称です。クラスタリングには、階層的なものや非階層的なもの、確率分布を用いたものなど、様々な手法があり、それぞれに長所と短所があ...
R

「R」で「 Webスクレイピング」や「テキストマイニング」をやりたいあなたへの実践ガイドはこちらです

質の高いデータがほしいけど、予算も時間も限られているデータは収集するだけでなく、分析して、再現可能な結果を導き、レポートにまとめたいといった悩みをもつ方も多いのではないでしょうか。Webからデータを収集(クローリング)して、必要な情報を抽出...
Python

「テキストマイニング」を学びたいあなたにチェックしてほしい良書、12冊はこちらです

「テキストマイニング」とは、テキスト(文書)を分析して、新しい知見を発掘する(マイニング)技術のことです。テキストマイニングは、学術やビジネスなど、さまざまなところで応用可能です。テキストマイニングってなに?どんな仕組みになってるの?テキス...
おすすめ

「自然言語処理」を学びたい人におすすめの良書、10冊はこちらです

「自然言語処理」とは、コンピュータが言語を扱うようにするための技術の総称です。コンピュータで扱えるようになることで、大量の言語データの中から知識を獲得できる翻訳・通訳をしてくれるコンピュータと人間が自然に会話できるようになるなど、私たちの生...
クラスタリング

階層的クラスター分析の「ウォード法(Ward法)」とは?そのクラスタリング・アルゴリズムなど分かりやすくまとめました

前回は、クラスター分析でよく使う「完全連結法」という階層的クラスタリングの手法についてまとめました↓第10回『「階層的クラスタリング」の「完全連結法(CompleteLinkageMethod)」とは?初学者の方でも、わかりやすいようにまと...
Python

Pythonの基本文法から実践テクニックまでサクッと学びたいあなたはこちらをどうぞ【科学技術計算のためのPython入門】

「Python(パイソン)」は、多くの場面で活用できるプログラミング言語です。比較的記述がシンプルなのが特徴で、大学などのプログラミング教育でも積極的に取り入れられています。また、高度なライブラリをもつので、高機能なプログラムをサクッと構築...
おすすめ

「カーネル法」とは?「サポートベクターマシン」などの基礎となるカーネル法に入門したいあなたは、こちらはいかがでしょうか【カーネル多変量解析】

データ分析をしてみたいなぁデータが複雑すぎて、データ解析できない!重回帰分析だけじゃ、うまくいかないなぁ〜なんて思われた方もおられるのではないでしょうか。データ分析の手法というと、シンプルなものとして「回帰分析」があり、変数を複数扱うには「...
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

前回は、クラスター分析でよく使う「最短距離法」という階層的クラスタリングの手法についてまとめました↓第9回『「階層的クラスタリング」の「最短距離法(SingleLinkageMethod)」とは?初学者の方でもわかりやすいようにまとめました...
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

前回は、クラスター分析でよく使う「類似度」を整理整頓した「距離行列」をまとめました。↓第8回『「距離行列」とは?データ分析手法全般でよく使う「類似度」の扱いをシッカリ学びたいあなたはこちらをどうぞ』今回はクラスター分析の手順の③で、実際にク...
アルゴリズム

「距離行列」とは?データ分析手法全般でよく使う「類似度」について学びたいあなたはこちらをどうぞ

前回は、クラスター分析のやり方について3つのポイントでまとめました↓第7回『「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです』今回は、クラスター分析のやり方の2番目をさらに掘り下げようと思います。...
アルゴリズム

テキストマイニングなどのクラスター分析でも重要な「素性(そせい)ベクトル」を作るための3つのステップとは?

前回は、クラスター分析するときに必要になる「素性ベクトル(特徴ベクトル)」について、素性ベクトルとは?なぜ必要なの?をまとめました↓第2回『テキストマイニングの「クラスター分析」でも必要な「素性ベクトル」とは?なぜ必要なの?』今回は、「素性...
アルゴリズム

テキストマイニングの「クラスター分析」でも必要な「素性(そせい)ベクトル」とは?なぜ必要なの?

前回の記事で、「クラスター分析とは?」についてまとめました。クラスター分析という言葉を初めて聞いたという方クラスター分析ってどんなものなの?クラスター分析はどう役に立つの?という方は、こちらをどうぞ↓第1回『「クラスター分析」とは?膨大な情...
アルゴリズム

「クラスター分析」とは?膨大な情報の内容を、ラク〜にサクッと理解したいあなたはこちらをどうぞ

インターネットの発展に伴って、膨大な文書データが比較的手軽に入手可能になりました。情報がたくさんあることはいいことではありますが、ヒトの能力を超えた量の情報が日々生産させている中では、情報をシンプルに取捨選択することも重要です。膨大な情報を...
R

「定性的データ分析」と統計解析のフリーソフト「R」をサクッと身につけたいあなた、こちらはいかがでしょうか

最近、「ビッグデータが~」、「人工知能が〜」といったニュースをよく耳にするのではないでしょうか。じつはこういった技術の裏には、「定性的データ分析」が活躍しています。たとえば、スマホに搭載されている対話アプリだと、近所のおいしいお店を教えてく...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑮ 【要因のデータ型を調べる】

こんにちは、ミントですオブジェクトを使うと、数値や文字などを再利用することができましたオブジェクトをきちんと扱うには、オブジェクトの「データ型」を意識することが大事でした今回は、データ型を意識する例として、定性的データ(カテゴリカルデータ)...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑭ 【オブジェクトの型を学ぶ】

こんにちは、ミントです今回は、オブジェクトの「型」を学びたいと思いますオブジェクトは、計算結果などを入れておく「入れ物」でした今回の話は、入れ物になにを入れるかによって、入れ物には種類があるんだよ~って話ですこの入れ物の種類のことを「 型 ...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑬ 【Rで変数(オブジェクト)をつかってみる】

こんにちは、ミントです今回は、「R」で、「 変数、またはオブジェクト 」をつかってみたいと思いますその前に、まず変数、オブジェクトってなに?って方はこちらをどうぞ 変数 (オブジェクト) ってなに?以前の記事で、「R」で四則演算をやりました...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑫ 【日本語フォントを設定する】

こんにちは、ミントです前回までに、Rでの加減乗除やさまざまな関数を計算してきましたRの使い方には少し慣れてきたのではないでしょうか?今回は少し見方をかえてみようと思います統計解析では、データを扱いますが、データにはラベルがつけてあり、日本語...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑪ 【Rで四捨五入してみる】

こんにちは、ミントです前回までに、指数関数、対数関数、三角関数など、よくつかう関数についてやりましたこういった関数をつかって計算をすると、返ってくる値って、小数点以下の値を含んでいることが多いですよね~統計解析でも小数点以下のケタの値をきち...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑩ 【Rで三角関数を計算してみる】

こんにちは、ミントです前回は、Rで対数関数を計算してみました指数関数、対数関数とくると、次はなんでしょう?高校数学を思い出すと、もうひとつ、出てくる関数がありませんか?そうです、三角関数ですサイン・コサイン・タンジェント!と覚えたやつですね...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑨ 【Rで対数関数を計算してみる】

こんにちは、ミントです前回は、Rで指数計算をカンタンにできる指数関数の使い方をやりました指数関数とくれば、次はなんでしょう?そうです!対数関数ですね^^対数関数(底がe(ネイピア数))対数関数(底が10)というわけで、今回は「 Rで対数関数...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑧ 【Rで指数関数を計算してみる】

こんにちは、ミントです前回はRをつかって、絶対値を求めてみました絶対値を求めるための関数を呼び出すだけなので、カンタンでしたね今回は、「R」で指数関数をつかって、指数の値を求めてみたいと思います!この先は会員限定になります。会員の方はログイ...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑦ 【Rで絶対値を計算してみる】

こんにちは、ミントです前回は、Rを関数電卓のように使ってみました今回もRに最初から含まれている関数をつかって、関数の使い方になれてみましょう!Rでつかえる初等関数には、絶対値を求める関数がありますというわけで、今回は、「 Rで絶対値 」を求...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑥ 【Rを使ってみよう(関数電卓にもなるよ)】

こんにちは、ミントです前回は、「R」をふつうの電卓として使ってみましたRの操作って意外と簡単だって思われたのではないでしょうか?今回は、もう少し高度な電卓機能である、「関数」を扱う関数電卓としてRをつかってみようとおもいます統計解析では、内...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する⑤ 【Rを使ってみよう(電卓として使えるよ)】

こんにちは、ミントです前回までに、Rをインストールして、起動して終了するところまでやりました今回は、Rをつかってみましょう~ということで、カンタンな使い方として、Rを電卓として使ってみます「R」は統計解析のソフトですが、電卓としても使えるん...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する④【Rの起動と終了をできるようになろう】

こんにちは、ミントです前回までに、Rをダウンロードして、インストールまでできたと思いますじゃあいよいよインストールしたRを立ち上げて、使ってみましょう!また、終わる時にきちんとした終わり方を覚えておくとデータの損失などなくなりますというわけ...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する③【Rをインストールしよう】

こんにちは、ミントです前回「R」をダウンロードしましたRを使うには、ダウンロードだけでなく、インストールが必要ですはじめての方も1つ1つみていけばできますので、確実にインストールしていきましょう。今回はそれを、インストールしたいと思います。...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する②【Rをダウンロードしよう】

前回は、統計学がデータ活用に必須の知識ということを学びました今回は、統計解析をできるだけラクにサクッとできる方法を示します。統計分析は、データを集めて、データを整理し、そして解析、解析結果の解釈、といった流れになります。このプロセスをすべて...
R チュートリアル

統計解析フリーソフト「R」で統計学に入門する①【統計学とは?】

さいきん、こんなワードを聞かない日はないんではないでしょうか「人工知能が〜」「データ分析で〜」「ビッグデータで〜」これらは表現こそ違いますが、すべて基礎となっているのは、「統計学」なんです。「統計学」とは?学ぶメリットとは?「統計学」とは、...