さいきん、こんなワードを聞かない日はないんではないでしょうか
「人工知能が〜」
「データ分析で〜」
「ビッグデータで〜」
これらは表現こそ違いますが、
すべて基礎となっているのは、「統計学」なんです。
本記事の概要
「統計学」とは?学ぶメリットとは?
「統計学」とは、データの中から有益な知見や法則性を見つけ出すための方法の集合のことです。
統計学というのは、
- データを整理・要約
- データのもつ特徴や傾向、確率
などを調べるマニュアル、といえます。
統計分析によって、
データに潜む「意味のある法則や知見」を見つけれる、というわけです。
そして、統計学は、さまざまな分野で使われています。例えば
- 天文学では、星間の位置関係の誤差を見積もる
- 農学では、作物の収量を予測する
その他にも生物学、心理学、経済学、社会学など、
ほとんどすべての学問において、統計学が活躍しています
「統計学」は、人工知能・データ分析・ビッグデータなどの基礎なんです
「人工知能」では、統計学を活用して精度を高めます
人工知能には、学習するプロセスがあります。
学習することによって、人工知能が画像を認識したり、音声を聞き分けたりできるようになります。
この学習のプロセスでは、大量のデータが使われます。
この大量のデータは、統計学を基礎とした数学的理論にもとづいて、
人工知能を改良していきます。
そして最終的に、人間が望むような性能を示すように訓練されていきます。
つまり、人工知能の性能を上げたければ、統計学を活用する必要がある、ってことなんです。
「データ分析」とは、データから役に立つ知見を見いだす方法論です
データ分析は、統計分析や統計解析など似た意味で使われます。
統計学もデータから役立つ知見を見出す方法で、データ分析と似ていますよね。
統計学とデータ分析の違いは、
統計学は学問的なルーツを持つワードで、
データ分析は統計学に基づいてビジネス応用に結びつけたようなワードのようなイメージを(個人的には)持っています。
データ分析では、対象がビジネス分野であり、統計学はアカデミックに近い感覚です。
つまり、ビジネス応用をやっていきたいあなたは、
データ分析を学ぶのが効率的ですが、
その際にも、統計学が基礎となっている、というわけです。
「ビッグデータ」とは、非常に膨大なデータのこと
大量のデータ(ビッグデータ)を収集できるようになり、
それらを活かせるかどうかが、企業の競争優位性の源泉になっています。
統計学を用いるときには、データが多ければ多いほど、より正確に予測することができる、という特徴があります。
ビッグデータの時代になって、ビジネスに役立つ精度の知見が、得られるようになってきたわけです。
たとえば、ネットショッピングなどでは、いままでわからなかった、ヒトの購買特性などを、統計学を基礎とした数学的手法によって、見いだすことができるようになってきています。
つまり、ビッグデータが得られる環境になったことで
統計学が活きる場面が、ビジネス分野にも広がってきたわけです。
しかし、気をつけてほしいこともあります
それは、データは集まっても、統計解析ソフトを使っても、その結果をつかって、最終的に判断するのは人間です。
つまり、判断するときに重要なのが「統計学」の知識、というわけです
統計学を学ぶのに、教科書等をしっかり読むのは重要です。
しかし、実務では、
- 結果を分析する、
- 新しい施策を試す
- 結果を分析する
- 新しい施策を試す
・・・・
というように、動きながら学ぶのが重要かと思います。
その際に重要なのが、「効率的な分析」かと思います。
統計学ではデータから複雑な計算を行って、何らかの結果を出しますが、
その複雑な計算は、ソフトに任せることができます。
ソフトに任せることで、複雑なデータ分析をサクッとできるわけです。
ここでは、優秀な統計ソフトの「R」について、
そのやり方をわかりやすく紹介していきたいと思います。
「R」は、無料で使えるのに多機能で、
世界中の研究者やビジネスパーソンが使っている、信頼できるフリーソフトです。
一度、使い方を覚えてしまうことで、
最先端のアルゴリズムをサクッと使えてしまうのがすごいところです。
この機会にぜひチャレンジしてみてください