「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

datamining recommended books R

「データマイニング」とは、データの中から、

価値ある情報や規則性を掘り出す(マイニング)技術の総称です。

 

コンピュータやネットワークの高性能化によって、

ビッグデータと言われるように、大量のデータを集めて、

手軽に分析することができるようになりました。

また、最近は人工知能との関わりで、再び注目されています。

 

データマイニングは、やろうと思えば誰でも実行できる技術となっています。

 

実際に、データマイニングの具体例はたくさんあります。

個人での応用例としては、金融分野(株価やビットコインの価格予測など)や、スポーツや競馬の予測などで活用されています。

 

 

もちろん、ビジネスに活かすこともできます。

データ分析の結果を活かして、

  • 売上をアップ
  • 新製品の開発のヒントを得る
  • マーケティングに活用する

といった応用が可能です。

 

  • データマイニングのツールソフトにはどんなものがあるの?フリーソフトがあればうれしいなぁ
  • データマイニングの手法事例にはどんなものががあるんだろう
  • データマイニングを勉強したいんけどおすすめな本ってあるのかな?

なんて思われる方も多いのではないでしょうか。

 

そこで本記事では、

  • データマイニングとは?といった初学者の方、
  • ビジネスでサクッと活用したい方、
  • 専門書や論文などを理解できるようになりたいあなた

のために、データマインニングをサクッと勉強できる、おすすめの良書、11冊をご紹介します。

 

本記事の概要

「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

 

データマイニングを、数式なしでサクッと概観したいならこちら

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

本書は、データマイニングとは?というところから、数式を使わずに、何ができて、どんな手法があり、どんな活用例があるのかなど、全体像をサクッとつかめる1冊です。

データマイニングと統計処理はどう違うのか?や、ビジネスでの活用には、商圏を調べたり、顧客の傾向を知るといった事例が解説されています。また、データマイニングの手順の解説や、異常値や仮説の限界などの分析を行う上での注意点も示されています。

加えて、データマイニングの手法として、回帰分析、決定木、クラスタ-分析、自己組織化マップ、連関規則、ニューラルネットなどが紹介されています。

データマイニングから得られた結果にどんな意味を持たせるかは、人間次第という点も触れられており、結果をキチンと解釈するには、データマイニングのしくみを理解しておく必要がある点が明記されています。

本書は、データマイニングの全体像をサクッとつかめる入門書となっています。

 

 

 

 

 

 

データマイニングの全体像を、サクッとつかみたいならこちら

金鉱を掘り当てる統計学―データマイニング入門 (ブルーバックス)

本書はデータマイニングの全体像を、わかりやすい具体例とともに理解されてくれる1冊です。

データマイニングは、統計学と関わりが深いです。本書は(出版当時)の統計学の使われ方の空気感が歴史の流れとともにまとめられ、その中でのデータマイニングの位置づけが理解できます。

その後データマイニング全般について、非線形・視覚化・交差妥当化・最適性・一意性のなさなどの概念がわかりやすく説明されています。またデータウェアハウスについても、基本的性質からデータの準備について、データの選択・再集計・洗浄・補強・コード化といった内容がサクッとまとめらえています。人工知能や機械学習エンジニアの方にも必須の知識となっています。

その後、具体的な手法の解説がされています。

手法はニューラルネット、人工知能、自己組織化マップ、連関規則などが扱われています。それぞれ具体例が豊富にあり、初学者の方でも理解しやすい内容に工夫されています。

数式がほとんどなく、あっても高校数学で理解できるようになっています。

データマイニングの初学者の方が、専門的な入門書を読む前にサクッと目を通しておくと、その後の学びが加速する1冊となっています。

同著者のこちらもございます↓

 

 

 

 

 

データマイニングを、基礎から勉強できる、入門的な教科書はこちら

データマイニングの基礎 (IT Text)

本書は、データマイニングの教科書として、大学学部の授業企業の研修でもシッカリ使える1冊です。データマイニングの要素技術としては、統計学や機械学習の手法が使われていますが、本書ではあくまでデータマイニングを中心として解説がなされているところが特徴の1つです。

本書は、データマイニングとは?からはじまり、知識発見、知識獲得から、統計や機械学習とはどんな関係なのか?といったことが解説されています。

次にデータマイニングの基本的な手法として、初学者の方がまず理解してほしい、決定木、ルール、ナイーブベイズ、最近傍法、相関ルールが解説されています。

その後、より高度な手法である、アンサンブル学習、クラスタリング、サポートベクトルマシン、帰納論理プログラミングの説明があります。これらの手法を使うことで、分類精度を高める、分類以外の問題を扱う、背景知識を利用する、属性が多い場合に対処する、といったことができるメリットが述べられています。

次に、データマイニングを縁の下で支えている、データの前処理データ変換、数値属性の離散化属性選択、抽出、構築、事例選択などの手法が解説されています。

そして結果の解釈のしかたを統計的検定の知識を交えながら説明がされ、実際のデータマイニングの業務を成功させるために気をつけることなど、実務で役立つ内容がまとめられています。

最後に付録として、データマイニングのオープンソースである、フリーソフトWekaが紹介されています。

数式や疑似コードなども出てきますが、図や表などとともに、日本語でシッカリとわかりやすく解説されているので、初学者の方でも理解しやすく工夫されているのがうれしいところです。

本書は、データマイニングの教科書として、基礎からシッカリ学びたいあなたにおすすめの1冊となっています。

 

 

 

 

応用事例とともに、数理的な面もキチンと勉強したいならこちら

データマイニングとその応用 (シリーズ・オペレーションズ・リサーチ)

本書は、データマイニングについて、基本概念や代表的手法を学べるのはもちろんのこと、具体的な応用事例が豊富に示されているのが特徴的な1冊です。

具体的には、知識発見はどのようなプロセスで行われるのか?からはじまり、相関ルール(Apriori や深さ優先探索、パターンの縮約やグラフマイニング)、分類(離反顧客分類モデル、決定木、ベイズ分類やニューラルネットワーク、サポートベクターマシーン、重回帰分析、サポートベクターマシーン回帰など)、クラスタリング(k-means 法や階層的クラスタリング)などの手法が具体例とともに説明されています。

応用事例として、焼き肉店の注文データ、レセプトデータ、紙おむつのブランドロイヤリティ測定、オフィスビルの感性評価を考慮した賃料予測モデルなどがあり、グラフマイニングの応用事例として、室配置を考慮した賃料分析があります。それぞれ背景、分析データ、分析結果、その解釈、といった一連の流れが示してあるので、自社や自分のデータを分析する際にも参考にしやすいのではないでしょうか。

オペレーショナルリサーチの分野からの出版で、前提知識として、データ構造、データベース、アルゴリズム、数理計画、数理統計などの知識が一部必要になる部分がある点にお気をつけください。

本書は、大学学部レベルの数学と情報科学的な知識のある方が、データマイニングの事例をみながら、理論的な部分も学べる1冊となっています。

 

 

 

 

 

 

 

 

「ソフト」や「ツール」を使って、データマイニングをサクッと実行できるようになりたいあなたはこちら

Excel (エクセル)で、手を動かしながら勉強できる1冊

Excelで学ぶデータマイニング入門

本書は、データマイニングについて、Excel で手を動かしながら学べる1冊です。

データマイニングというと難しいイメージがあるかもしれませんが、本書では数式などによる説明でなく、具体的な事例を使って、実際にデータマイニングしながら解説がされていきます。こんなデータをデータマイニングすると、こんな結果が出るんだ、ということを肌で感じながら学べます。

複雑な計算は、Excel の5大機能(関数、グラフ、分析ツール、ピボットテーブル、ソルバー)を使って解決していきますので、初学者の方でもプログラミングの必要がありません。

具体的な事例としては、アンケート調査結果、中古車価格の予測(回帰分析)、(経営などの課題の)最適化問題(ソルバー)、クロス表の解析、ヒット商品のコンセプトの開発(コンジョイント分析)、ソフトウェアのバグの収束(成長曲線モデル)、株の最適ポートフォリオなどを使って学ぶことができます。どれも身近な話題で、取り組みやすいのではないでしょうか。

本書では、エクセルを使って、データマイニングでどんなことができるか、手を動かしながら学べる1冊となっています。

 

 

 

 

 

「SPSS」(とエクセル)のやり方とともに、データマイニングをわかりやすく理解できる本はこちら

多変量解析によるデータマイニング

本書は、データマイニングをSPSSで実行したいあなたが、SPSS がはじめてでもできるように、わかりやすく解説された1冊です。

データマイニングは目的別には(おおまかに)、①予測モデルをつくる、②特徴的なパターンを発見する、③分類する(クラスタリング)の3つがあります。本書では、①についてニューラルネットワーク、決定木、回帰分析、曲線推定、ロジスティック回帰分析、判別分析、エキスパートモデラーを、②について相関分析、コレスポンデンス分析、多重応答分析、コンジョイント分析を、③についてクラスター分析、主成分分析を取り上げています。これら13の手法について、SPSS と Excel を用いた分析手順が、画面のスクリーンショットなど、図やイラストなどとともに丁寧にわかりやすく説明されています。

サクッと理解でき、報告書や論文作成をスムーズに行いたいいあなたにおすすめの1冊となっています。

 

 

 

 

 

 

データマイニングを「R」で、サクッとできるようになりたいならこちら

データマイニング入門

本書は、オープンソース統計解析ソフト「R」を使ったデータマイニングを行いたい方が、身近な例を使いながら、手を動かしながら勉強できる本となっています。

本書は、”金鉱を掘り当てる統計学”がベースになっており、そこでも解説のあった、ニューラルネット、決定木、自己組織化マップ、連関規則、クラスター分析のわかりやすい解説に加え、サポートベクターマシン、ベイジアンネット、潜在意味解析などの手法もわかりやすい解説と、身近な具体例データのRによる分析実習を行うことができます。

ニューラルネットによる偽札の見分けや在庫管理、決定木による不動産の鑑定、自己組織化マップによる小売業の特徴マップ、連関規則によるシングルモルトウイスキーの分析、クラスター分析による居酒屋メニューの分類、ベイジアンネットワークによる低出生体重児に関する医療データの分析、サポートベクターマシンによる偽札データの分析などなど、身近な例をつかって、Rを動かしながら、学ぶことが可能です。Rを使ったことない方向けに、Rの使い方の解説もされているのもうれしいところです。

数式による数理的な解説というよりも、図やイラストなどを使ったわかりやすい解説を読んだら、Rを使って実際に分析しながら勉強をすすめていくように作られています。

Rによるデータマイニングを、身近な例を使って、手を動かしながら勉強したいあなたにおすすめの書籍となっています。

 

 

 

 

 

 

 

データマインニングをビジネスに応用したいあなたにおすすめの本はこちら

データマイニングの「手法」について、具体的なビジネス応用を見据えて勉強できる本はこちら

データマイニング手法 予測・スコアリング編―営業、マーケティング、CRMのための顧客分析

本書は目的が定まっている問題で活躍するデータマイニング手法(決定木、人工ニューラルネットネットワーク、最近傍アプローチ、記憶ベース推論、協調フィルタリング、生存分析など)の解説がビジネスに関係の深いケーススタディとともにまとめられています。

どの顧客が立ち止りそうか?顧客が次回購入するのはいつか?それぞれの顧客にとって最良の提案はどんなものだろうか?優良顧客をみつけだすには?のような、ビジネスで悩みとなりやすい問題をデータマイニングで解決したいあなたにおすすめの本となっています。

 

 

 

データマイニング手法 探索的知識発見編―営業、マーケティング、CRMのための顧客分析

本書は、上の「予測・スコアリング編」の姉妹書で、探索的知識発見となっています。予測・スコアリング編では、目的や問題・課題がはっきりしている悩みについてのデータマイニングの活用でした。

それに対して、探索的知識発見では、まだ認識されていない問題を発見したり、問題がデータからシンプルに定式化できない場合についてデータマイニングで解決していく、というコンセプトになっています。本書は、それらの方法論を具体例とともに学べる1冊です。

例えば、顧客をセグメンテーションするための「クラスタリング」の解説があり、k-means 法のアルゴリズムや解釈の仕方などが、決定木の活用と交えながら解説されています。他にも混合正規分布モデル分枝型クラスタリング凝集型クラスタリング自己組織化マップなどが、それぞれの手法の特徴の解説、k-means法との違い、実用例などとともに解説され、これらをビジネスに関係するデータ例を通じて学ぶことができます。

他にも、「マーケットバスケット分析」や「アソシエーションルール」について、マーケティングへの活用方法の解説や、グラフ理論に基づいた「リンク分析」によるソーシャルネットワークの分析・集団のリーダーの追跡・顧客の年齢の予測などの応用例が示されたり、顧客の声に耳を傾けるための「テキストマイニング」について、ニュース記事の分類などの例が示されています。

本書は、ビジネス活用をするために、探索的データマイニングを1からシッカリ身につけたいあなたにおすすめの本となっています。

 

本書2冊は、データマイニングの手法を、ビジネスへの適用例を通じて、具体的に勉強できる本となっています。著名なコンサルタントである著者の数式なしのデータマイニング手法のわかりやすい解説本「Data mining Techniques (Third Edition)」の手法部分の章の翻訳です↓

 

 

 

 

 

データマイニングを課題解決の戦略に活かしたいあなたはこちら

戦略的データマイニング (シリーズ Useful R 4)

本書は、データマイニングをビジネスに活かすための方法論を勉強できる1冊です。

データマイニングをビジネスに活かすには、理論や手法を理解し、ソフト・ツールを使えるだけでは不十分です。目標達成のために何をすべきか、それをすることでどれくらい目標達成にインパクトがあるか、どんなテーマがインパクトがあるか、といったことをデータマイニングを使って戦略的にビジネスを進めることが重要となります。

本書では、データマイニングをビジネスに活用するために、データマイニングの手法やソフト・ツールの使い方にとどまらず、問題発見問題解決の仕方、データマイニングの効果測定など、データマイニングをビジネスで最大限に活かす方法論が学べる1冊となっています。

データマイニングの手法やソフトは理解したけど、ビジネスに活かすにはどうするの?という方に特におすすめの本となっています。

 

 

 

 

 

 

データマイニングの論文や専門書を理解をできるようになりたいあなたにおすすめの本はこちら

データマイニングの手法を、機械学習の文脈から、詳しく網羅的に勉強できる書籍はこちら

統計的学習の基礎 ―データマイニング・推論・予測―

本書は、データマイニングを使い、データが何を言っているのか理解するためのデータからの学習を解説した1冊です。

データマイニングの文脈でも理解可能ですが、どちらかというと機械学習の文脈で解説されています。

線形手法を用いた回帰と分類の解説にはじまり、平滑化法、モデルの評価、モデル推論、加法的モデル、木、ブースティング、ニューラルネットワーク、サポートベクトルマシン、最近傍探索、教師なし学習、ランダムフォレスト、アンサンブル学習、無向グラフィカルモデルなど、データマイニングにとどまらず、機械学習の手法を網羅的詳しく解説された良書となっています。

データマイニングや機械学習の手法を詳しく勉強したい方や、論文などを読む際に辞書的に使いたいあなたにも最適なおすすめ本となっています。

 

 

 

 

 

というわけで、データマイニングを勉強したいあなたにチェックしてほしい良書、11冊をご紹介しました。

 

 

 

 

 

こちらもございます↓

人工知能 1番最初の入門書: ディープラーニングの祖先を理解する (ミント出版)

サクッとわかる人工知能 第2巻: ディープラーニングの祖先を「改良」する (ミント出版)

画像処理 1番最初の入門書

Kindle Unlimitedの登録することで、

  • 無料で読むことが可能

です。

お試し登録(解約できて無料)をしてみてはいかがでしょうか(初回30日間無料で体験できます)↓

アマゾン Kindle Unlimited はこちら

 

超実践 アンサンブル機械学習

データの分析と知識発見 (放送大学教材)

基礎から学ぶデータマイニング

手を動かしながら学ぶ ビジネスに活かすデータマイニング

実践データマイニング―金融・競馬予測の科学

Rによるデータマイニング入門

データマイニングによる異常検知

マーケティングリサーチとデータ分析の基本

データ・ドリブン・マーケティング―――最低限知っておくべき15の指標

Excelでできるデータドリブン・マーケティング

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS社会科学専門書)

Introduction to Data Mining (2nd Edition) (What’s New in Computer Science)

Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking

Data Mining: Concepts and Techniques, Third Edition (The Morgan Kaufmann Series in Data Management Systems)

Data Mining, Fourth Edition: Practical Machine Learning Tools and Techniques (Morgan Kaufmann Series in Data Management Systems)

 

 

 

 

 

 

こちらの記事もございます↓

「エクセル(excel)」に関係する記事一覧(目次)はこちらです

 

『「R」に入門したいあなたのためのチュートリアルはこちらです

 

「多変量解析」に関係する記事をまとめ

 

数学や、勉強法に関する記事一覧はこちらです

 

「機械学習」に入門したいあなたにチェックしてほしい良書、10冊はこちらです