「テキストマイニング」を学びたいあなたにチェックしてほしい良書、12冊はこちらです

textmining recommended books Python

テキストマイニング」とは、テキスト(文書)を分析して、新しい知見を発掘する(マイニング)技術のことです。

 

テキストマイニングは、学術やビジネスなど、さまざまなところで応用可能です。

  • テキストマイニングってなに?
  • どんな仕組みになってるの?
  • テキストマイニングをやってみたい!

など思われる方も多いのではないでしょか。

 

そこで本記事では、

  • テキストマイニングとは?を理解したい
  • 仕組みを学びたい
  • テキストマイニングをサクッとできるようになりたい

あなたのために、テキストマイニングについての良書、12冊をご紹介します。

 

 

本記事の概要

「テキストマイニング」を学びたいあなたのための良書、12冊はこちらです

 

1冊目はこちら 【テキストマイニングの最初の教科書にどうぞ】

テキストデータの統計科学入門

本書では、テキストデータの統計的な解析にしぼり、テキストデータに対して統計学多変量解析データマイニングの適用方法を学ぶことができる1冊です。

テキストのクリーニングや形態素・構文解析からはじまり、集計モデル、テキストにおける統計法則や指標、ネットワーク分析、探索的分析、確率モデリング、情報量、推測分析、差異の分析、特徴抽出、話題分析、クラスター分析、分類、時系列分析など盛りだくさんに学べます

手を動かしながら学べるように、実際のやり方がフリーソフト「R」を用いて、入力例とともに丁寧に示されているのもうれしいところです。

テキストマイニングは、データマイニング自然言語処理人工知能などと関係の深い分野ですが、それらを学ぶ基礎も固めれる良書となっています。

 

 

 

 

2冊目はこちら 【テキストマイニングの概要・考え方をつかめます】

岩波データサイエンス Vol.2

本書は、岩波データサイエンスシリーズの第2巻で、特集として「統計的自然言語処理」が扱われています。副題が ”ことばを扱う機械” なのですが、コンピュータにことばを扱わせるにはどのようにすればいいのか・しているのか、といったことを、各トピック、見開き5・6ページの中で、ギュッと凝縮して解説されています。

基本から丁寧に解説されていて、初学者でもわかりやすい良書となっています。

 

 

 

 

3冊目はこちら 【エクセルを使って、アンケートから役に立つ情報を発掘したい方へ】

Excelで学ぶテキストマイニング入門

エクセルを使ってテキストマイニングをやりたい方向けの1冊です。自由に書かれた文章(自由文)や、定型文についてのテキストマイニングを学べます。

キーワードのヒストグラム化、フリーソフト:茶筅(ちゃせん)による形態素解析、テキストデータからの因果関係の考察カテゴリの自動生成顧客満足度調査(CS)など、ビジネスの現場でも役立つ方法が、フリーソフトの使い方とともに学べます。

書籍内で使われているデータは出版社のHPからダウンロードでき、自分で手を動かしながら学べるのもうれしいところです^^

 

 

 

 

4冊目はこちら 【わかりやすい実例を通じて、フリーソフトの使い方を学べます】

Text Mining Maniax: フリーソフトで始める日本語計量テキスト分析

本書は、テキストマイニングのフリーソフトである「R」「RMeCab」「KH Coder」を使って、日本語の文章をテキストマイニングする方法を学べる1冊です。

わかりやすい実例(新聞社説、東方Projectの人気投票のコメント、西田幾多郎の「善の研究」など)を、テキストマイニングを使って分析しています。対応分析、共起ネットワーク、多次元尺度構成法、自己組織化マップ、クラスター分析、関連語検索などが解説されています。Kindle Unlimitedに入っている方は無料で読めます!

 

 

 

 

 

5冊目はこちら 【フリーソフト「R」を用いたテキストマイニングの入門書です】

Rによるテキストマイニング入門

本書では、フリーソフト「R」を使ったテキストマイニングについて解説されています。Rで日本語を解析するためのパッケージ “RMeCab” を開発した方が執筆されていて、RMeCabについての解説も充実しています。

インターネット上のクチコミ情報やアンケートの自由記述文の分析、沖縄観光のアンケート分析テキストの自動分類、書き手の判別などの応用例が示されています。

付録に統計の基礎がまとめられていて、データの種類・要約方法、正規分布、t検定、カイ自乗検定、対応分析などが、Rでの実行方法とともに解説されているのもうれしいところです!

ちなみにこちらの書籍は新版が出ています

Rによるテキストマイニング入門

 

 

 

 

 

6冊目はこちら 【テキストマイニングを独学する基礎を作れる1冊です】

Rによるやさしいテキストマイニング

テキストマイニングをフリーソフト「R」を使ってできるようになる1冊です。

テキストマイニングの入門書ですが、理論的背景データの収集方法、言語処理(データ分析)の方法についても解説されており、データの構築から分析といったテキストマイニング全般の基礎と技術が説明されています。

1つ1つの手順がスクリーンショットとともにしっかり解説されているので、「R」の初心者の方でも迷子になることなく、手を動かしながら学べる1冊です。

これからRやテキストマイニングを詳しく学びたい人の基礎を固めるのにも役に立つ本ではないでしょうか。

 

 

 

 

 

7冊目はこちら 【SPSSを用いたテキストマイニングの入門書ならこちら】

SPSSによるテキストマイニング入門

本書は、IBM社の統計解析パッケージSPSSでのテキストマイニングの解説書です。SPSSの中のテキストマイニングツール Text Analytics for Surveys と Statistics を使っています。

テキストマイニングの概要から、カテゴリ分類器の作り方、キーワード抽出、係り受け解析、感性分析などが解説されています。Text Analytics for Surveys の操作についてもシッカリ説明されています。分析の例として、主成分分析、対応分析、回帰分析、判別分析、多重対応分析の例が示されています。

 

 

 

 

 

8冊目はこちら【数量化理論とテキストマイニングの両方を学べる1冊】

数量化理論とテキストマイニング

本書は、数値で表現できないようなカテゴリデータを分析するときなどに使う数量化理論とテキストマイニングの両方が解説されたお得な1冊です。エクセルRStatWorkを使った解析例が学べます。

1章から7章までの数量化理論の説明の後に、7章でテキストマイニングの解説があり、8章で数量化理論を用いたテキストマイニングの活用例が示されています。文書データを形態素解析などでデータ変換し、数量化理論が使える01型データにして解析をしています。これらの過程で活躍するツールやテクニックがシッカリ解説されています。付録で StatWork,  Rなどの使い方の説明もあるのがうれしいところです。

 

 

 

 

 

9冊目はこちら 【テキストマイニングの理論や仕組みもシッカリ学びたいあなたへ】

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理を専門的に学びたい方が基礎からシッカリ学ぶにはこの1冊がおすすめです。

テキストマイニングの理論を理解するためには、確率や情報理論のような数学的知識や、コンピュータで扱うためのテキスト(文書)の数学的表現についての理解が必要です。これらを初学者にもわかりやすく解説しているのが本書です。

加えて、クラスタリング分類系列ラベリングといったアルゴリズムもサクッと詳しく解説されています。機械学習への応用が目的なのもあり、実験の仕方などでモデルの評価の方法なども学ぶことができます。

専門的に学びたい学生さんなど、論文や専門書を理解するための基礎としても重宝する1冊です。

 

 

 

 

10冊目はこちら 【「Python」で、プログラミングしながら学びたいあなたはこちら】

入門 自然言語処理

本書は「Python」を使って、テキストマイニングに必要となる自然言語処理のプログラミングを学べる1冊です。Pythonの自然言語処理キットである「NLTK」を使って、基礎から学べるように工夫しています。内容がPythonに依存しないように配慮されているので、他の言語を使いたい方もスムーズに学べます。

本書はテキストマイニングの基礎理論も学べ、かつ、実務への応用の力もつくお得な1冊となっています。

 

 

 

 

11冊目はこちら【テキストマイニングの全体を詳しく学びたいあなたはこちら】

テキストマイニングを使う技術/作る技術―基礎技術と適用事例から導く本質と活用法

本書はテキストマイニングの基本から適用例、使い方、疑問、今後の発展など幅広い内容を、それぞれ詳しく解説しています。

テキストマイニングの基本的な仕組みや他の技術(検索や分類)などとどう違うのか?といったことから、適用例とその効果について、コールセンターでの例や経営戦略としての使い方などがまとめられています。

加えて、データの質や、効果の評価の仕方、辞書のメンテナンス分析のコツなどの疑問や、感情・評価・態度の分析技術自動音声認識のテキストマイニングについて、今後の発展として解説されています。

テキストマイニングの全体像を広く深く学べる1冊となっています。

 

 

 

12冊目はこちら 【テキストマイニングの応用事例を一覧でみたいあなたはこちら】

コーパスとテキストマイニング

本書は、テキストマイニングのさまざまな活用事例について、それぞれの分野の専門家の方々がわかりやすく解説した1冊です。

テキストマイングは非常に多岐にわたる分野で活用されています。例えば、理系分野では、工学や医学・医療分野での事例があり、文系分野では文学、言語学、政治学、社会調査、心理学、教育学で活用されていますし、ビジネス分野ではマーケティングや金融などでも用いられています。

ビッグデータの時代に、活用範囲はさらに広がっており、テキストマイニングを使いたいけど、自社や自分のデータに近い分野や活用事例があると参考になりますよね。

本書では様々な活用事例を専門の研究者の方がわかりやすく解説してくれています。具体的には、金融、医療、アンケート調査、文章の書き手分析、テキストの分類指標、ニーズ分析、政治、ブランドマネジメント、社会調査、自然言語処理と機械学習の併用、社会心理学研究、類似テキストの異同、、文章のジャンル判別、などが扱われており、自分のやりたいことに近い具体例がみつかるのではないでしょうか。

加えて、付録では、さまざまなソフトウェアの解説がまとめられているのもうれしいところです。

まず、テキストデータの収集や分析のためのソフトである TinyWebCrawler, TinyTweetCrawler,  TinyTweetTracker, TinyTextMinerのインストール方法や使い方の説明があり、Rによる共起グラフの描画などの具体例が説明されています。

つぎに、KH Coderについて、3つの機能とマウス操作で分析できる手軽さや、カスタマイズできる利便性などが紹介されています。

また、MTMinerR の説明では、テキスト処理と集計や、データ解析やマイニングについて、データの標準化、ジップ法則、特徴語句の抽出、教師あり・なしの解析や機械学習法についてサクッとまとめられています。

最後に、Rでテキストマイニングする際に活躍するRMeCabパッケージの使い方について、各関数ごとに説明されていて、応用事例として、文体の識別例が示されています。

というわけで、本書は、テキストマイニングの活用事例を幅広く俯瞰することができるだけでなく、ソフトの使い方など実践面も鍛えることができるお得な1冊となっています。

 

 

 

というわけで、今回は、「テキストマイニング」を学びたいあなたにチェックしてほしい良書、12冊をご紹介しました。

 

 

 

こちらもございます↓

 

 

 

↓こちら無料で読めます

 

 

 

 

 

 

こちらの記事もございます↓

『「テキストマイニング」の記事まとめはこちらです

 

「多変量解析」の記事まとめはこちらです

 

「機械学習」に入門したいあなたにチェックしてほしい良書、10冊はこちらです

 

『「データマイニング」を勉強したいあなたにチェックしてほしい良書、10冊はこちらです』

 

「エクセル」で「データ分析」できるようになりたいあなたにチェックしてほしい良書10冊はこちらです

 

 

「データ分析」を活用したい!けど分からないことだらけの方、その悩みを解決する良書10冊はこちらです

 

「アンケート調査」をしたいあなたにチェックしてほしい良書、8冊はこちらです