テキストマイニング

Python

Python でできることってなに?チャットボットやテキストマイニング、人工知能やスクレイピングなどPythonの使い方をまとめました

最近、Pythonを使う方が増えています。 なぜ、増えてるの? Pythonで、できることってなにがあるの? といった疑問を持つ方も多いのではないでしょうか。   Pythonを使うメリットは 初心者の方でも学びやすい 高機能を低コストで実...
Python

Python のフレームワーク・ライブラリ・ツール・開発環境などを活用し、Pythonで業務効率化をしたいあなたはこちらをどうぞ

「Python」 は人工知能やデータ分析、画像処理や機械学習、 Webスクレイピングやテキストマイニング、ゲーム開発など、 多くの応用が可能です。 Python の需要が高まり、Pythonエンジニアの求人も増え、転職を考える方も増えていま...
R

「データマイニング」を勉強したいあなたにチェックしてほしい良書、11冊はこちらです

「データマイニング」とは、データの中から、 価値ある情報や規則性を掘り出す(マイニング)技術の総称です。 コンピュータやネットワークの高性能化によって、 ビッグデータと言われるように、大量のデータを集めて、 手軽に分析することができるように...
アンケート

「アンケート調査」をしたいあなたにチェックしてほしい良書、9冊はこちらです

「アンケート調査」は、質問への回答を「集計・分析」して、有用な知見を見いだすための活動です。 アンケート調査には、スーパーのお客様満足度アンケート調査などの、身近なアンケート調査もあり、「顧客のホンネ」を知りたいときなどに使える方法です。 ...
R

「R」で「 Webスクレイピング」や「テキストマイニング」をやりたいあなたへの実践ガイドはこちらです

質の高いデータがほしいけど、予算も時間も限られている データは収集するだけでなく、分析して、再現可能な結果を導き、レポートにまとめたい といった悩みをもつ方も多いのではないでしょうか。 Webからデータを収集(クローリング)して、必要な情報...
Python

「テキストマイニング」を学びたいあなたにチェックしてほしい良書、12冊はこちらです

「テキストマイニング」とは、テキスト(文書)を分析して、新しい知見を発掘する(マイニング)技術のことです。 テキストマイニングは、学術やビジネスなど、さまざまなところで応用可能です。 テキストマイニングってなに? どんな仕組みになってるの?...
テキストマイニング

テキストマイニングに使えるフリーソフトや無料で使えるツール・ライブラリ、14選はこちらです

テキストマイニングは、テキストデータから有用な知識や知恵を抽出する技術の総称です。 一般的に、テキストマイニングは、大まかには、 (1), テキストデータの準備 (2), テキストデータの解析 いったプロセスで行われ、(2)を一般的にテキス...
おすすめ

「自然言語処理」を学びたい人におすすめの良書、10冊はこちらです

「自然言語処理」とは、コンピュータが言語を扱うようにするための技術の総称です。 コンピュータで扱えるようになることで、 大量の言語データの中から知識を獲得できる 翻訳・通訳をしてくれる コンピュータと人間が自然に会話できるようになる など、...
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

前回は、クラスター分析でよく使う「最短距離法」という階層的クラスタリングの手法についてまとめました↓ 第9回『「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめ...
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

前回は、クラスター分析でよく使う「類似度」を整理整頓した「距離行列」をまとめました。↓ 第8回『「距離行列」とは?データ分析手法全般でよく使う「類似度」の扱いをシッカリ学びたいあなたはこちらをどうぞ』 今回はクラスター分析の手順の③で、 実...
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

前回は、「クラスター分析」で使う素性ベクトルの(特にテキストマイニングの分野で)定番であるTF-IDF法をまとめました。 第6回『テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは...
アルゴリズム

テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」を洗練するための2つのテクニックをご紹介しました。 第5回『クラスター分析で必要な「素性ベクトル」を洗練する2つのテクニックとは?』 (他の過去記事は下にございます) 今...
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」をつくりたいあなたが知らないと損をする必須のテクニックとは?

前回は、「クラスター分析」で必要となる「素性ベクトル(特徴ベクトル)」の作り方をまとめました。 第3回『テキストマイニングなどのクラスター分析でも重要な「素性ベクトル」を作るための3つのステップとは?』 (それ以外の過去記事は、下にございま...
Weka

「機械学習」を「無料」ではじめてみませんか!?【フリーソフトではじめる機械学習入門】

最近、 「人工知能がすごいらしい」 「競合他社がビジネスに人工知能を取り入れたらしい」 「うちも人工知能をやらなきゃ」 なんて思われる方も増えているのではないでしょうか。 近年の人工知能の進歩は、「機械学習」の進歩が大きく貢献しています。 ...
R

日本語の「テキストマイニング」を統計解析フリーソフト「R」でサクッ実行したいあなた、こちらはいかがでしょうか

最近、人工知能の分野で、「テキストマイニング」の技術が注目されています。 え!そうなの? テキストマイニングってなんなの? と思われる方もおられるかもしれません。 そこで本記事では、テキストマイニングをやっていたい方がスムーズに入っていける...