Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!

自然言語処理

テキストマイニング

BERT(ディープラーニング)による自然言語処理は、どんなデータで評価されたの?どんな応用ができそう?

ディープラーニングによる人工知能の進歩は、日進月歩です。 画像認識や音声認識の分野においては、 すでに人間と同等かそれ以上の性能を示すモデルができています。 しかし、自然言語処理においては、人間のスコアを超えるモデ...
2019.01.02
Python

「テキストマイニング」を学びたいあなたにチェックしてほしい良書、12冊はこちらです

「テキストマイニング」とは、テキスト(文書)を分析して、新しい知見を発掘する(マイニング)技術のことです。テキストマイニングは、学術やビジネスなど、さまざまなところで応用可能です。テキストマイニングについて理解したい、仕組みを学びたい、サクッとできるようになりたいあなたのために、テキストマイニングがわかる・できるための良書、10冊をご紹介します
2019.03.21
おすすめ

「自然言語処理」を学びたい人におすすめの良書、10冊はこちらです

「自然言語処理」とは、コンピュータが言語を扱うようにするための技術の総称です。深層学習(ディープラーニング)の利用によって近年盛り上がっていて、ビジネスへの応用を考えている方も多いのではないでしょうか。そこで本記事では、自然言語処理を基礎を理解したいあなた、言語の分析方法を身につけたいあなた、ビジネス応用を実現したいあなたのために、自然言語処理とは?といった初学者向けのものから、様々な方法を網羅的に学べるもの、深層学習(ディープラーニング)を用いた自然言語処理の解説書など、自然言語処理を学ぶための良書、9冊+α ををご紹介します。
2019.02.17
アルゴリズム

「階層的クラスタリング」の「完全連結法(Complete Linkage Method)」とは?初学者の方でも、わかりやすいようにまとめました

「クラスター分析(クラスタリング)」は、大量のデータをグループに分けることで、中身を理解しやすくするためのデータ分析手法です。クラスタリングの中で、「階層的クラスタリング」はよく使われる手法の1つです。階層的クラスタリングにはいろいろなアルゴリズムがあります。今回は「完全連結法(Complete Linkage Method)」というアルゴリズムを紹介し、最短距離法との違いなど、初学者の方が、他のクラスタリングを学ぶ際にも役に立つ情報をわかりやすくまとめました。
2019.02.01
Python

「HTML」や「XML」を「Python」で手軽に扱いたいあなた「BeautifulSoup」はいかがでしょうか

「HTML」や「XML」ファイルを自動的に処理したい、賢く処理をしたい、Webページのクローリングをサクッとスクレイピングしたい方も多いかと思います。ここでは、HTMLやXMLをより手軽に、よりスマートに扱うための「BeautifulSoup」というライブラリの使い方をご紹介します。複雑なHTMLやXMLも、BeautifulSoupを使ってサクッと処理したいあなたはこちらをどうぞ
2017.09.25
XML

「XMLとは?」HTMLとの違いや、どう役に立つの?ってあなたはこちらをどうぞ

「XML」は自分で定義できるHTMLみたいなものです。XMLは、HTMLよりも使い勝手を広くしたもので、特定の分野でよく使われる用語や用語間の関係性を定義したり、大量の情報を共有したり、自動的に処理させることができます。XMLを使うことで、HTMLが対応できないような分野でも、”賢い”処理を実行できるようになり、これがXMLを使うメリットとなっています。XMLとは?から、XMLの概要や使い方などHTMLを交えながらわかりやすく理解したいあなたはこちらをどうぞ
2017.09.25
アルゴリズム

「階層的クラスタリング」の「最短距離法(Single Linkage Method)」とは?初学者の方でもわかりやすいようにまとめました

クラスター分析は、大量のデータをグループ分けして中身を理解するための方法です。「階層的クラスタリング」はよく使われるクラスター分析の手法の1つで、「最短距離法(Single Linkage Method)」は他の手法を学ぶ際にも役に立ちます。クラスター分析の初学者の方でもわかりやすいように、階層的クラスタリング(最短距離法)についてまとめました
2019.02.01
アルゴリズム

「距離行列」とは?データ分析手法全般でよく使う「類似度」について学びたいあなたはこちらをどうぞ

大量の情報の中から重要な知見をみつけだす「データマイニング」では、「クラスター分析」など、情報の「グループ化」がよく使われます。クラスター分析は、データ分析の初期段階での「探索的データ分析」でも使われるので、クラスター分析をシッカリ学ぶことは「データ分析の基礎」となります。データの特徴を整理してまとめた「距離行列」とはなにか?をシッカリ理解したいあなたや「距離行列の成分」に関する2つの特徴をつかんで、大規模データでも使えるようになりたいあなたはこちらをどうぞ
2019.02.01
アルゴリズム

「クラスター分析」ってどうやるの?クラスター分析のやり方、具体的な3つのステップはこちらです

「クラスター分析」は、コンピュータを使って情報をグルーピングする手法です。大量の情報であっても整理・分類することで、わかりやすく、サクッと理解することができます。情報洪水の中から有用な情報を効率よく見つけ出したいあなたや、クラスター分析を学びたい初学者のあなたにおすすめな「クラスター分析のやり方」、3つのポイントはこちらです
2019.02.01
アルゴリズム

テキストマイニングの「クラスター分析」などで使われる、知らないと恥ずかしい「素性ベクトル作成の定番的方法」とは?

「素性ベクトル」の作成は、テキストマイニングの「クラスター分析」など必須です。素性ベクトルを作るには多くの方法がありますが、テキストマイニングの初学者ならまずは知っておいた方がいいものや知らないと恥ずかしいものなどがあります。本連載の第6回では素性ベクトル作成でよく使われる定番の方法についてわかりやすくご紹介します。
2019.02.01
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」を洗練する2つのテクニックとは?

「素性ベクトル(特徴ベクトル)」は、「クラスター分析」をする際に必須のデータです。データを素性ベクトルに変換してクラスター分析を行いますが、素性ベクトルへの変換には、知っておかないと失敗するテクニックがあるんです。そこでテキストマイニングなどでクラスター分析をしたいあなたのために、素性ベクトルの作成を洗練する2つのテクニックをわかりやすくまとめました
2019.02.01
アルゴリズム

テキストマイニングなどの「クラスター分析」で必要な「素性ベクトル」をつくりたいあなたが知らないと損をする必須のテクニックとは?

「素性ベクトル(特徴ベクトル)」は、クラスター分析をする上で必須のデータです。テキストマイニングなどでクラスータ分析をするときには、文書データを素性ベクトルデータに変換しますが、知らないとうまくいかない、注意すべきポイントがあります。素性ベクトルを作ってクラスター分析をやってみたいあなたはこちらをどうぞ
2019.02.01
アルゴリズム

テキストマイニングなどのクラスター分析でも重要な「素性(そせい)ベクトル」を作るための3つのステップとは?

テキストマイニングなどのクラスター分析では、データをそのままグルーピングするわけではありません。データはまず「素性ベクトル」にしてから、その後クラスター分析を行います。なので、クラスター分析を行うときには、素性ベクトルを作ることは必須になります。素性ベクトルを作るため手順を、3つのステップでサクッと理解したいあなた、こちらはいかがでしょうか
2019.02.01
アルゴリズム

テキストマイニングの「クラスター分析」でも必要な「素性(そせい)ベクトル」とは?なぜ必要なの?

素性ベクトル」は、テキストマイニングのクラスター分析など様々な場面で必要となる重要な概念です。現代は情報過多の時代ですが、情報の非対称性はビジネスの競争優位やアイデアの源泉になったりします。なので、大量の情報を効率的に理解・処理することはとても役立ちます。クラスター分析ができれば、大量の情報を自動的に整理・分類でき、本質的な情報を効率的に得ることができて、うれしいですよね。クラスター分析をするならまず学ばないといけない素性ベクトルとは?なぜ必要なの?についてサクッと学びたいあなたはこちらをどうぞ
2019.02.01
アルゴリズム

「クラスター分析」とは?膨大な情報の内容を、ラク〜にサクッと理解したいあなたはこちらをどうぞ

「クラスター分析」は、情報を整理・分類するためのコンピュータアルゴリズムです。自分で読みながら、膨大な情報を整理・分類することもできますが、時間もかかるし大変ですよね。クラスター分析はコンピュータにやらせるので、サクッとラク〜に整理・分類することができます。クラスター分析は様々なデータに対して使えるので、応用範囲も広く、学んでおいて損はありません。クラスター分析とは?という初学者の方から、そのアルゴリズムや具体例など、クラスター分析をサクッと知っておきたいあなたにはこちらはいかがでしょうか
2019.02.01
おすすめ

「ディープラーニング」を基礎からビジネス応用までサクッとつかみ、自社ビジネスに活用したい方はこちらをどうぞ【グーグルに学ぶディープラーニング】

「ディープラーニング」はすべてのビジネスを変えると言われています。人工知能や機械学習とどう違うの?ディープラーニングの仕組みは?グーグルでどう使われているの?自社ビジネスで活用できるの?など、ディープラーニングの現状を一気通貫にサクッと理解したいあなたはこちらをどうぞ
2018.02.24
R

「テキストマイニング」で経営状態や業界動向を調べるにはどうするの?

「テキストマイニング」はフリーソフト「R」や「KH Coder」などで実行できます。テキストデータを抽出して整理・分類することで自社ビジネスに役立てることが可能です。そこで今回は、テキストマイニングを使って有価証券報告書から必要なデータを抽出し、企業の経営状態や業界動向を調べる方法をまとめました
2018.06.16
R

「テキストマイニング」とは?知っていると理解がすすむ目的別3つのポイント

「テキストマイニング」はテキストデータを分析して役立つ知見を発掘する手法です。しかし形態素解析・構文解析・意味解析・マイニングという解析方法別に理解するだけでは不十分です。そこでここでは、目的別にテキストマイニングを理解するための「3つのポイント」をまとめました。テキストマイニングをより正確に、系統的に理解したいあなたはこちらをどうぞ
2018.06.16
おすすめ

「自然言語処理」の基礎から応用まで、全体像をサクッと学びたいあなた、こちらはいかがでしょうか。ディープラーニングもあります

「自然言語処理」は手法を学べばだれでも無料で使える技術です。自然言語処理のポイントについて自然言語の3つの役割や4つの方法などをまとめました。自然言語処理がどういうものかサクッと理解したい方はこちらをどうぞ 自然言語処理の全体像をサクッとつかみたい方、1冊でカバーできるこちらのはいかがでしょうか。 あわせて「リカレントニューラルネットワーク」「トピックモデル」「ベイズ推定」「ページランク」も学べます
2018.11.04