ツイッター(Twitter)やフェイスブック(Facebook)などのSNSには、日々膨大な量の「ソーシャルデータ」が投稿されています。
それらにはじつに様々な内容がありますが、たとえば新商品の感想が書き込まれたりもしています。
SNSがない時代には、新商品の感想を入手するにはアンケート調査などが必要で、企業はお金をかけてまで入手していました。
それがいまやブログやSNSの発達によって、ソーシャルデータの分析を行うことで、手軽に無料で入手できるようになりました。
(ここでは、ソーシャルデータを分析することを、「ソーシャル分析(ソーシャルデータ分析)」と呼ぶことにします。)
ソーシャルデータ分析できれば、ビジネスに活かせるんじゃないの?
って思われた方、大正解です!
しかもうれしいことに無料でできますので、試してみてダメならやめてもお金はかかりません。
- よし!それならソーシャルデータ分析をやってみたい!
- ソーシャルデータ分析の結果を活かして、ビジネスを立ち上げたい
- 自社ビジネスで優位に立ちたい!
と思われた方も多いのではないでしょうか!?
そこで本記事では、ソーシャルデータ分析に役立つ書籍や記事をまとめました。
本記事の概要
ソーシャルデータ分析とは?
ソーシャルデータ分析は、ウェブに蓄積されるデータを分析して、役に立つ知見を見出すための、データマイニングです。
ソーシャルデータは日々膨大な量が蓄積されています。大量のデータを活用することで真価を発揮する「機械学習」との相性が抜群なんです。
ネット上の情報は玉石混交と言われますが、機械学習することで、信頼できる情報とできない情報を見分けたりなんかもできちゃいます。
もちろん、機械学習によって、ビジネスを加速させることも可能です。
機械学習を使ったソーシャル分析で、ビジネスを加速する
機械学習を使ってソーシャル分析を行うことで、自社ビジネスをよりよいものにすることができます。
たとえば、自社製品についての評価を、TwitterやfacebookなどのSNSの書き込みから判断することができます。これは上で簡単に述べた通りです。
- 新発売された○○、安くて機能性も抜群でした!
- ○○買ってみました。手ごろな価格だけど、デザインをもうすこしかわいくしてほしかった
など、書き込みの中には顧客の感想や商品の改善点など、マーケティングに活用できる貴重な情報を抽出することが可能です。
その他にも、顧客を絞り込んだり、ペルソナを作る際にも参考にすることができます。新商品を買った顧客や、SNSでの評判などデータを集めて機械学習することで、顧客の特徴を抽出して、「顧客のプロファイリング」を行うことができます。
データに基づいた顧客像を作成することができるので、より現実に即したペルソナをつくることが可能です。
このように、顧客を良く知ることができれば、どんな特徴をもったヒトにアプローチすれば顧客となってくれる確率が高いかを予測できたり、新商品の開発の際には、顧客の特徴が具体的であるので、アイデアも具体的に出せるようになります。
このように、ソーシャルデータを機械学習することは、ビジネスにおおいに役立つことがわかっていただけるかと思います。
- どうやって、ウェブ上のデータを機械学習するの?
- どうやって、機械学習をビジネスに活かせばいいの?
- なにか具体例があると分かりやすいんだけどなぁ~
なんて思われるかと思います。
ウェブ上にあふれるソーシャルデータを機械学習したい方、それをビジネスに活かす方法を具体的に知りたいあなたにおすすめの本がこちらです。↓
本書の内容を一言でいうと、「ウェブ上の膨大なデータを機械学習を使って有効活用しよう」です。
でも、どう活用すればいいの?
って思いますよね。
本書では、そういった悩みを解決できる「具体的な分析例」を示してくれています。分析例が具体的なので、自社でやりたいことと似た例を探すことで、自社データの分析をスムーズに行うことができます。以下にそれらの例をいくつか抜粋しました。
①、バースト検出
たとえば、速効性のあるTwitterのデータなどを調べると、まさに今、世の中でいま流行っているモノや話題はなんなのか?といったことを抽出することができます。これは調べたいキーワードの出現頻度を分析する「バースト検出」を用いることで知ることができます。(目次第2章)
②、イベント抽出
さらに、そのキーワードに関するもう少し詳しく調べたければ、キーワードに関連する情報を集めて整理分類することで、キーワード周辺のヒトの行動やモノの動きを抽出することもできます。
たとえば、商品の購入やお店の訪問といったものや、電車の渋滞や交通事故や渋滞などの情報も調べることが可能です。こういったキーワード周辺の情報の場所や時刻なども含めることで、より具体的に調査することを「イベント抽出」といいます。
③、評判分析
他にも、キーワードが自社の新商品だと考えると、その評判を知りたくなりますよね?それは「評判分析」と呼ばれる手法を使って分析することができます。(目次第3章)
評判分析の特徴は、たとえばパソコンだったら、客観的な情報(CPUのスペックがいくつとか、メモリが何ギガなど)ではなく、あくまで、ユーザーの主観的な判断や感情、意見を分析できるところに特徴があります。多くのヒトにこれらの分析を行うと、世論調査のような世の中の雰囲気を知ることも可能です。
④、ユーザー・プロファイリング
さらに、自社商品をすごく褒めてくれた人たちと、気に入らなかった人たちではどういう違いがあるんだろうか?ということが分かるといいですよね。これはユーザーの特徴を抽出する「ユーザー・プロファイリング」を行うことで分析できます。
自社商品の書き込みをしたヒトの特徴を調べます。例えば、評価の高かった書き込みを集めて分析することで、
- 性別は男性が7割
- 年齢は20代前半が多く
- 職業は・・、
- 関東に住んでる方が多かった
のように、高く評価してくれたユーザーの特徴を浮かび上がらせることができます。これがいいのは、それに加えて、調べたユーザーの他の書き込みを分析することで、他にどういう嗜好や興味があるのかなどを推定することもできます。こういった情報は、似たような新商品を開発する際の大きなヒントになるはずです。
ちなみに、マーケティングに関するデータ分析についてはこちらの記事にもございます↓
『【マーケティング・データ分析の基礎】「マーケティング」を科学的に行いたいあなた、「データ分析」のフリーソフト「R」はいかがでしょうか【 Useful R】』
ちなみに、マーケティングについても学びたいあなたには、これらの本もおすすめです。↓
マーケティング以外にも応用することができます。たとえば、ユーザー情報が非公開でも、似たような書き込みをしている人のユーザー情報がわかっていれば、それをもとに、非公開のユーザーがどんなヒトかを推定することもできます。
これは作者の分かっている文章の特徴と、作者不詳の文章の特徴を比較することで、その作者が誰なのかを推定することができるのですが、そういった考え方と同じです。
文章の特徴による作者推定については、以下の記事をどうぞ。↓
「日本語の「テキストマイニング」をしたいあなた、統計解析フリーソフト「R」でサクッとできるようになる、こちらはいかがでしょうか【Rで学ぶ日本語テキストマイニング】」
ウェブ上のデータって信頼できるの?
って思われる方もおられるかもしれません。
たしかに、ウェブ上のデータの中には信頼性が乏しいものがあります。
じゃあソーシャルデータ分析なんて意味があるの?
って思われるかもしれません。
じつは、機械学習を使うと「情報の信頼性を分析」することができるんです。これを「信頼性分析」と呼びます。
⑤、信頼性分析
例えば、会社の会議で誰かが発言したら、その発言に信頼性があるかは、その人がベテランであるか新入社員であるかなど、その人の特徴から判断することができますよね。
発想としてはこれと同じです。ウェブ上のデータでも、あるユーザーの発言が信頼できるかは、そのユーザーのウェブ上での「ヒトとなり」を調べることで判断することができます。
具体的には、そのユーザーの友人ネットワークを調べることでどんな人と仲がよいかがわかります。医師や看護師の友人が多い方であれば、医療や健康に関して無責任は発言はしにくいはずです。なのでそういった分野の発言に信頼性が高い傾向があると推定することができます。
他にも、そのユーザーのウェブ上でのコミュニケーションを集めることで信頼性を推定することができます。友人に身元が確かで信頼できる専門家が多かったり、他人からのコメントの評価が高ければ、そのユーザーの発言は信頼性が高いと推定することができます。
このように、1つ1つのコメントや記事の中には信憑性の疑われるものがあって、大量のデータを機械学習することで、信頼性の高い情報を抽出することができるわけです。
玉石混交のウェブデータも、機械学習を利用することで信頼性の高い情報を抽出することが可能です。さらに、その信頼ある情報を使って機械学習してビジネスに活かすことで、さまざまな場面で価値ある情報を見出すことができることがわかっていただけたのではないでしょうか。
本書の目次は以下の通りです
第1章 ウェブと機械学習
1-1、はじめに
1-2、ウェブから社会を観測する
1-3、データ分析の段階
1-4、ウェブデータの特徴
1-5、ウェブデータの種類
1-6、ウェブデータで機械学習を行う際の課題
第2章 バースト検出
2-1、はじめに
2-2、移動平均線収束拡散法
2-3、ポアソン過程
2-4、Kleinberg のバースト検出
第3章 評判分類の学習
3-1、評判分類
3-2、素性抽出
3-3、素性選択
3-4、素性の質
3-5、評判分類器の学習
3-6、ロジスティック回帰による評判分類器学習
3-7、多値評判分類学習
3-8、評判分類の評価
3-9、評判情報辞書
3-10、評判分類における分野適応
3-11、構造対応学習
第4章 意味表現の学習
4-1、意味表現
4-2、分布的意味表現
4-3、分散的意味表現
4-4、連続単語袋詰めモデル
4-5、連続スキップグラムモデル
4-6、大域ベクトル予測モデル
4-7、意味表現の評価
4-8、単語の意味表現ベクトルの可視化
4-9、分散的意味表現における行列分解
第5章 グラフデータの機械学習
5-1、リンク構造に基づくデータマイニング
5-2、グラフの定義
5-3、ページランク
5-4、パーソナライズド・ページランク
5-5、ラベル拡散法
5-6、チェイランク
5-7、ページランクの応用例:スパムページの検出
5-8、HITS
5-9、シムランク
第6章 順序学習
6-1、検索エンジンと順序学習
6-2、静的順序と動的順序
6-3、順序学習のための素性
6-4、順序学習手法の分類
6-5、点順序学習手法
6-6、対順序学習手法
6-7、リスト順序学習手法
付録A
A-1、スカラー値をベクトルで微分
A-2、内積を片方のベクトルで微分
A-3,L2ノルムの二乗をベクトルで微分
A-4、行列の特異値分解による行列近似
A-5、ソフトマックス関数
となっています。
記事の上では、バースト検出、イベント抽出、評判分析、ユーザー・プロファイリングを例に挙げましたが、これだけでなく、
- 「推薦(レコメンデーション)」
- 「協調フィルタリング」
- ウェブ上の関係であるネットワークを調べる「ネットワーク分析」
なども学べる、機械学習をビジネスに活かすなら知っておきたい充実した内容となっています。
また、数学が苦手という方も、つまずきやすいところが付録でシッカリ解説されているのでだいじょうぶです。
ウェブ上のデータを現実世界と結びつけて、現実のビジネスの役に立つ知見を見出すには、機械学習がとても有効です。
本書では、そういった手法がわかりやすく解説され、74もの参考文献が付いています。内容をさらに深めたいあなたの道しるべに使うこともできる1冊です。
その他にも、機械学習には以下の本もおすすめです。
- 機械学習だけでなく、統計解析も1冊で学べてお得です↓
- 機械学習のアルゴリズムを実装しながら学びたいあなたにはこちら↓
この他にも以下の記事もございます。
『機械学習に入門したいあなたにチェックしてほしい良書、10冊はこちらです』
- 機械学習を一通りやってみたい方はこちらの記事もございます↓
「機械学習を無料ではじめてみませんか!?【フリーソフトではじめる機械学習入門】」
- データ分析や統計モデリングを学んでみたい方にはこちらもどうぞ↓
「「データ解析」や「統計モデリング」を基礎から体系的に学びたいあなた、こちらはいかがでしょうか【データ 解析のための統計モデリング入門】 」
- ディープラーニングを実装してみたいあなたにはこちらの記事もございます↓
「「ディープラーニング(深層学習)」の理論や応用を学び、「Python」フレームワークで実装したいあなた、こちらはいかがでしょうか【Pythonで体験する 深層学習】」
- その他にもこちらの記事もございます
『「テキストマイニング」を学びたいあなたにチェックしてほしい良書、10冊はこちらです』
「「株価」の変動を「物理学」で理解したいあなた、「経済物理学」はいかがでしょうか」
『「クラウドストレージ」 ってどれを使えばいいの?「無料で使える容量」や有料プラン、裏技など、特徴を比較してみました』
「【孫子の兵法】をサクッと身につけ「仕事に活かしたい方」はこちらです」