今回は、テキストマイニングの事例紹介です。
まず、「テキストマイニングってなに?」という方は、詳しくはこちらをどうぞ ↓
「テキストマイニング」とは?知っていると理解がすすむ目的別3つのポイント
「テキストマイニング」がなにか分かると、
- テキストマイニングって、具体的には、どう使われているの?
- どんな分野で活用されていて、どんなことがわかるの?
- テキストマイニングの応用事例を知りたいなぁ
なんて思われる方も多いのではないでしょうか。
そこで今回、テキストマイニングを使って、企業の業績や業界の動向について調べる事例について紹介します。
この事例をみてみると、あなたの業界や業種でも、テキストマイニングがどう使われているかや、こんな感じで使えるんじゃないの?といったアイデアを出すための参考になるのではないでしょうか。
本記事の概要
財務データをテキストマイニングすることで、企業や業界の業績を分類・整理する
企業や業界の業績は、なにをみればわかるの?
注目する企業の経営がうまくいってるのか、いっていないのか、それを知る方法はいくつかあります。
有価証券報告書、決算短信、企業四季報、日経会社情報、日経経営指標などをみると、会社や業界に関する様々な情報が記載されています。
これをどう活かすかというのが今回のお話のポイントになります。
想像するとすぐわかるように、こういった情報を1つ1つ調べていけば、多くのことがわかる半面、膨大な時間がかかります。
また、1つの会社はその業界全体の影響を受けますし、その業界も日本や世界の政策や景気といったものに左右されます。
それらも含めて考えるとすると、非常に膨大な書類を調べる必要が出てきます。
こんなたくさんの書類に目を通すなんて無理に決まってるよ~
って思われると思います。
こういった場合に、コンピュータが書類に目を通す、テキストマイニングが活躍します。
具体的には、どう、テキストマイニングしていくの?
テキストマイニングの事例として、今回は、ある業界の企業数百社の業績を調べ、
伸びている会社、経営が苦しい会社を見つけ出してみる、という例を考えたいと思います。
伸びている会社や苦しい会社がわかると、伸びている理由や赤字の原因を発見でき、自社の経営にも活かせるはずです。
テキストマイニングをするには、まず必要なデータを収集します。
今回は、注目する業界企業の有価証券報告書を、過去10年ほど使うとします。
企業の業績の指標としては、経営利益を使うことにして、有価証券報告書の中から数値を取得します。
成長している企業、経営が苦しい企業を、おおまかに分類してみる
まずはざっくりと業界の特徴を調べてみます。
得られた経営利益の時系列データをもとに、この業界の企業の業績パターンを分類します。
業績パターンは、シンプルに考えると、集めたデータの最初と最後の経営利益を見て、以下の4つのパターンに分類できます。
初年度 最終年度
1、 黒字 → 黒字
2、 赤字 → 黒字
3、 黒字 → 赤字
4、 赤字 → 黒字
1や2では経営がうまくいっており、3や4は経営が苦しいパターンと考えられます。
分類した企業クラスターごとに、どんな経営課題があるか調べてみる
1~4の同じクラスターに含まれる企業同士は、同じような経営課題を抱えていると考えられます。
そこで、どんな課題が共通しているかなどを、詳しく分析してみたいと思います。
有価証券報告書には、各企業がそれぞれ対処すべき経営課題についての記述があります。
たとえば、語尾が、”~実施する、~を強化する、~を再編する、~を変革する” などのような記述は、その企業の経営課題を示していると考えられます。テキストマイニングの技術によって、有価証券報告書の中からこれらの部分を取り出して、整理することで、各クラスターの経営課題の傾向や特徴を調べることができます。
テキストマイニングはコンピュータが行いますので、数百社だろうが、数千社だとうが、実行可能なところがメリットになります。
わたしたちが実際に目を通していたらとても無理ですよね。
取り出した経営課題の内容は、例えば、マネジメントとオペレーションの観点から以下のように分類できます。
マネジメントでは、
- 事業構造:事業領域、事業分野、事業内容など
- 収益性:収益力
- 企業統治:コーポレートガバナンス、内部統制、CSR、リスクマネジメントなど
オペレーションでは、
- マーケティング力:ブランド力、販売チャネル、営業力など
- 技術力:技術開発力、要素技術など
- 生産力:生産効率、生産性など
- 品質力:品質維持、品質保証、品質管理など
- コスト構造:コスト削減、原価削減など
といった指標でみることができます。
各企業の有価証券報告書には、これらの単語のどれがよく使われているでしょうか?
その頻出単語は、最初に分類した1~4のクラスターで違いがあるでしょうか?
テキストマイニングを使えば、頻出単語を抽出し、クラスターごとの経営課題を抽出することができてしまいます。
さらに、今回のデータは時系列データなので、経営課題の時系列変化も同時に調べることが可能です。
- 業界に関係のある法律が改正された前後でどうだったか、
- リーマンショックなど社会に大きく影響した出来事の前後でどうだったか、
- 日経平均株価などの景気との関連性はどうか、
など、業界だけでなく、社会との関わりの中で考えることができるようにもなります。
このように、膨大な文書を調べるテキストマイニングだからこそわかることがあるのが理解できるかと思います。
まとめ
今回は、テキストマイニングの事例として、企業や業界の経営動向について考察する事例をまとめました。
有価証券報告書の中から、特定の数値や文言を抽出して、整理・分類することで、
自社の属する業界の動向や、経営課題の変化などを考察できることがわかってもらえたかと思います。
このように、テキストマイニングは人の手で行うには大変な作業をサクッと代わりにやってくれます。
テキストマイニングは、大量の文書の、ヒトが気づきにくい特徴や傾向を知ることができる技術ということができます。
- 統計解析のフリーソフト「R」を使ったテキストマイニングの本です。↓
- テキストマイニング(計量テキスト分析)のフリーソフト「KH Coder」の設計やチュートリアル、KH Coderを使った応用などを学べる1冊です。↓
ちなみに、KH Coder のサイトはこちら
- テキストマイニングの仕組みから、社会への技術応用の具体例も豊富な1冊です。↓
- テキストマイニングを基礎から応用まで、使うだけでなく作るレベルで学べる1冊です。↓
こちらの記事もございます↓