テキストマイニング技術のビジネスへの応用とその効果(その1)

更新日

投稿日

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&am...

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&A コミュニティ、SNS(ソーシャルネットワーキングサービス)、COI(CommunityOf Interest)サイトなどです。これらはCGM(Consumer Generated Media)と呼ばれインターネットなどを活用して消費者が内容を生成していくメディアです。個人の情報発信をデータベース化、メディア化したWebサイトのことで商品・サービスに関する情報を交換するものから、単に日常の出来事をつづったものまでさまざまなものがあります。CGM コンテンツはUGC(User Generated Contents)です。

 次回に続きます。

   続きを読むには・・・


この記事の著者

木村 礼壮

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキルです。

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキ...


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
現場を無視した指標設計 データ分析講座(その32)

◆ 現場を無視した指標(KPIなど)に未来はない  KPIなどのビジネス指標を設計するとき、最大限注意すべきことがあります。それは、現場の「意見」や...

◆ 現場を無視した指標(KPIなど)に未来はない  KPIなどのビジネス指標を設計するとき、最大限注意すべきことがあります。それは、現場の「意見」や...


手法の知識・使い方と成果の関係 データ分析講座(その154)

  ◆ データ分析に立ちはだかる実践・活用の壁  データ分析をやることになった時、多くの人は分析手法の知識やツールの使い方を学ぶようです...

  ◆ データ分析に立ちはだかる実践・活用の壁  データ分析をやることになった時、多くの人は分析手法の知識やツールの使い方を学ぶようです...


現場感とデータ分析 データ分析講座(その219)

  【この連載の前回:データ分析講座(その218)見える化の魔力へのリンク】 データから新たな知見を得たい! という要望は、昔からありま...

  【この連載の前回:データ分析講座(その218)見える化の魔力へのリンク】 データから新たな知見を得たい! という要望は、昔からありま...


「情報マネジメント一般」の活用事例

もっと見る
人的資源マネジメント:製品開発の滞留を引き起こすファイルとは(その2)

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...


‐技術開発の目標について 第2回‐  製品・技術開発力強化策の事例(その16)

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...