テキストマイニング技術のビジネスへの応用とその効果(その1)

更新日

投稿日

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&am...

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&A コミュニティ、SNS(ソーシャルネットワーキングサービス)、COI(CommunityOf Interest)サイトなどです。これらはCGM(Consumer Generated Media)と呼ばれインターネットなどを活用して消費者が内容を生成していくメディアです。個人の情報発信をデータベース化、メディア化したWebサイトのことで商品・サービスに関する情報を交換するものから、単に日常の出来事をつづったものまでさまざまなものがあります。CGM コンテンツはUGC(User Generated Contents)です。

 次回に続きます。

   続きを読むには・・・


この記事の著者

木村 礼壮

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキルです。

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキ...


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ分析文化を組織内で広めたいなら、Excelで データ分析講座(その72)

◆ 表計算ソフトととしての Excel  多くの企業が使っている表計算ソフトがあります。Excelです。Excelは無料ではなく、有料のソフトウェア...

◆ 表計算ソフトととしての Excel  多くの企業が使っている表計算ソフトがあります。Excelです。Excelは無料ではなく、有料のソフトウェア...


ビジネス活用の2パターンとは データ分析講座(その59)

◆ ビッグデータ・AI活用の2つのパターン。結局この2つが主流だった  長年データ活用の携わってきて、データマイニングだのデータサイエンスだのビッグ...

◆ ビッグデータ・AI活用の2つのパターン。結局この2つが主流だった  長年データ活用の携わってきて、データマイニングだのデータサイエンスだのビッグ...


データによる課題発見と課題解決 データ分析講座(その247)

  問題解決は、取り組むテーマ・課題を設定する「課題発見フェーズ」と、その課題に取り組む「課題解決フェーズ」に分かれます。そこでどのように...

  問題解決は、取り組むテーマ・課題を設定する「課題発見フェーズ」と、その課題に取り組む「課題解決フェーズ」に分かれます。そこでどのように...


「情報マネジメント一般」の活用事例

もっと見る
情報システム導入企業の悩みとは

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...


P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...


‐情報収集で配慮すべき事項(第1回)‐  製品・技術開発力強化策の事例(その9)

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...