データ活用で肝となるモデルとは データ分析講座(その133)

更新日

投稿日

データ分析

◆ データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない

 モデルと聞くと何を思い浮かべるでしょうか。データサイエンスなどに馴染みのある方であれば、予測モデルや異常検知などの数理モデルなどを思い浮かべることでしょう。データサイエンスを実践する時、つまりデータ分析を実務で活用する際は予測モデルや異常検知などの数理モデル以外のモデルも必要になります。今回は「データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない」というお話しをします。

1、モデル

 データサイエンスなどに馴染みのない方であれば、ファッションモデルやプラモデルを思い浮かべる人も多いと思います。他にもデータモデルやビジネスモデル、プロセスモデルなど、モデルと名の付くものが世の中には多々あります。

(1) モデルの辞書的な意味

 辞書を引いてみるとモデルの意味は、次のようになっています。

  • 模範、手本または標準となるもの。また、今後の範とするために試みられたもの。
  • 模型、また、展示用の見本。
  • ある事象について、諸要素とそれら相互の関係を定式化して表したもの。
  • 美術家・写真家が制作の対象とする人や物。
  • 小説・戯曲などの題材となった実在の人や事件。
  • 機械・自動車などの型式。型。 引用元:デジタル大辞泉

 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

  • 自動車や機械などの型式。
  • 模型。 
  • 商品や事柄の標準となるもの。模範。手本。見本。
  • 画家・彫刻家・写真家などが、製作のとき対象として使う人物。 
  • 小説・戯曲などに描かれる人物の素材になった実在の人。
  • 問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。 引用元:大辞林 第三版

(2) データサイエンス実践(ビジネス活用)的なモデルの定義

 データサイエンスを実践する時、つまりデータ分析を実務で活用するときのモデルはデジタル大辞泉であれば:ある事象について、諸要素とそれら相互の関係を定式化して表したもの。大辞林 第三版であれば:問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。に近いのです。

 個人的には、以下の定義が一番しっくりきます。

 モデルとはある人間にとってのある状況、あるいは状況についての概念(idea) の明示的な解釈(explicit interpretation) である。モデルは数式、記号、あるいは言葉で表すことができるが本質的には、実体、プロセス、属性、およびそれらの関係についての記述(description)である。
引用元:Brian Wilson 著・根来 竜之監訳「システム仕様の分析学―ソフトシステム方法論― 」共立出版(1996年1月)
 私なりに表現すると「モデルとは現実世界を模したもので、何かしらの記号(数式や図など)で表現されたもの」となります。

 ポイントは現実世界を模したもの、記号(数式や図など)で表現されたものです。

2、数理モデル

 例えば、統計解析や機械学習などで登場する数理モデルは、数式という記号でモデルを表現しています。数式で表現された数理モデルは、あくまでも現実世界を模したもので、本物ではありません。したがって「数理モデルとは、現実世界を模したもので、数式という記号で表現されたもの」となります。

(1) 数理モデル以外のモデルには何があるのか

 データサイエンス実践(ビジネス活用)という立ち位置で考えると、数理モデル以外にも必要となるモデルがあります。例えばプロセスモデル(分析プロセスや活用プロセスなど)、モックアップ(レポートやダッシュボードの雛形)、データモデル(DBの雛形)、ビジネスモデル(収益を上げるための仕組みなど)あたりでしょうか。共通しているのは表現する時に数式化や図式化したり、何かしらの記号で表現することでしょう。当然ですが、現実世界そのものではなく、あくまでも現実世界を単純化し模倣したものです。

(2) 2種類のモデル

 モデルには大きく2種類あります。

  • 今現在の現実世界を表現した「As-Isモデル」(典型モデルや近似モデル)
  • こうあるべき現実世界を表現した「To-Beモデル」(理想モデルや規範モデル)

 例えば今現在の業務フローを図示化すれば、それは「As-Isモデル」型のプロセスモデルで、あるべき業務フローを図示化すれ...

データ分析

◆ データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない

 モデルと聞くと何を思い浮かべるでしょうか。データサイエンスなどに馴染みのある方であれば、予測モデルや異常検知などの数理モデルなどを思い浮かべることでしょう。データサイエンスを実践する時、つまりデータ分析を実務で活用する際は予測モデルや異常検知などの数理モデル以外のモデルも必要になります。今回は「データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない」というお話しをします。

1、モデル

 データサイエンスなどに馴染みのない方であれば、ファッションモデルやプラモデルを思い浮かべる人も多いと思います。他にもデータモデルやビジネスモデル、プロセスモデルなど、モデルと名の付くものが世の中には多々あります。

(1) モデルの辞書的な意味

 辞書を引いてみるとモデルの意味は、次のようになっています。

  • 模範、手本または標準となるもの。また、今後の範とするために試みられたもの。
  • 模型、また、展示用の見本。
  • ある事象について、諸要素とそれら相互の関係を定式化して表したもの。
  • 美術家・写真家が制作の対象とする人や物。
  • 小説・戯曲などの題材となった実在の人や事件。
  • 機械・自動車などの型式。型。 引用元:デジタル大辞泉

 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

  • 自動車や機械などの型式。
  • 模型。 
  • 商品や事柄の標準となるもの。模範。手本。見本。
  • 画家・彫刻家・写真家などが、製作のとき対象として使う人物。 
  • 小説・戯曲などに描かれる人物の素材になった実在の人。
  • 問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。 引用元:大辞林 第三版

(2) データサイエンス実践(ビジネス活用)的なモデルの定義

 データサイエンスを実践する時、つまりデータ分析を実務で活用するときのモデルはデジタル大辞泉であれば:ある事象について、諸要素とそれら相互の関係を定式化して表したもの。大辞林 第三版であれば:問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。に近いのです。

 個人的には、以下の定義が一番しっくりきます。

 モデルとはある人間にとってのある状況、あるいは状況についての概念(idea) の明示的な解釈(explicit interpretation) である。モデルは数式、記号、あるいは言葉で表すことができるが本質的には、実体、プロセス、属性、およびそれらの関係についての記述(description)である。
引用元:Brian Wilson 著・根来 竜之監訳「システム仕様の分析学―ソフトシステム方法論― 」共立出版(1996年1月)
 私なりに表現すると「モデルとは現実世界を模したもので、何かしらの記号(数式や図など)で表現されたもの」となります。

 ポイントは現実世界を模したもの、記号(数式や図など)で表現されたものです。

2、数理モデル

 例えば、統計解析や機械学習などで登場する数理モデルは、数式という記号でモデルを表現しています。数式で表現された数理モデルは、あくまでも現実世界を模したもので、本物ではありません。したがって「数理モデルとは、現実世界を模したもので、数式という記号で表現されたもの」となります。

(1) 数理モデル以外のモデルには何があるのか

 データサイエンス実践(ビジネス活用)という立ち位置で考えると、数理モデル以外にも必要となるモデルがあります。例えばプロセスモデル(分析プロセスや活用プロセスなど)、モックアップ(レポートやダッシュボードの雛形)、データモデル(DBの雛形)、ビジネスモデル(収益を上げるための仕組みなど)あたりでしょうか。共通しているのは表現する時に数式化や図式化したり、何かしらの記号で表現することでしょう。当然ですが、現実世界そのものではなく、あくまでも現実世界を単純化し模倣したものです。

(2) 2種類のモデル

 モデルには大きく2種類あります。

  • 今現在の現実世界を表現した「As-Isモデル」(典型モデルや近似モデル)
  • こうあるべき現実世界を表現した「To-Beモデル」(理想モデルや規範モデル)

 例えば今現在の業務フローを図示化すれば、それは「As-Isモデル」型のプロセスモデルで、あるべき業務フローを図示化すれば、それは「To-Beモデル」型のプロセスモデルになります。どちらも現実世界を模したもので、意味づけ(理想か現状か)が異なるだけです。

3、今回のまとめ

 今回は「データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない」というお話しをしました。どうしても、データサイエンスやデータ分析、機械学習というものに慣れ親しんでくると、モデルと聞くと数理モデルをイメージしてしまい、世間とズレてきます。モデルという概念には色々な意味があり、数理モデルだけがモデルではありません。

 ファッションモデルやプラモデルもモデルです。データサイエンス実践(ビジネス活用)という立ち位置で考えるとどうでしょうか?データサイエンスやデータ分析、機械学習などを活用しようとする時、数理モデルだけが必要なのではありません。他のモデルも必要になります。

 モデルとは現実世界を模したもので、何かしらの記号(数式や図など)で表現されたものです。データサイエンス実践(ビジネス活用)を考えた時、構築すべきモデルに抜け漏れがないか、確認してみることをお勧めします。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
売上伝票の明細データ データ分析講座(その42)

◆ 営業データの分析力のトレーニングは、売上伝票の明細データで始めれば、業績も上がり一石二鳥  企業規模があまり大きくない経営者から、よく次のような...

◆ 営業データの分析力のトレーニングは、売上伝票の明細データで始めれば、業績も上がり一石二鳥  企業規模があまり大きくない経営者から、よく次のような...


 データ分析・活用の戦略的資産 データ分析講座(その113)

  ◆ データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは  最近流行りのキーワードです。 AI(人工知能) ...

  ◆ データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは  最近流行りのキーワードです。 AI(人工知能) ...


時系列性を加味した因果推論でよく利用されるSC法 データ分析講座(その302)

  前回のデータ分析講座(その301)ABテストからExcelでも出来る差の差推定へで、ABテストにおいて時系列性(Before&...

  前回のデータ分析講座(その301)ABテストからExcelでも出来る差の差推定へで、ABテストにおいて時系列性(Before&...


「情報マネジメント一般」の活用事例

もっと見る
中小企業のセキュリティ対策を考える

◆ 企業の情報セキュリティと新型コロナウィルス対策の今  先日、駅のプラットフォ-ムで並んでいる時に、控えめに咳をしたら、前に並んでいた人にすかさず...

◆ 企業の情報セキュリティと新型コロナウィルス対策の今  先日、駅のプラットフォ-ムで並んでいる時に、控えめに咳をしたら、前に並んでいた人にすかさず...


簡易版DX/IoTから機械学習への移行

  ◆ DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に  産業界のニュースなどをインターネットで読んでいると...

  ◆ DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に  産業界のニュースなどをインターネットで読んでいると...


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...