誰かが困っているところで、循環経済を起こせ! データ分析講座(その221)

投稿日

データ分析

 

【この連載の前回:データ分析講座(その220)完璧にデータを集めなければならないのかへのリンク】

データサイエンスは、データとドメイン(データ活用の現場)の間の橋であり、その橋を走る汽車のようなものです。ドメイン(データ活用の現場)を覗いてみれば、そこには何かに困っている人がいます。何かに困っている人が、何に困っているのかを上手く説明出来るわけではありません。上手く説明できないどころか、何に困っているのかさえ明確に認識していないケースも多々あります。データサイエンスが上手くドメイン(データ活用の現場)で機能しているとき、ある現象が起こっています。サーキュラーエコノミー(循環経済、Circular Economy)です。

 

今回は、「誰かが困っているところで、データサイエンスの循環経済を起こせ!」というお話しをします。

【目次】
1.データサイエンスはお困りごとから始まる
(1)サーキュラーエコノミー(循環経済)
(2)データは新しい原油である
(3)分析レポートや数理モデルも捨てない
2.データベースの上書き問題
3.データサイエンスはサーキュラーエコノミー

 

1.データサイエンスはお困りごとから始まる

データサイエンスの出発点は、ドメイン(データ活用の現場)で起こっているお困りごとです。誰も困っていないのに、お節介にデータサイエンスを押し付けるのは最悪です。お困りごとといっても、明確に認識している場合と、そうでない場合があります。

 

さらに、今困っていなけど、未来のお困りごともあります。ドメイン(データ活用の現場)のお困りごとが、明確でない場合には、それを明確化する活動が必要になります。

 

(1)サーキュラーエコノミー(循環経済)

ところで、サーキュラーエコノミー(循環経済、Circular Economy)とは何でしょうか?これまでの経済はリニアエコノミー(直線経済、Linear Economy)と呼ばれています。自然界から取り出された資源やエネルギーなどを採掘し(Take)、それらを用いて製品などを生産し(Make)、それが不必要になると捨てる(Waste)、という形で消費され続ける経済です。

 

サーキュラーエコノミーとは、端的に言うと廃棄物を出すことなく資源を循環させることです。データサイエンスが上手く活用されている状態が、まさにサーキュラーエコノミーの状態を作っている。

 

(2)データは新しい原油である

データは新しい原油である、と言われています。リニアエコノミーの概念で考えると、発生したデータは何かしら活用された後に廃棄され、それ以上活用されません。集計や分析などに利用したデータを廃棄したりすることに該当します。場合によってが、何ら利用されることなく廃棄されることもあることでしょう。しかし、最近では過去データを積極的に廃棄することは稀になっているようです。

 

なぜならば、集計や分析などに利用したデータであっても、十分に利用価値があるからです。

 

(3)分析レポートや数理モデルも捨てない

集計や分析などに利用したデータだけでなく、集計や分析した結果をまとめた分析レポートや、そのとき構築した数理モデル(異常検知モデルや予測モデルなど)も、ある種のデータです。

 

データ分析

 

何を言いたいかと言うと、分析レポートや数理モデルもある種のデータなので捨てないようにしましょう。過去の分析レポートや数理モデルも、そこから多くの学びなどを得ることができます。どのような分析レポートを出したとき、現場ではどの部分を参考にし、どのような意思決定やアクションを起こしたのか、それは非常に有用な記録(データ)です。どのようなデータで、どのような数理モデルを構築したとき、どのくらいの精度で未来を予測し、どのように活かされたのか、それは非常に有用な記録(データ)です。

 

最近のBIツールのダッシュボードは、そういう意味では危険です。その時、その場で、どのようなダッシュボード(集計結果やグラフなど)を見たのかが分からなくなる可能性があるからです。数理モデルの定期的な更新(再学習)も、無邪気に実施すると危険です。1世代前や2世代前などの数理モデルがどういったものか分からなくなるからです。

 

2.データベースの上書き問題

恐ろしいことに、データベースにあるテーブルも上書き更新する人や組織もあります。上書きしたら、その前の状態のデータが消えてしまいます。これは、過去データを捨てているのと同じです。分析レポートや数理モデルを捨てること以上に、恐ろしいことです。消えたデータは、当然ながらもう利用することは出来ません。

 

3.データサイエンスはサーキュラーエコノミー

発生したデータは、一度利用されても、再利用可能です。どちらかと言うと、積極的に再利用されます。

 

データ分析

...

データ分析

 

【この連載の前回:データ分析講座(その220)完璧にデータを集めなければならないのかへのリンク】

データサイエンスは、データとドメイン(データ活用の現場)の間の橋であり、その橋を走る汽車のようなものです。ドメイン(データ活用の現場)を覗いてみれば、そこには何かに困っている人がいます。何かに困っている人が、何に困っているのかを上手く説明出来るわけではありません。上手く説明できないどころか、何に困っているのかさえ明確に認識していないケースも多々あります。データサイエンスが上手くドメイン(データ活用の現場)で機能しているとき、ある現象が起こっています。サーキュラーエコノミー(循環経済、Circular Economy)です。

 

今回は、「誰かが困っているところで、データサイエンスの循環経済を起こせ!」というお話しをします。

【目次】
1.データサイエンスはお困りごとから始まる
(1)サーキュラーエコノミー(循環経済)
(2)データは新しい原油である
(3)分析レポートや数理モデルも捨てない
2.データベースの上書き問題
3.データサイエンスはサーキュラーエコノミー

 

1.データサイエンスはお困りごとから始まる

データサイエンスの出発点は、ドメイン(データ活用の現場)で起こっているお困りごとです。誰も困っていないのに、お節介にデータサイエンスを押し付けるのは最悪です。お困りごとといっても、明確に認識している場合と、そうでない場合があります。

 

さらに、今困っていなけど、未来のお困りごともあります。ドメイン(データ活用の現場)のお困りごとが、明確でない場合には、それを明確化する活動が必要になります。

 

(1)サーキュラーエコノミー(循環経済)

ところで、サーキュラーエコノミー(循環経済、Circular Economy)とは何でしょうか?これまでの経済はリニアエコノミー(直線経済、Linear Economy)と呼ばれています。自然界から取り出された資源やエネルギーなどを採掘し(Take)、それらを用いて製品などを生産し(Make)、それが不必要になると捨てる(Waste)、という形で消費され続ける経済です。

 

サーキュラーエコノミーとは、端的に言うと廃棄物を出すことなく資源を循環させることです。データサイエンスが上手く活用されている状態が、まさにサーキュラーエコノミーの状態を作っている。

 

(2)データは新しい原油である

データは新しい原油である、と言われています。リニアエコノミーの概念で考えると、発生したデータは何かしら活用された後に廃棄され、それ以上活用されません。集計や分析などに利用したデータを廃棄したりすることに該当します。場合によってが、何ら利用されることなく廃棄されることもあることでしょう。しかし、最近では過去データを積極的に廃棄することは稀になっているようです。

 

なぜならば、集計や分析などに利用したデータであっても、十分に利用価値があるからです。

 

(3)分析レポートや数理モデルも捨てない

集計や分析などに利用したデータだけでなく、集計や分析した結果をまとめた分析レポートや、そのとき構築した数理モデル(異常検知モデルや予測モデルなど)も、ある種のデータです。

 

データ分析

 

何を言いたいかと言うと、分析レポートや数理モデルもある種のデータなので捨てないようにしましょう。過去の分析レポートや数理モデルも、そこから多くの学びなどを得ることができます。どのような分析レポートを出したとき、現場ではどの部分を参考にし、どのような意思決定やアクションを起こしたのか、それは非常に有用な記録(データ)です。どのようなデータで、どのような数理モデルを構築したとき、どのくらいの精度で未来を予測し、どのように活かされたのか、それは非常に有用な記録(データ)です。

 

最近のBIツールのダッシュボードは、そういう意味では危険です。その時、その場で、どのようなダッシュボード(集計結果やグラフなど)を見たのかが分からなくなる可能性があるからです。数理モデルの定期的な更新(再学習)も、無邪気に実施すると危険です。1世代前や2世代前などの数理モデルがどういったものか分からなくなるからです。

 

2.データベースの上書き問題

恐ろしいことに、データベースにあるテーブルも上書き更新する人や組織もあります。上書きしたら、その前の状態のデータが消えてしまいます。これは、過去データを捨てているのと同じです。分析レポートや数理モデルを捨てること以上に、恐ろしいことです。消えたデータは、当然ながらもう利用することは出来ません。

 

3.データサイエンスはサーキュラーエコノミー

発生したデータは、一度利用されても、再利用可能です。どちらかと言うと、積極的に再利用されます。

 

データ分析

 

例えば……

  • データベースから、必要なデータを抽出する
  • 抽出したデータで、データ分析や数理モデルを構築する
  • そのアウトプット(分析結果や予測結果など)を、現場に提供する
  • 現場では提供されたアウトプットを用い、意思決定し施策(アクション)を実施する
  • その施策(アクション)の結果、新たなデータ(実施した施策とその結果)が発生する
  • 新たに発生したデータを、データベースに追加する

……と言う感じで、グルグル循環します。

 

分析レポートも予測モデルも、どんどん進化します。ドメイン(データ活用の現場)も、どんどんより良い状態になったり、変わり続ける環境に適応し続けます。データサイエンスが上手くドメイン(データ活用の現場)で機能しているとき、サーキュラーエコノミー(循環経済、Circular Economy)という状態になっているのです。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
予測モデルの活用とは データ分析講座(その116)

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。  データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピッ...

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。  データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピッ...


見積システムによるDX(その2)

  【目次】 1.アナログ情報をデジタル化 2.プロセス全体をデジタル化 3.価値の創造と利益の拡大   ここ...

  【目次】 1.アナログ情報をデジタル化 2.プロセス全体をデジタル化 3.価値の創造と利益の拡大   ここ...


クロスセクションデータとは データ分析講座(その102)

◆ 時系列データをクロスセクションデータとして分析するもったいなさ  世の中の多くのデータは、時間という概念が紐づいた時系列データ(※1)です。時間...

◆ 時系列データをクロスセクションデータとして分析するもったいなさ  世の中の多くのデータは、時間という概念が紐づいた時系列データ(※1)です。時間...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第1回)‐  製品・技術開発力強化策の事例(その9)

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


中小製造業のウェブ戦略

 中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...

 中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...


既存コア技術強化のためのオープン・イノベーション:富士フイルムの例

 2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...

 2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...