誰かが困っているところで、循環経済を起こせ! データ分析講座(その221)

投稿日

データ分析

 

【この連載の前回:データ分析講座(その220)完璧にデータを集めなければならないのかへのリンク】

データサイエンスは、データとドメイン(データ活用の現場)の間の橋であり、その橋を走る汽車のようなものです。ドメイン(データ活用の現場)を覗いてみれば、そこには何かに困っている人がいます。何かに困っている人が、何に困っているのかを上手く説明出来るわけではありません。上手く説明できないどころか、何に困っているのかさえ明確に認識していないケースも多々あります。データサイエンスが上手くドメイン(データ活用の現場)で機能しているとき、ある現象が起こっています。サーキュラーエコノミー(循環経済、Circular Economy)です。

 

今回は、「誰かが困っているところで、データサイエンスの循環経済を起こせ!」というお話しをします。

【目次】
1.データサイエンスはお困りごとから始まる
(1)サーキュラーエコノミー(循環経済)
(2)データは新しい原油である
(3)分析レポートや数理モデルも捨てない
2.データベースの上書き問題
3.データサイエンスはサーキュラーエコノミー

 

1.データサイエンスはお困りごとから始まる

データサイエンスの出発点は、ドメイン(データ活用の現場)で起こっているお困りごとです。誰も困っていないのに、お節介にデータサイエンスを押し付けるのは最悪です。お困りごとといっても、明確に認識している場合と、そうでない場合があります。

 

さらに、今困っていなけど、未来のお困りごともあります。ドメイン(データ活用の現場)のお困りごとが、明確でない場合には、それを明確化する活動が必要になります。

 

(1)サーキュラーエコノミー(循環経済)

ところで、サーキュラーエコノミー(循環経済、Circular Economy)とは何でしょうか?これまでの経済はリニアエコノミー(直線経済、Linear Economy)と呼ばれています。自然界から取り出された資源やエネルギーなどを採掘し(Take)、それらを用いて製品などを生産し(Make)、それが不必要になると捨てる(Waste)、という形で消費され続ける経済です。

 

サーキュラーエコノミーとは、端的に言うと廃棄物を出すことなく資源を循環させることです。データサイエンスが上手く活用されている状態が、まさにサーキュラーエコノミーの状態を作っている。

 

(2)データは新しい原油である

データは新しい原油である、と言われています。リニアエコノミーの概念で考えると、発生したデータは何かしら活用された後に廃棄され、それ以上活用されません。集計や分析などに利用したデータを廃棄したりすることに該当します。場合によってが、何ら利用されることなく廃棄されることもあることでしょう。しかし、最近では過去データを積極的に廃棄することは稀になっているようです。

 

なぜならば、集計や分析などに利用したデータであっても、十分に利用価値があるからです。

 

(3)分析レポートや数理モデルも捨てない

集計や分析などに利用したデータだけでなく、集計や分析した結果をまとめた分析レポートや、そのとき構築した数理モデル(異常検知モデルや予測モデルなど)も、ある種のデータです。

 

データ分析

 

何を言いたいかと言うと、分析レポートや数理モデルもある種のデータなので捨てないようにしましょう。過去の分析レポートや数理モデルも、そこから多くの学びなどを得ることができます。どのような分析レポートを出したとき、現場ではどの部分を参考にし、どのような意思決定やアクションを起こしたのか、それは非常に有用な記録(データ)です。どのようなデータで、どのような数理モデルを構築したとき、どのくらいの精度で未来を予測し、どのように活かされたのか、それは非常に有用な記録(データ)です。

 

最近のBIツールのダッシュボードは、そういう意味では危険です。その時、その場で、どのようなダッシュボード(集計結果やグラフなど)を見たのかが分からなくなる可能性があるからです。数理モデルの定期的な更新(再学習)も、無邪気に実施すると危険です。1世代前や2世代前などの数理モデルがどういったものか分からなくなるからです。

 

2.データベースの上書き問題

恐ろしいことに、データベースにあるテーブルも上書き更新する人や組織もあります。上書きしたら、その前の状態のデータが消えてしまいます。これは、過去データを捨てているのと同じです。分析レポートや数理モデルを捨てること以上に、恐ろしいことです。消えたデータは、当然ながらもう利用することは出来ません。

 

3.データサイエンスはサーキュラーエコノミー

発生したデータは、一度利用されても、再利用可能です。どちらかと言うと、積極的に再利用されます。

 

データ分析

...

データ分析

 

【この連載の前回:データ分析講座(その220)完璧にデータを集めなければならないのかへのリンク】

データサイエンスは、データとドメイン(データ活用の現場)の間の橋であり、その橋を走る汽車のようなものです。ドメイン(データ活用の現場)を覗いてみれば、そこには何かに困っている人がいます。何かに困っている人が、何に困っているのかを上手く説明出来るわけではありません。上手く説明できないどころか、何に困っているのかさえ明確に認識していないケースも多々あります。データサイエンスが上手くドメイン(データ活用の現場)で機能しているとき、ある現象が起こっています。サーキュラーエコノミー(循環経済、Circular Economy)です。

 

今回は、「誰かが困っているところで、データサイエンスの循環経済を起こせ!」というお話しをします。

【目次】
1.データサイエンスはお困りごとから始まる
(1)サーキュラーエコノミー(循環経済)
(2)データは新しい原油である
(3)分析レポートや数理モデルも捨てない
2.データベースの上書き問題
3.データサイエンスはサーキュラーエコノミー

 

1.データサイエンスはお困りごとから始まる

データサイエンスの出発点は、ドメイン(データ活用の現場)で起こっているお困りごとです。誰も困っていないのに、お節介にデータサイエンスを押し付けるのは最悪です。お困りごとといっても、明確に認識している場合と、そうでない場合があります。

 

さらに、今困っていなけど、未来のお困りごともあります。ドメイン(データ活用の現場)のお困りごとが、明確でない場合には、それを明確化する活動が必要になります。

 

(1)サーキュラーエコノミー(循環経済)

ところで、サーキュラーエコノミー(循環経済、Circular Economy)とは何でしょうか?これまでの経済はリニアエコノミー(直線経済、Linear Economy)と呼ばれています。自然界から取り出された資源やエネルギーなどを採掘し(Take)、それらを用いて製品などを生産し(Make)、それが不必要になると捨てる(Waste)、という形で消費され続ける経済です。

 

サーキュラーエコノミーとは、端的に言うと廃棄物を出すことなく資源を循環させることです。データサイエンスが上手く活用されている状態が、まさにサーキュラーエコノミーの状態を作っている。

 

(2)データは新しい原油である

データは新しい原油である、と言われています。リニアエコノミーの概念で考えると、発生したデータは何かしら活用された後に廃棄され、それ以上活用されません。集計や分析などに利用したデータを廃棄したりすることに該当します。場合によってが、何ら利用されることなく廃棄されることもあることでしょう。しかし、最近では過去データを積極的に廃棄することは稀になっているようです。

 

なぜならば、集計や分析などに利用したデータであっても、十分に利用価値があるからです。

 

(3)分析レポートや数理モデルも捨てない

集計や分析などに利用したデータだけでなく、集計や分析した結果をまとめた分析レポートや、そのとき構築した数理モデル(異常検知モデルや予測モデルなど)も、ある種のデータです。

 

データ分析

 

何を言いたいかと言うと、分析レポートや数理モデルもある種のデータなので捨てないようにしましょう。過去の分析レポートや数理モデルも、そこから多くの学びなどを得ることができます。どのような分析レポートを出したとき、現場ではどの部分を参考にし、どのような意思決定やアクションを起こしたのか、それは非常に有用な記録(データ)です。どのようなデータで、どのような数理モデルを構築したとき、どのくらいの精度で未来を予測し、どのように活かされたのか、それは非常に有用な記録(データ)です。

 

最近のBIツールのダッシュボードは、そういう意味では危険です。その時、その場で、どのようなダッシュボード(集計結果やグラフなど)を見たのかが分からなくなる可能性があるからです。数理モデルの定期的な更新(再学習)も、無邪気に実施すると危険です。1世代前や2世代前などの数理モデルがどういったものか分からなくなるからです。

 

2.データベースの上書き問題

恐ろしいことに、データベースにあるテーブルも上書き更新する人や組織もあります。上書きしたら、その前の状態のデータが消えてしまいます。これは、過去データを捨てているのと同じです。分析レポートや数理モデルを捨てること以上に、恐ろしいことです。消えたデータは、当然ながらもう利用することは出来ません。

 

3.データサイエンスはサーキュラーエコノミー

発生したデータは、一度利用されても、再利用可能です。どちらかと言うと、積極的に再利用されます。

 

データ分析

 

例えば……

  • データベースから、必要なデータを抽出する
  • 抽出したデータで、データ分析や数理モデルを構築する
  • そのアウトプット(分析結果や予測結果など)を、現場に提供する
  • 現場では提供されたアウトプットを用い、意思決定し施策(アクション)を実施する
  • その施策(アクション)の結果、新たなデータ(実施した施策とその結果)が発生する
  • 新たに発生したデータを、データベースに追加する

……と言う感じで、グルグル循環します。

 

分析レポートも予測モデルも、どんどん進化します。ドメイン(データ活用の現場)も、どんどんより良い状態になったり、変わり続ける環境に適応し続けます。データサイエンスが上手くドメイン(データ活用の現場)で機能しているとき、サーキュラーエコノミー(循環経済、Circular Economy)という状態になっているのです。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
マーケティングや営業系のデータ分析:売上分析の目的 データ分析講座(その50)

◆ 目的無きデータ分析は無意味というけれど、売上分析に限れば結局3つしかないので、そこから選べばいい  目的無きデータ分析は、無意味だし、そもそも順...

◆ 目的無きデータ分析は無意味というけれど、売上分析に限れば結局3つしかないので、そこから選べばいい  目的無きデータ分析は、無意味だし、そもそも順...


自動機械学習 データ分析講座(その184)

    ◆ 古くて新しい自動機械学習 似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。この...

    ◆ 古くて新しい自動機械学習 似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。この...


サイバー攻撃事例、情報システムとの違い 制御システム(その2)

  【制御システム 連載目次】 1. セキュリティ脅威と歴史 2. サイバー攻撃事例、情報システムとの違い 3. リスク分析とセキュ...

  【制御システム 連載目次】 1. セキュリティ脅威と歴史 2. サイバー攻撃事例、情報システムとの違い 3. リスク分析とセキュ...


「情報マネジメント一般」の活用事例

もっと見る
Web上で試作受注するツールを成功させるポイントとは

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...


電子メール、簡潔過ぎると逆効果

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...


個票データの共用化でコストダウン

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...