~スパコンは速くなった? 続・現場数学(その19)

投稿日

 

1.  新幹線とスパコン“速さ”の違い

 東北新幹線は最高時速260kmで走っていました。それが、特定区域(盛岡―宇都宮間)ですが最近、320kmにアップしました。これは確かに速くなったといえますが、一方で運行間隔を詰めたり、線路を増やし並走させても「輸送能力が上がった」だけで、お客さんにとって新幹線が速くなったわけではありません。もちろん、リニア中央新幹線の超伝導列車は、東海道新幹線と並走するだけでなく、時速505kmまで大幅に速度アップします。

 ところが「スーパーコンピューターが世界一速い」と言っている場合、新幹線の話とはまるで違い、こちらは「総合処理能力」(=新幹線でいえば「輸送能力」)が上がったことを指しているのです。スパコンではCPU(中央処理装置)のクロック速度が新幹線の速さに当たるものですが、それは下の図の様にここ20年間、上がっていません(昔からベクトル処理をしたり、演算器を複数付けたり、最近ではCPUの中にコア等の構造を作ったりしているので、5年に10倍(ムーアの法則)というトレンドを維持しながら、処理能力はどんどん上がっています。)。

 この事情の基盤的な理由は計算速度がほぼ20年前にそれ位で良くなり、沢山の業務をこなす方が大事という判断に基づくものです(銀行業務にしろVRにしろ、昔のように処理速度が遅いという話はなくなりました)。同じサイズの計算機で、沢山の業務をこなすには小さくするしかありません(実際はエネルギー、発熱の問題が発生して、その対処が大変になりますが…)。CPUではこの問題を「線幅」と呼びます。それは小さい領域に入れる演算器(トランジスタ)の増え方よりも遙(はる)かに配線数の増え方が多くなるからです(組み合せの数で増えます)。今では線幅は10nmのオーダーになっています(この場合、構造的には1nmまで制御しないときれいに作れない)。こうなると古典的な電流というよりは、量子力学的な電子の振る舞いが効いてしまいます。金属配線は電気を通すがシリコン基板は流れない、という概念が成り立たなくなり、どっちも通る(リークする。現状既に数十%)ことになってしまったのです。エラーが起こることを前提に、その処理を余分に付けたビットをチェックしながら処理しています。

 

2.  複数ノードの並列処理にも限界

 この20年間、もちろん線幅を細くしていただけではありません。画像処理用GPUやAI処理用TPU等の専用処理装置が作られ、暗号解読等を得意とする量子コンピューターも期待されています。ただ、これらは各々の得意分野では素晴らしい性能を示しますが汎用ではないのです。

 私の様な数値計算をしている研究者にとって、現在のスパコンの処理速度は到底満足できるものではありません。それどころか、薬や材料の理論設計をしようとすると「現在のスパコンはとても遅い装置」です。そのため、大幅な近似計算をして何とか計算結果を得ているのです(例えば、新型発光LEDの発光波長を理論設計するには電子数の6乗で増えるGW近似が最低必要です。一般にはもっと雑な電子数の3乗で増える近似に、実験値を取り込んで現象論的計算をしています)。それでもメモリが現在の100GB程度では全く足りず、複数のノード(共通メモリに繋がった複数のCPUからなる装置)を並列に使います。「1日で処理を完了したい」と設定すると、多くのノードが必要になり、計算といっても意味のある部分より、ノード間データ移動が主となってしまいます。挙げ句の果て、データ交換用に使う1ノード内メモリがオーバーフローしてしまうので、並列処理もせいぜい数十ノードが限界になります。並列化するには、もっと粗い近似(精度を落としてノード間通信を減らす)が必要になるという、相反する条件が発生するのです。

 

3. “ものづくり日本”の気概で独自開発!

 この状況下、現場数学では何を注意すれば良いのでしょうか?

 業務上、計算機が遅くて困ったことはないので問題ない、という答えもあります。CADでも画像処理でも、それなりのマシーンを用意すれば、問題なく仕事が遂行できます。テレビだって8Kを買ってみたけど4Kと区別が付かない、テレビゲームや映画もものすごくリアルに表現できている(昔の恐竜の皮膚はツルツル、今は毛が生えていて動くとなびく、これも動画作成用計算機の処理能力が上がったから)…。しかし、今でも問題は沢山あります。大きいファイルをコピーしようとするといつまでも終わらない、テレワークやテレビ会議ではネットワークが遅かったり、途切れたりします。遠隔で合奏ともなればもっと大変です(YAMAHAのSYNCROOMがネットワークによる演奏時における音の遅れを解決しました。これも凄い技術です)。「5Gになったら快適」みたいな宣伝は、その範囲までなら快適…。というインチキなことは誰でも知っています。それに合うレベルのソフトを作って、売るだけのことです(ただ、もう既に人間の認知能力以上の性能になりつつあるのも事実です)。

 いつの世も「上に政策あれば、下に対策あり」です。我々もこの環境の中で、世界一のスパコン等に過大な期待はせず、最適な設定をして、ものづくりに励むしかないのです。しかし「これではつまらない!」。そうです。この20年、やることを間違っていたのです。米国任せにせず、抜本的な進展をものづくり日本から再度起...

 

1.  新幹線とスパコン“速さ”の違い

 東北新幹線は最高時速260kmで走っていました。それが、特定区域(盛岡―宇都宮間)ですが最近、320kmにアップしました。これは確かに速くなったといえますが、一方で運行間隔を詰めたり、線路を増やし並走させても「輸送能力が上がった」だけで、お客さんにとって新幹線が速くなったわけではありません。もちろん、リニア中央新幹線の超伝導列車は、東海道新幹線と並走するだけでなく、時速505kmまで大幅に速度アップします。

 ところが「スーパーコンピューターが世界一速い」と言っている場合、新幹線の話とはまるで違い、こちらは「総合処理能力」(=新幹線でいえば「輸送能力」)が上がったことを指しているのです。スパコンではCPU(中央処理装置)のクロック速度が新幹線の速さに当たるものですが、それは下の図の様にここ20年間、上がっていません(昔からベクトル処理をしたり、演算器を複数付けたり、最近ではCPUの中にコア等の構造を作ったりしているので、5年に10倍(ムーアの法則)というトレンドを維持しながら、処理能力はどんどん上がっています。)。

 この事情の基盤的な理由は計算速度がほぼ20年前にそれ位で良くなり、沢山の業務をこなす方が大事という判断に基づくものです(銀行業務にしろVRにしろ、昔のように処理速度が遅いという話はなくなりました)。同じサイズの計算機で、沢山の業務をこなすには小さくするしかありません(実際はエネルギー、発熱の問題が発生して、その対処が大変になりますが…)。CPUではこの問題を「線幅」と呼びます。それは小さい領域に入れる演算器(トランジスタ)の増え方よりも遙(はる)かに配線数の増え方が多くなるからです(組み合せの数で増えます)。今では線幅は10nmのオーダーになっています(この場合、構造的には1nmまで制御しないときれいに作れない)。こうなると古典的な電流というよりは、量子力学的な電子の振る舞いが効いてしまいます。金属配線は電気を通すがシリコン基板は流れない、という概念が成り立たなくなり、どっちも通る(リークする。現状既に数十%)ことになってしまったのです。エラーが起こることを前提に、その処理を余分に付けたビットをチェックしながら処理しています。

 

2.  複数ノードの並列処理にも限界

 この20年間、もちろん線幅を細くしていただけではありません。画像処理用GPUやAI処理用TPU等の専用処理装置が作られ、暗号解読等を得意とする量子コンピューターも期待されています。ただ、これらは各々の得意分野では素晴らしい性能を示しますが汎用ではないのです。

 私の様な数値計算をしている研究者にとって、現在のスパコンの処理速度は到底満足できるものではありません。それどころか、薬や材料の理論設計をしようとすると「現在のスパコンはとても遅い装置」です。そのため、大幅な近似計算をして何とか計算結果を得ているのです(例えば、新型発光LEDの発光波長を理論設計するには電子数の6乗で増えるGW近似が最低必要です。一般にはもっと雑な電子数の3乗で増える近似に、実験値を取り込んで現象論的計算をしています)。それでもメモリが現在の100GB程度では全く足りず、複数のノード(共通メモリに繋がった複数のCPUからなる装置)を並列に使います。「1日で処理を完了したい」と設定すると、多くのノードが必要になり、計算といっても意味のある部分より、ノード間データ移動が主となってしまいます。挙げ句の果て、データ交換用に使う1ノード内メモリがオーバーフローしてしまうので、並列処理もせいぜい数十ノードが限界になります。並列化するには、もっと粗い近似(精度を落としてノード間通信を減らす)が必要になるという、相反する条件が発生するのです。

 

3. “ものづくり日本”の気概で独自開発!

 この状況下、現場数学では何を注意すれば良いのでしょうか?

 業務上、計算機が遅くて困ったことはないので問題ない、という答えもあります。CADでも画像処理でも、それなりのマシーンを用意すれば、問題なく仕事が遂行できます。テレビだって8Kを買ってみたけど4Kと区別が付かない、テレビゲームや映画もものすごくリアルに表現できている(昔の恐竜の皮膚はツルツル、今は毛が生えていて動くとなびく、これも動画作成用計算機の処理能力が上がったから)…。しかし、今でも問題は沢山あります。大きいファイルをコピーしようとするといつまでも終わらない、テレワークやテレビ会議ではネットワークが遅かったり、途切れたりします。遠隔で合奏ともなればもっと大変です(YAMAHAのSYNCROOMがネットワークによる演奏時における音の遅れを解決しました。これも凄い技術です)。「5Gになったら快適」みたいな宣伝は、その範囲までなら快適…。というインチキなことは誰でも知っています。それに合うレベルのソフトを作って、売るだけのことです(ただ、もう既に人間の認知能力以上の性能になりつつあるのも事実です)。

 いつの世も「上に政策あれば、下に対策あり」です。我々もこの環境の中で、世界一のスパコン等に過大な期待はせず、最適な設定をして、ものづくりに励むしかないのです。しかし「これではつまらない!」。そうです。この20年、やることを間違っていたのです。米国任せにせず、抜本的な進展をものづくり日本から再度起こせばよいのです。

 米中の国際問題の影響もあり、中国は独自開発に向かっています。我々もCPUやソフトは買ってくるものと決めつけず、再び独自開発に戻り、“ものづくり日本”の気概を取り戻しましょう。先日も、私の主催する国際会議アジア計算材料学コンソーシアムのTV会議をZoomで開こうとしたら、中国からTencentで行いたいとの意見が出ました。こういったところまで中国製を使ってほしいと主張されると、日本がソフトでも完全に負けているのがよく分かります。日本製のTV会議システムで世界に広まった例はありません…。便利だから使うという今のやり方を抜本的に変え、世界的に使われるオリジナルなハードとソフトをものづくりの日本の心を込めて作りましょう!それには、時間がかかりますし、将来の技術者育成が重要です。今、始まっているコンピューター教育(リテラシーとプログラミング)を基本から見直す必要があります。現在のカリキュラムでオペレーターやプログラマーは育成できますし、それも必要ですが、もっと大事なことは、オリジナルな「もの」を作るための基礎をじっくりと教えることです。

   続きを読むには・・・


この記事の著者

川添 良幸

市販の材料設計シミュレーションプログラムでは満足できない御社技術者に、本当に意味のある物理の基本に基づいた設計法を伝授します。我々の計算と実験結果が合わない場合は実験の方に問題があると言えるレベルを達成しています。

市販の材料設計シミュレーションプログラムでは満足できない御社技術者に、本当に意味のある物理の基本に基づいた設計法を伝授します。我々の計算と実験結果が合わな...


「SQC一般」の他のキーワード解説記事

もっと見る
天体は音楽を奏でる? ~奇跡的一致の不思議 現場数学(その5)

  1. 天体運動に思い馳せたピタゴラス  数学といえば、現場数学であろうが純粋数学であろうが、何と言ってもピタゴラスです。紀元前500...

  1. 天体運動に思い馳せたピタゴラス  数学といえば、現場数学であろうが純粋数学であろうが、何と言ってもピタゴラスです。紀元前500...


工程能力指数-Cp/Cpk 工程能力の理解 (その2)

  【目次】   1.行程能力の指数化  前回のその1に続いて解説します。スペックに対し特性の分布がどの程度余...

  【目次】   1.行程能力の指数化  前回のその1に続いて解説します。スペックに対し特性の分布がどの程度余...


統計手法の中の『層別』とは

   今回は、統計手法の中の層別という分析手法について、解説します。    層別の基本的意味について整理してみますと、一般の方で...

   今回は、統計手法の中の層別という分析手法について、解説します。    層別の基本的意味について整理してみますと、一般の方で...


「SQC一般」の活用事例

もっと見る
飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...


統計教育が必須な検査担当者

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...


第1種の誤りと第2種の誤り

 「あわて者の誤り」と「ぼんやり者の誤り」をご存知ですか、あわて者の誤りは正式には『第一種の誤り』(Type Ⅰ error)と呼称し、ぼんやり者の誤りは...

 「あわて者の誤り」と「ぼんやり者の誤り」をご存知ですか、あわて者の誤りは正式には『第一種の誤り』(Type Ⅰ error)と呼称し、ぼんやり者の誤りは...