生成AI・自然言語処理技術による材料開発の効率化とChatGPTのプロンプトエンジニアリングの活用

■本セミナーの主題および状況
→生成AIは、人工知能の一種であり、データから新しい情報やコンテンツを生成する能力を持つシステムやモデルを指し、自然言語処理は、人間が日常的に使用する言葉や文章をコンピュータや人工知能システムが理解し、解釈し、生成するための技術分野であります。本講習会では、上記のモデル、技術を活用した材料開発のポイントを解説いたします。
→ChatGPTの隆盛からもうかがわれるように、自然言語処理および生成AIは多くの産業や市場で注目を集めており、様々なアプリケーションも並行して開発されており、今後は新規材料開発の場面でより一層の需要と注目を集めることが予想されております。

■注目ポイント
★生成AI・自然言語処理に関する豊富な知見を有する第一人者が、大規模言語モデル(LLM)の概要、生成AIの導入、活用方法から始まり、具体的な材料開発への活用事例、そして現在話題となっているChatGPTのプロンプトエンジニアリングの取り組み方などについて紹介!
★LLMのオープンソースが日々更新されている中で、情報収集にも注力し、様々なツールを目的に応じて適切に使い分ける点についても解説!
★各社が保有する分野特化型の文書を、様々な観点から材料開発に活かすことを念頭に、様々な言語処理の特徴と、材料特化型のツール・モデルについて解説!
★材料開発への情報活用という観点から、自然言語ではない図や数式など、他の情報と組み合わせる(マルチモーダルAI)ことも重要と考えられ、非材料分野におけるマルチモーダルAIの開発についても解説!

セミナープログラム

【第1講】 生成AI・自然言語処理による材料開発の効率化とChatGPTのプロンプトエンジニアリングの活用

【時間】 13:00-15:00
【講師】三井化学株式会社/信州大学/大阪大学 DX推進本部 DX企画管理部 / 工学部 特任准教授 / 基礎工学研究科招聘教授 博士(工学) 向田 志保 氏

【講演主旨】
 昨年末にChatGPTが登場して以来、生成AIはAIの中でも最も急速に進化している分野となっている。化学・生物分野の材料開発においても、ChatGPTをはじめとする膨大なテキストデータを学習する大規模言語モデル(LLM)を用いた特許、文献、報告書からの情報抽出や分子生成といった事例が増えている。本セミナーでは、LLMの概要、生成AIの導入、活用方法から始まり、具体的な材料開発への活用事例、そして現在話題となっているChatGPTのプロンプトエンジニアリングの取り組み方などについて紹介する。

【プログラム】
1. 自然言語処理と生成AIの概要と重要性
  1.1 自然言語処理の基礎知識
  1.2 生成AIの基礎知識とその重要性
  1.3 材料開発における自然言語処理と生成AIの重要性
2. 大規模言語モデルとその活用
  2.1 大規模言語モデルの概要
  2.2 GPT-3, GPT-4の登場とその特徴
  2.3 ChatGPTの概要と活用事例
  2.4 プロンプトエンジニアリングとその活用
  2.5 生成AIのガイドラインとエチカルな使用
3. 自然言語処理と生成AIの材料開発への活用事例
  3.1 特許・文献調査、分類の自動化
  3.2 情報抽出とマテリアルDXへの活用
  3.3 分子生成における生成AIの活用
4. 自然言語処理と生成AIモデルの選択と活用
  4.1 生成AIのソフトウェアやAPIサービス(Azure OpenAI Serviceなど)
  4.2 情報収集における自然言語処理と生成AIモデルの使い分け
5. 材料開発における自然言語処理と生成AIの今後の展望
【質疑応答】

【キーワード】
材料開発、自然言語処理、生成AI、大規模言語モデル、LLM、ChatGPT、プロンプトエンジニアリング、化学

【講演のポイント】
LLMの導入のポイントとして、例えばセキュアとされるAzure OpenAI Serviceなどの既存サービスを導入するだけで良いというわけではない。これらのサービスはトークン数に応じた従量課金制であるため、大量の文書を一気に処理する際には注意が必要である。そのため、BERTや従来の自然言語処理とのハイブリッド活用も視野に入れることが想定される。さらに、LLMのオープンソースが日々更新されている中で、情報収集にも注力し、様々なツールを目的に応じて適切に使い分ける点についても触れていきたい。

【習得できる知識】
・生成AI、大規模言語モデル、ChatGPT、プロンプトエンジニアリングの概要
・生成AI周りの様々なサービス、活用方法、およびその注意事項
・生成を活用した化学・生物分野における材料開発のアイディア元


【第2講】 材料科学分野における言語処理:マテリアルズインフォマティクスの一部として

【時間】 15:10-16:25
【講師】物質・材料研究機構/MatQ-lab(個人事業主) NIMS特別研究員 / 個人事業主 吉武 道子 氏

【講演主旨】
材料開発の効率化に向けては、自然言語処理に先駆けて数値データの機械学習が取り入れられ、自動・自律実験が導入されつつある。自然言語処理については特許検索などで用いられてきたが、幅広くマテリアルズインフォマティクスの一部として取り入れる基盤として材料関連分野に特化したモデルやツールが提供されつつある。本セミナーでは、材料開発に言語処理を生かす様々な観点と、無償利用可能な材料特化型ツールおよびその基盤となる言語処理の考え方について紹介する。

【プログラム】
1.概観
 1.1 マテリアルズインフォマティクス/自動・自律実験
  材料開発ループと言語処理
  情報の種類:物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
 1.2 対象とする文書の種類と特徴
  論文、特許、書籍、安全・規制に関わる法的文書、社内文書
 1.3 言語処理の目的
  文書分類、検索(目的文書の抽出)、情報の抽出(文中の特定情報の抽出)、文書間関連付け、関連付けの検索
2.ChatGPTと言語モデル
 2.1 ChatGPT:APIとベースとなるGPT
 2.2 統計処理ベース(深層学習を含む)の手法の色々
  ・TF-IDE、N-gramなど
  ・単語ベクトル:Word2Vec、Doc2Vec
  ・BERT:pre-trainingとfine-tuning
 2.3 文法ベースの手法
  ・品詞解析
  ・構文解析/照応解析
 2.4 材料関連分野に特化したモデル
  a)様々なモデル
   Word2Vec系:Mat2Vec
   BERT系:SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
   ChemNLP
   MaterialGPT
  b)モデル利用時の注意点
   学習データ、単語辞書、モデル計算(初めからor代入?)、学習条件、検証のデータ
3.NIMSでの活用事例
 3.1 超電導データベース
 3.2 PoLyInfoデータベース
 3.3 マテリアルキュレーション支援システム
4.マルチモーダルAI
【質疑応答】

【キーワード】
材料開発、マテリアルズインフォマティクス、言語処理、材料特化型モデル、材料データベース作成

【講演のポイント】
主に、各社が保有する分野特化型の(大量の)文書を、様々な観点から材料開発に活かすことを念頭に、様々な言語処理の特徴と、材料特化型のツール・モデルについて触れる。また、物質・材料研究機構において自然言語処理を用いて生成されたデータベースについても紹介する。さらに、材料開発への情報活用という観点からは、自然言語ではない図や数式など、他の情報と組み合わせる(マルチモーダルAI)ことも重要と考えられ、非材料分野におけるマルチモーダルAIの開発についても触れる。

【習得できる知識】
・材料に特化した言語モデル・ツールの情報とその基礎となる言語処理の考え方
・分野特化型言語モデルの特性評価の現状
・言語処理を用いたデータベース作成例

セミナー講師

  • 第1部  三井化学株式会社/信州大学/大阪大学  DX推進本部 DX企画管理部 / 工学部 特任准教授 / 基礎工学研究科招聘教授 博士(工学)  向田 志保 氏
  • 第2部  物質・材料研究機構/MatQ-lab(個人事業主)  NIMS特別研究員 / 個人事業主  吉武 道子 氏

セミナー受講料

【1名の場合】44,000円(税込、資料作成費用を含む)


※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


13:00

受講料

44,000円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

全国

主催者

キーワード

化学技術一般   AI(人工知能)   デジタル情報管理

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


13:00

受講料

44,000円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

全国

主催者

キーワード

化学技術一般   AI(人工知能)   デジタル情報管理

関連記事

もっと見る