株式会社技術情報協会

インフォマティクス実施のための実験データ収集・DB化と“少ないデータ”対策

2023/03/05

開催日 2023年5月19日(金)
開催地 Web

<セミナー No.305113>

インフォマティクス実施のための
実験データ収集・DB化と“少ないデータ”対策


☆ 機械学習に必要十分なデータ収集の手法や、そのためのDBプラットフォームとは?
☆ データが十分でないときの打開策、データ取得コストが高い分野での実践事例が聴ける!

----------------------------------------------------------------------------------
■講師 
【第1部】三井化学(株)DX推進本部 DX企画管理部 向田 志保 氏 
     (信州大学 工学部 特任准教授、大阪大学 基礎工学研究科 招へい教授)
【第2部】物質・材料研究機構 技術開発・共用部門 マテリアル先端リサーチインフラセンター 副センター長 松波 成行 氏 
【第3部】日本たばこ産業(株) 医薬総合研究所高槻サイト薬物動態研究所 主幹研究員 篠田 清孝 氏
【第4部】(株)レゾナック 計算情報科学研究センター チーフ・リサーチャー 南 拓也 氏 
【第5部】東レ(株) 先端材料研究所 デジタルマテリアルサイエンスG 研究員 山本 海 氏
     ※ 講演時には所属部署・役職に変更の可能性あり
■聴講料
1名につき66,000円(消費税込/資料付き)
1社2名以上同時申込の場合のみ1名につき60,500円(税込)
大学、公的機関、医療機関の方には割引制度があります。詳しくはお問い合わせください。
■Live配信セミナーの受講について
・本講座はZoomを利用したLive配信セミナーです。セミナー会場での受講はできません。
・下記リンクから視聴環境を確認の上、お申し込みください。
 → https://zoom.us/test
・開催日が近くなりましたら、視聴用のURLとパスワードをメールにてご連絡申し上げます。
 セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
・Zoomクライアントは最新版にアップデートして使用してください。
・パソコンの他にタブレット、スマートフォンでも視聴できます。
・セミナー配布資料は印刷物を郵送いたします。
・当日は講師への質問することができます。可能な範囲で個別質問にも対応いたします。
・本講座で使用される資料や配信動画は著作物であり、録音・録画・複写・転載・配布・上映・販売等を禁止いたします。
・本講座はお申し込みいただいた方のみ受講いただけます。
  複数端末から同時に視聴することや複数人での視聴は禁止いたします。
・Zoomのグループにパスワードを設定しています。部外者の参加を防ぐため、パスワードを外部に漏洩しないでください。
 万が一部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

プログラム 
(10:00~11:10)
【第1部】インフォマティクスへの活用を目指した実験データマネジメントとDB構築
三井化学(株)DX推進本部 DX企画管理部 向田 志保 氏 
(信州大学 工学部 特任准教授、大阪大学 基礎工学研究科 招へい教授)

【講座主旨】
実験データの活用においては、手元のデータだけではなく、外部データの取得や、能動的にデータを取得するシステムが重要である。近年は、すべてのDBをまとめて構造化する必要はなく、データを収集する手法も多様化しており、複数のDBを関連付けて扱うことができるRDBや、さらにはコストをかけずに、必要時に必要なだけのデータを取得することができる仮想データベース技術も発達している。さらに、自律型実験装置の導入により、人手をかけずに、ロボティクスが能動的にデータを取得する潮流も看過できない。さらには、自然言語処理を活用し、市況情報などとも結び付けて、市場ニーズに見合った製品開発を行うことが重要である。これらのデータの取得と実験の効率化を結び付け、包括的なデータハーベスティングシステムの構築に向けて概要を説明する。

【講座内容】
1.DBの活用
 1.1 実験に必要なデータの取得
 1.2 DBの種類
 1.3 外部データの活用
2.実験データマネジメント
 2.1 マテリアルDXの活用
 2.2 自律型実験装置とDBの連携
3.新規材料探索
 3.1 自然言語処理を活用したデータの可視化
 3.2 新規材料探索とマテリアルDXの連携
 3.3 サプライチェーンを考慮したデータの抽出方法
4. 実験DBの発展形
 4.1 仮想空間上のDB
 4.2 データハーベスティングシステム
【質疑応答】

略歴・活動など
2017年に三井化学に入社し、マテリアルズ・インフォマティクス(MI)に取り組む
現在はDX推進本部 DX企画管理部において、DX技術全般を担当
2022年4月より信州大学工学部客員准教授、11月より同特任准教授に着任
2023年1月より大阪大学基礎工学研究科招へい教授に着任

学会役員
日本化学会ケモインフォマティクス部会役員(2022年4月~)

著書
1. 共著, マテリアルズ・インフォマティクス Q&A集 ―解析事務と応用事例―, 情報機構, 2020年 
2. 共著, マテリアルズインフォマティクス のためのデータ作成とその解析、応用事例, 技術情報協会, 2021年 
3. 共著, 研究開発部門へのDX導入によるR&Dの効率化、実験の短縮化、業務効率化のポイント, 技術情報協会, 2022年 4. 共著, 量子技術の実用化と研究開発業務への導入方法, 技術情報協会, 2023年
5. 共著, ケモインフォマティクスにおけるデータ解析の進め方と具体的応用法(仮題), 技術情報協会, 2023年(発刊予定)

---------------------------------------------------------------
(11:20~12:30)
【第2部】マテリアルDX基盤におけるデータアーキテクチャ
     ~利活用を考慮したデータ構造化の進め方~

物質・材料研究機構 技術開発・共用部門マテリアル先端リサーチインフラセンター 副センター長 松波 成行 氏 

【講座主旨】
データ駆動型研究の進展に伴い、効率的なデータ収集の仕組みが求められている。機械学習等による新規材料を開発するマテリアルズインフォマティックス(MI)では、実験データ等を多角的にデータ収集することが予測モデルの構築や検証において極めて重要である。このようなマテリアル開発におけるデータ駆動型研究のためには、教師データ(学習データ/検証データ)となる計測装置等からのデータおよび、そのデータ構造化の方針を策定しておかなければならない。物質・材料研究機構では、計測・プロセス技術に特化したデータ構造化の設計指針をもとにICT技術を活用したデータ収集を省人的に進めるDX基盤(マテリアルDX基盤)を運用している。本セミナーでは、マテリアルDX基盤に必要となるデータ設計(データアーキテクチャ)の考え方について紹介する。

【講座内容】
1.なぜデータ構造化が必要か ― Why ―
 ・データをとりまく環境の変化
 ・データ利活用の研究動向
 ・データ収集ができない主な理由
 ・科学技術のデータ収集で直面する三重苦
 ・ソリューション: データ構造化とデータ設計
 ・データ構造化のポイント
2.データ構造化で何ができるか ― What ―
 ・データ構造化システムの概要
 ・データ構造化のシステムデザイン
 ・機器の分類
 ・データ構造化による自動化機能
 ・データセットの活用形態例 
 ・データ構造化のメリット
3.データ構造化のデータ設計指針 ― How ―
 ・データ構造化のための5D
 ・データ利活用におけるデータセットの基本構造
 ・計測分野におけるデータ空間の展開
 ・データ取得にかかる負荷(工数)
 ・データ設計の指針
 ・データ構造化の開発におけるフロー
【質疑応答】

略歴・活動など
1998年北海道大学大学院地球環境科学研究科博士課程修了。博士(地球環境科学)。現職では、データエンジニアリングに関わるデータ基盤のネットワーク・システム設計などのインフラ構築のほか、科学技術分野のデータ収集・蓄積・流通にかかるデータ設計(データアーキテクチャ)やデータ構造化開発を任務。
---------------------------------------------------------------
(13:20~14:50)
【第3部】創薬DXにおける研究データのDB化とそのシステム構築
日本たばこ産業(株) 医薬総合研究所高槻サイト薬物動態研究所 主幹研究員 篠田 清孝 氏 

【講座主旨】
演者は,日本たばこ産業株式会社の医薬総合研究所内にある薬物動態研究所(以下JT薬物動態研究所と記載)においてITの仕事に従事しており,創薬研究のステージでJT薬物動態研究所が実施する各種評価の結果,発生する様々なデータ(創薬ADME評価データ)をDBに登録するシステムを,機械学習ツール「KNIME」を利用して作成して運用している。また,DB登録したデータを検索して可視化・ダウンロードするシステムもKNIMEを用いて構築し,利用してもらっている。
本講演ではJT薬物動態研究所における創薬ADMEデータの管理にKNIME Serverを活用している事例を発表する。また併せてDB登録を含む創薬研究における一般的なKNIMEの利用例についてソフトウェアの実演を通して紹介する。

【講座内容】
1.日本たばこ産業株式会社(JT)の医薬事業のご紹介
2.JT医薬総合研究所における医薬品の研究開発
3.創薬研究と薬物動態(ADME)
4.創薬DXにおける創薬ADME評価データの重要性
5.評価データのDB化
6.DB化した評価データの可視化
7.KNIMEの概要
8.創薬研究におけるKNIMEの利用
9.製薬企業でのKNIME導入
10.KNIMEを利用したデータ登録システムのプロセス
11.データ登録システムに実装している機能の詳細
12.KNIMEを利用したデータ可視化システム
13.ソフトウェア(KNIME)を利用した実演(インフォコム社様)
【質疑応答】

略歴・活動など
1986年3月名古屋大学工学部応用化学科卒業
1988年3月名古屋大学工学研究科修士課程修了
1988年4月東洋紡績株式会社入社
1996年3月日本たばこ産業株式会社入社
2006年より現職
著書    月刊 PHAMSTAGE 2022年1月号「機械学習ツールによるデータ管理の自動化」
技術情報協会「タンパク質構造解析手法とIn silicoスクリーニングへの応用」第7章第7節、「KNIMEを活用した創薬研究効率化の取り組み」
---------------------------------------------------------------
(15:00~16:10)
【第4部】ベイズ最適化による少数データでの材料設計
(株)レゾナック 計算情報科学研究センター チーフ・リサーチャー 南 拓也 氏 

【講座主旨】
企業においてデータ解析を行う際に、データ数が少ない問題に直面することが多い。とりわけ材料分野では、従来にない新しい材料を開発することが必要であり、基本的にはデータがない外挿領域を探索することが必要となる。本講演では、データ数が少ない場合の材料探索の事例としてベイズ最適化の事例をご紹介する。また、その他データ収集・少数データでの解析事例についてもご紹介する。

【講座内容】
1.はじめに
2.データ解析、マテリアルズインフォマティクスについて
3.熱可塑性ポリマー設計の事例紹介
 3.1 予測モデル構築
 3.2 機械学習と計算科学との比較
 3.3 ポリマー物性予測と適用限界
 3.4 ベイズ最適化による少数データでのポリマー設計
4.その他事例のご紹介
【質疑応答】

略歴・活動など
2013年大阪大学基礎工学研究科物質創成専攻博士後期課程修了。
2013年昭和電工株式会社入社。
2016年先端素材高速開発技術研究組合兼務。
会社統合・社名変更にともない、現在は株式会社レゾナックに所属
共著
「材料およびプロセス開発のためのインフォマティクスの基礎と研究開発最前線」
---------------------------------------------------------------
(16:20~17:30)
【第5部】少ないデータでインフォマティクスを行う際のデータ準備・対応の事例
東レ(株) 先端材料研究所 デジタルマテリアルサイエンスG 研究員 山本 海 氏
※ 講演時には所属部署・役職に変更の可能性あり

【講座主旨】
インフォマティクス適用には「大量」のデータが必要とされるが、現実には数十件程度しか使えないことが多い。しかし「大量」とは何だろうか?「少量」であれば、どのようにすれば「役に立つ」のか?そのために必要な技術は何か?これらの疑問への対応方法を、弊社における組成設計の取り組み事例を元に議論する。

【講座内容】
―はじめに
 ・データが「少ない」とは?
 ・少なくなりがちなデータの特徴
―「少ない」データのインフォマティクス事例
 ・組成設計の位置づけ
 ・データ前処理とアルゴリズム選択
―発展的な対応方法
 ・データを「増やす」アプローチ
 ・「多い」データの活用
【質疑応答】

略歴・活動など
2014年 Ph. D, Department of Physics, College of Engineering, University of Illinois, Urbana-Champaign
2014~2017 Post-Doctoral Scholar, Division of Chemistry and Chemical Engineering, California Institute of Technology
2017/11~現在 東レ
著書
マテリアルズ・インフォマティクスQ&A集-解析実務と応用事例- 第1章(情報機構)
ケモインフォマティクス(技術情報協会)

企業情報

株式会社技術情報協会

詳しく見る

TOP