目次
私はGemini 3.1 Proの実力を確かめるため、先端パッケージングの最新論文(MgOフィラーによる高放熱材料)からARIAへ与える因果関係を抽出する作業を依頼しました。最新の大規模言語モデルの性能を信じ、指示はシンプルに「材料、工程、特性の因果関係をMarkdown形式で抽出して」というものにしました。
出力されたMarkdownファイルの内容は、一見すると、分かりやすくまとまっています。「これ、イケてるかも。楽して次の作業に進める!」という大きな期待も虚しく、実際の採点結果は「20点の赤点!」。
また、ボールミリング(混合)、CIP(冷間等方圧加圧)、スプレードライ(噴霧乾燥)、高分子前駆体法といった、形状を決定づける最重要プロセスが完全に欠落していました。このような欠陥データをARIAに投入するなど、言語道断です。
二段構えの矯正術であるメタ・プロンプティングとは、プロンプトを直接AIに投げ込むのではなく、AIエージェントにはプロジェクトの全体像に関する情報を与え、AI自身に「作業計画」を書かせます(1st step)。その後、私は、AIが立てた作業計画が適切かをチェックします(2nd step)。つまり、AIを「プロジェクトの設計パートナー」として扱いつつ、二段階で私のVibeを注入する手法、それがメタ・プロンプティングです。
読者の方に「おっ」と思っていただきたいポイントは、今回のように複雑な工程や作業を必要とするタスクでは、AIにプロンプトを直接注入して強制するのではなく、私のVibeを「AI自身が立てた作業計画」の中に書き込ませることで、順守すべき「憲法」として認識させる方法だということです。
致命的欠陥を正すために「どんなVibe(専門知識)をAIに注入すべきか?」それを知るために私が取った作戦は、AIと「別チャット」で徹底的な原因究明を行うことです。そして、明らかになった致命的欠陥の根幹は、「自由過ぎる形式(Markdown)」故に、材料科学では常識的な「物理的な縛り」がほとんど抜け落ちている、ということです。
そこで私は「物理的な縛り」の設計に着手し、最終的に以下の6つにまとめました。
新しく設計した「物理的な縛り」に基づき、再度MgOフィラーによる高放熱材料の論文から因果関係の抽出を行った結果、「一級燃料」が抽出されました。(結果のJSONを挿入する)
第1回のトライアルでは 「フィラーの作成工程において、スプレードライの具体的に条件が論文中に欠落しており、推論に飛躍がある」と、技術的懸念事項を自ら申告するようになりました。
バルク、フィラー、TIMそれぞれの依存関係と時間軸が正しく整理され、かつ、以前は抜け落ちていた「ボールミリング(混合)、CIP(冷間等方圧加圧)、スプレードライ(噴霧乾燥)」といった重要項目も正しく抽出されました。
これで完璧かと少し浮かれていましたが、仔細確認した結果、まだいくつか抜け漏れがあり、完成度は90点。ここで妥協しては後の結果への影響が大きいため、もう少しだけ抽出プロンプトの調整を継続しました。
ついに完成度は98点へ!シミュレーションと実測値の区別も、スキーマレベルで以下のように実装しました。
これで、ARIAがそのまま推論に使えるレベルの構造化データ(JSON-LD)を作成するルートが完成しました。
Geminiのような大規模言語モデルの性能進化は著しいため、VibLogのコンセプトを初めて知った読者の中には、「どうせAIに丸投げする検証でしょ!」と思ったかもしれません。しかし、どんなにAIの性能が向上しようとも、私にとってAIはパートナーであり、「AIとの向き合い方」を間違えると、成功への道は遠のきます。今回の記事を参考に、材料研究者の一人でも多くが、AIをパートナーとして使いこなしてもらえれば、こんなにうれしいことはありません。
さて、次回はいよいよ、論文から抽出した因果情報をARIAに注入した結果をお伝えする予定です。合計5報の論文から、「44ノード・22エッジの有効非巡回グラフ(DAG)」を作成できるところまで確認が終わっています。しかし、実のところ、この原稿を執筆時点では、ARIAにデータを注入する作業は行っていません。
一体どこに着地するのか筆者にも全く分からずドキドキが止まりません。結果報告を期待して待っていてもらえると幸いです。
参考文献 / References