目次
前回の記事では、先端パッケージングという技術進展が凄まじく、かつ論文の記述が不十分な分野において、データの欠落を補完する推論エンジン「ARIA」が救世主になりえるのか、という問いを投げかけました。
長年、化学業界で飯を食ってきた私の実感としては、論文や特許は「肝心なこと」が抜け落ちています。その行間を読み解き、点と線をつなぐことを「Vibe(直感)」と呼び、また、そのようなことをできる者を「熟練者/専門家」と称してきました。
ARIAは、その「行間」を埋めてくれる「熟練者/専門家」であるといいます。しかし、ここで、一つの根源的な疑念が浮かびます。
「もし、エンジン(ARIA)に投入するデータそのもの(あるいはそこから作り出された知識グラフ)が、AIの吐き出した『もっともらしいウソ(ハルシネーション)』交じりの不正確なものだったら?」
エンジンの性能を云々する前に、まず私たちはARIAに与える「因果の純度」を極限まで高めた燃料を作り出す仕組みを持たなくてはいけません。そう考え、私は独自のパイプラインを構築しました。
それが、本プロジェクトの核となる「VibLog(バイブログ)」です。
具体的には、L(LLMによる採掘)、K(知識グラフによる精製)、A(ARIAによる推論)の3つのステップを繋いだパイプラインであり、私はこれを親しみを込めて 「L-K-A」と呼んでいます。
VibLogは、単なるAIによる要約ツールではありません。熟練者の「Vibe」を、材料科学の「Logic」へと変換し、最終的に「ARIA」へつなぐための3段構えの精錬所です。
図1:VibLogにおけるL-K-Aパイプラインの概念図。物理の型(PSP)を経て因果を精錬する。
まずは、Gemini 3.1 Proという強力な重機を使い、論文の海から因果関係を抽出します。しかし、ただ「因果関係を抽出して」と頼むだけでは、AIは「要約レベルの20点の回答」しか出してきません。前後関係がバラバラなプロセスフローを示すなど、多くの欠陥が存在します。
掘り出した知見を、そのままARIAに渡すことはできません。そこで、私はTsitsveroの知見を取り入れ、PSP (Process-Structure-Property)という材料科学の「型」を用意しました。
単なるデータの羅列ではなく、「この工程(Process)を経た瞬間に、物理状態(Structure)がどう変化し、その結果その物性(Property)が生まれたのか」という状態遷移モデル (State-Transition Model)の型に、AIの思考を閉じ込めます。
物理法則の型というフィルターを通過し、不純物 (ハルシネーション)をそぎ落とされたデータこそが、ARIAにとっての「一級品の燃料」となります。この高純度な知識グラフ(KG)を読み込ませることで、初めて「データの欠落がある条件下でも、論理的に正しい推論」が可能になります。
実は、ARIAに投入するKGはPSP型ではなく、「原因-結果」というフラットなKG(JSON)です。なぜ、PSP型を経由するという回りくどいやり方が必要なのでしょうか?
この複雑な因果の鎖を一人で編み上げるのは困難です。Vibeを貫くためのパートナーが必要です。世の中には様々なAIツールが存在しますが、個人的な検証を継続的に続けるためには「性能」と「コスト」のバランスが重要です。
そこで今回選んだのが、「Roo Code + Gemini 3.1 Pro (Google AI Studio)」 の組み合わせです。
まず、Gemini 3.1 Proを選んだ最大の理由は、その圧倒的なコンテキストウィンドウの広さにあります。Vibe Codingを続けていると、文脈が溜まるにつれて性能が劣化しがちですが、多量の論文を読み込ませる今回のプロジェクトでは、この広さが決定的な「武器」になります。
エージェントについては、お財布事情も含めて検討した結果、フリーで使えるオープンソースの Roo Code を選択しました。実際に使ってみると、他の商用ツールと遜色ない能力を発揮してくれています。
これで晴れて、データ変換などの泥臭い作業は彼らに任せ、私は「論理の妥当性」や「検証のワクワク感」というかじ取りに集中することができるようになりました。
それでは、次回の記事から、いよいよ具体的な格闘記に入ります。 まずは、AIが「20点」という無残なハルシネーションを吐き出したところから、いかにして「物理の型」へ追い込んでいったのか。そのプロンプトとデータの変遷を詳らかにしていきます。
参考文献