QuantEvolve:LLMマルチエージェントがクオンツ戦略を'進化'させる方法

AlphaEvolveのクオンツ版。LLMマルチエージェント+進化アルゴリズムでトレーディング戦略を自動生成・進化させるQuantEvolveフレームワーク論文レビュー。

QuantEvolve:LLMマルチエージェントがクオンツ戦略を'進化'させる方法

AlphaEvolveが数学の問題を解いたなら、QuantEvolveはトレーディング戦略を進化させる。ACM ICAIF 2025で口頭発表されたこの論文は、LLMマルチエージェント+進化アルゴリズムでクオンツ戦略を自動生成するフレームワークを提案する。

問題:なぜ既存の方法には限界があるのか?

既存のLLMベースクオンツシステム(AlphaGPT、R&D-Agent-Quant等)はアルファファクター発掘に集中している。個別シグナルの発見は得意だが、ポジションサイジング・リスク管理・執行ロジックまで含んだ完全な戦略(end-to-end strategy)は作れない。また一つの「最適戦略」だけを追求すると、市場レジーム変化に脆弱になる。

QuantEvolveの核心アイデア

1. Quality-Diversity進化:Feature Map

QuantEvolve Architecture
Figure 1: QuantEvolve フレームワークアーキテクチャ

戦略を単一目的関数で最適化する代わりに、Feature Mapという多次元グリッドに戦略を配置する。各次元は投資家の選好と連結される:

  • 戦略カテゴリ(モメンタム、平均回帰、裁定取引等 — バイナリエンコーディング)
  • シャープレシオ(リスク対比リターン)
  • 最大ドローダウン(MDD)
  • 取引頻度
  • 累積リターン

各セルには当該特性の組み合わせで最も優れた戦略1つのみ保存される。これにより多様なリスク・リターンプロファイルの戦略が共存し、特定戦略への収束(mode collapse)を防止する。

2. Island Model:探索と収束のバランス

Island Migration
Figure 3: アイランド間の戦略交換

複数の「島(Island)」で独立的に戦略が進化しつつ、定期的に上位10%の戦略を隣接する島へ移住(migration)させる。初期には各島がモメンタム、平均回帰等の専門化された戦略を深掘りし、後期には交差受粉を通じてハイブリッド戦略が出現する。

3. 仮説ベースのマルチエージェントシステム

Multi-Agent Architecture
Figure 2: マルチエージェント進化アーキテクチャ

戦略生成は3段階のエージェントパイプラインで行われる:

  1. Research Agent — 親・いとこ戦略を分析 → 新仮説を生成(金融理論ベース)
  2. Coding Team — 仮説をPythonコードで実装 → Ziplineバックテスト → 反復デバッグ
  3. Evaluation Team — 仮説・コード・結果を分析 → インサイトを抽出 → 将来世代に伝達

核心はインサイトの蓄積だ。失敗した30以上のアプローチを記録し、「なぜ失敗したか」まで文書化して同じミスを繰り返さない。純粋なランダム突然変異と比べ、はるかに効率的な探索が可能になる。

4. 親-いとこサンプリング

新戦略を作る際、Feature Mapから親戦略1つ+いとこ戦略7つを選択する:

  • Best Cousins(2つ):高パフォーマンス戦略
  • Diverse Cousins(3つ):Feature Spaceで親と隣接する戦略
  • Random Cousins(2つ):ランダム

この構造がexploitation(高パフォーマンス継承)とexploration(新しい組み合わせの探索)を同時に達成する。

実験結果

株式市場(AAPL, MSFT, AMZN, GOOGL, META, NVDA)

進化過程が印象的だ:

Strategy Evolution - Equity
Figure 7: 株式市場における最適戦略の進化過程

  • Gen 0: ボリューム-モメンタムシグナル(シンプル)
  • Gen 10: マルチタイムフレームモメンタム+ボラティリティフィルタリング → リターン↑ ドローダウン↑
  • Gen 40: ポートフォリオレベルのボラティリティモニタリング導入 → ドローダウン↓
  • Gen 80: 共和分ペアトレーディング試行 → 失敗(ボラティリティ期間は共和分が不安定)
  • Gen 130: 過去世代の成功要素のみ選択的統合 → モメンタムエントリー+ボラティリティスケーリング+トレーリングストップ

最終戦略がMarketCap、Equal Weight、Risk Parity、RSI、MACDベースライン全てをアウトパフォーム。

先物市場(ES, NQ)

Strategy Evolution - Futures
Figure 9: 先物市場における戦略進化

  • Gen 0: 固定ボリンジャーバンド平均回帰 → SR -1.21(惨事)
  • Gen 10: 適応型Zスコア+モメンタム確認 → MDD -15%に改善
  • Gen 20: デュアルモードレジーム検知 — 低ボラティリティ→平均回帰、高ボラティリティ→モメンタム追従
    • SR 1.03 | CR 37.4% | MDD -15.4%
    • ES(SR 0.66)とNQ(SR 0.97)のバイアンドホールドを双方超過

興味深い点:Gen 20以降の世代がより複雑なシステムを構築したが、汎化性能はむしろ低下した。シンプルさが精巧さに勝った典型的なbias-variance tradeoffの事例。

Feature Map進化過程

Feature Map Evolution
Figure 5: Feature Mapの世代別進化(MDD × Category次元、Sharpe Ratio基準)

Gen 0でほぼ空だったFeature MapがGen 150まで段階的に埋まり、各セルの性能も着実に向上する。

インサイトの進化

Insight Evolution
Figure 8: 株式市場におけるインサイト進化過程

このフレームワークの真の価値は、戦略そのものより蓄積されたインサイトにあるかもしれない:

  • 「単純なボラティリティ指標は危機時に失敗」→ VIX+移動平均の結合が必要
  • 「ボラティリティ閾値はポートフォリオではなく資産別に計算すべき」
  • 「レジーム検知の失敗はボラティリティ年率化の誤りが原因(ロジック自体は有効)」
  • 30以上の失敗アプローチを文書化 → 将来世代が同じ罠を回避

技術スタック

  • LLM: Qwen3-30B-A3B(高速応答)+ Qwen3-Next-80B-A3B(深層分析)アンサンブル
  • バックテスト: Zipline Reloaded + QuantStats
  • 進化スコア: Score = Sharpe Ratio + Information Ratio + MDD(等加重)

限界と考えるべきこと

  1. データユニバースが小さい — 株式6銘柄、先物2銘柄。実戦適用時は数百銘柄へのスケーリングが課題
  2. オーバーフィッティングリスク — 論文自体もGen 20以降の複雑性増加時に性能低下を報告
  3. 執行コスト未反映 — Ziplineシミュレーションは実際のスリッページ・マーケットインパクトと乖離
  4. LLMコスト — 150世代×マルチエージェント=相当なAPIコスト(具体的金額は未公開)

示唆

QuantEvolveは「AIがトレーディング戦略を発明する」というビジョンの最も具体的な実装の一つだ。特に:

  • 単一最適戦略の追求 → 多様な戦略プールの維持というパラダイムシフト
  • 失敗記録の価値 — 30以上の失敗アプローチが将来の探索効率を劇的に向上
  • シンプルさの勝利 — 複雑な後期世代より適度に複雑な中間世代がより良く汎化

クオンツトレーディングにLLMを活用しようとする人なら、必読の論文だ。


論文: QuantEvolve: Automating Quantitative Strategy Discovery through Multi-Agent Evolutionary Framework
著者: Junhyeog Yun, Hyoun Jun Lee, Insu Jeon
発表: ACM ICAIF 2025(AI4F Workshop, Oral Presentation)