QuantEvolve：LLMマルチエージェントがクオンツ戦略を'進化'させる方法

AlphaEvolveのクオンツ版。LLMマルチエージェント＋進化アルゴリズムでトレーディング戦略を自動生成・進化させるQuantEvolveフレームワーク論文レビュー。

ark

13 2월 2026 • 5 min read

AlphaEvolveが数学の問題を解いたなら、QuantEvolveはトレーディング戦略を進化させる。ACM ICAIF 2025で口頭発表されたこの論文は、LLMマルチエージェント＋進化アルゴリズムでクオンツ戦略を自動生成するフレームワークを提案する。

問題：なぜ既存の方法には限界があるのか？

既存のLLMベースクオンツシステム（AlphaGPT、R&D-Agent-Quant等）はアルファファクター発掘に集中している。個別シグナルの発見は得意だが、ポジションサイジング・リスク管理・執行ロジックまで含んだ完全な戦略（end-to-end strategy）は作れない。また一つの「最適戦略」だけを追求すると、市場レジーム変化に脆弱になる。

QuantEvolveの核心アイデア

1. Quality-Diversity進化：Feature Map

QuantEvolve Architecture
Figure 1: QuantEvolve フレームワークアーキテクチャ

戦略を単一目的関数で最適化する代わりに、Feature Mapという多次元グリッドに戦略を配置する。各次元は投資家の選好と連結される：

戦略カテゴリ（モメンタム、平均回帰、裁定取引等 — バイナリエンコーディング）
シャープレシオ（リスク対比リターン）
最大ドローダウン（MDD）
取引頻度
累積リターン

各セルには当該特性の組み合わせで最も優れた戦略1つのみ保存される。これにより多様なリスク・リターンプロファイルの戦略が共存し、特定戦略への収束（mode collapse）を防止する。

2. Island Model：探索と収束のバランス

Island Migration
Figure 3: アイランド間の戦略交換

複数の「島（Island）」で独立的に戦略が進化しつつ、定期的に上位10%の戦略を隣接する島へ移住（migration）させる。初期には各島がモメンタム、平均回帰等の専門化された戦略を深掘りし、後期には交差受粉を通じてハイブリッド戦略が出現する。

3. 仮説ベースのマルチエージェントシステム

Multi-Agent Architecture
Figure 2: マルチエージェント進化アーキテクチャ

戦略生成は3段階のエージェントパイプラインで行われる：

Research Agent — 親・いとこ戦略を分析 → 新仮説を生成（金融理論ベース）
Coding Team — 仮説をPythonコードで実装 → Ziplineバックテスト → 反復デバッグ
Evaluation Team — 仮説・コード・結果を分析 → インサイトを抽出 → 将来世代に伝達

核心はインサイトの蓄積だ。失敗した30以上のアプローチを記録し、「なぜ失敗したか」まで文書化して同じミスを繰り返さない。純粋なランダム突然変異と比べ、はるかに効率的な探索が可能になる。

4. 親-いとこサンプリング

新戦略を作る際、Feature Mapから親戦略1つ＋いとこ戦略7つを選択する：

Best Cousins（2つ）：高パフォーマンス戦略
Diverse Cousins（3つ）：Feature Spaceで親と隣接する戦略
Random Cousins（2つ）：ランダム

この構造がexploitation（高パフォーマンス継承）とexploration（新しい組み合わせの探索）を同時に達成する。

実験結果

株式市場（AAPL, MSFT, AMZN, GOOGL, META, NVDA）

進化過程が印象的だ：

Strategy Evolution - Equity
Figure 7: 株式市場における最適戦略の進化過程

Gen 0: ボリューム-モメンタムシグナル（シンプル）
Gen 10: マルチタイムフレームモメンタム＋ボラティリティフィルタリング → リターン↑ ドローダウン↑
Gen 40: ポートフォリオレベルのボラティリティモニタリング導入 → ドローダウン↓
Gen 80: 共和分ペアトレーディング試行 → 失敗（ボラティリティ期間は共和分が不安定）
Gen 130: 過去世代の成功要素のみ選択的統合 → モメンタムエントリー＋ボラティリティスケーリング＋トレーリングストップ

最終戦略がMarketCap、Equal Weight、Risk Parity、RSI、MACDベースライン全てをアウトパフォーム。

先物市場（ES, NQ）

Strategy Evolution - Futures
Figure 9: 先物市場における戦略進化

Gen 0: 固定ボリンジャーバンド平均回帰 → SR -1.21（惨事）
Gen 10: 適応型Zスコア＋モメンタム確認 → MDD -15%に改善
Gen 20: デュアルモードレジーム検知 — 低ボラティリティ→平均回帰、高ボラティリティ→モメンタム追従
- SR 1.03 | CR 37.4% | MDD -15.4%
- ES（SR 0.66）とNQ（SR 0.97）のバイアンドホールドを双方超過

興味深い点：Gen 20以降の世代がより複雑なシステムを構築したが、汎化性能はむしろ低下した。シンプルさが精巧さに勝った典型的なbias-variance tradeoffの事例。

Feature Map進化過程

Feature Map Evolution
Figure 5: Feature Mapの世代別進化（MDD × Category次元、Sharpe Ratio基準）

Gen 0でほぼ空だったFeature MapがGen 150まで段階的に埋まり、各セルの性能も着実に向上する。

インサイトの進化

Insight Evolution
Figure 8: 株式市場におけるインサイト進化過程

このフレームワークの真の価値は、戦略そのものより蓄積されたインサイトにあるかもしれない：

「単純なボラティリティ指標は危機時に失敗」→ VIX＋移動平均の結合が必要
「ボラティリティ閾値はポートフォリオではなく資産別に計算すべき」
「レジーム検知の失敗はボラティリティ年率化の誤りが原因（ロジック自体は有効）」
30以上の失敗アプローチを文書化 → 将来世代が同じ罠を回避

技術スタック

LLM: Qwen3-30B-A3B（高速応答）+ Qwen3-Next-80B-A3B（深層分析）アンサンブル
バックテスト: Zipline Reloaded + QuantStats
進化スコア: Score = Sharpe Ratio + Information Ratio + MDD（等加重）

限界と考えるべきこと

データユニバースが小さい — 株式6銘柄、先物2銘柄。実戦適用時は数百銘柄へのスケーリングが課題
オーバーフィッティングリスク — 論文自体もGen 20以降の複雑性増加時に性能低下を報告
執行コスト未反映 — Ziplineシミュレーションは実際のスリッページ・マーケットインパクトと乖離
LLMコスト — 150世代×マルチエージェント＝相当なAPIコスト（具体的金額は未公開）

示唆

QuantEvolveは「AIがトレーディング戦略を発明する」というビジョンの最も具体的な実装の一つだ。特に：

単一最適戦略の追求 → 多様な戦略プールの維持というパラダイムシフト
失敗記録の価値 — 30以上の失敗アプローチが将来の探索効率を劇的に向上
シンプルさの勝利 — 複雑な後期世代より適度に複雑な中間世代がより良く汎化

クオンツトレーディングにLLMを活用しようとする人なら、必読の論文だ。

論文: QuantEvolve: Automating Quantitative Strategy Discovery through Multi-Agent Evolutionary Framework
著者: Junhyeog Yun, Hyoun Jun Lee, Insu Jeon
発表: ACM ICAIF 2025（AI4F Workshop, Oral Presentation）