FlashLabs、OrcaRouterの「Routing DSL」を提供開始 ― Fable 5レベルの推論知能をわずかなコストで実現、YAML+CEL記述の推論グラフでAIワークロードを自在に制御

FlashLabsは、AI推論ゲートウェイOrcaRouterに新機能「Routing DSL」を追加。YAMLとCELで推論グラフを宣言的に設計可能にし、タスクや難易度に応じて最適なLLMを自動選択。Fable 5相当の品質を大幅に低コストで実現。

📋 記事の処理履歴

  • 📰 発表: 2026年6月15日 22:00
  • 🔍 収集: 2026年6月16日 00:01(発表から2時間1分後)
  • 🤖 AI分析完了: 2026年6月16日 00:12(収集から10分後)
FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一、以下「FlashLabs」)は、米Continuum AIが開発しFlashLabsが日本独占販売するAI推論ゲートウェイ「OrcaRouter」において、新機能「Routing DSL」の提供を開始しました。Routing DSLは、YAMLとCEL(Common Expression Language)を用いて推論グラフを宣言的に記述できるドメイン特化言語です。プロンプトの難易度やタスク種別に応じて複数のLLMを組み合わせることで、Claude Fable 5に代表されるフロンティアモデル級の品質を目標に、より低いコストでの実現を目指せます。

背景・狙い

2026年、企業のAI活用は「どのモデルを使うか」から「どのようにモデルを組み合わせるか」へとシフトしています。AnthropicのClaude Fable 5はArtificial Analysis Intelligence Indexで第1位(スコア64.9)を獲得し、推論知能の新たな基準を打ち立てました。しかし、その最高性能を享受できるのは限られたワークロードに限られます。

多くの実運用ワークロードは、単純な抽出・分類・整形が大半を占め、Fable 5のようなフロンティアモデルを常時使用することはコスト面で現実的ではありません。一方で、すべてを安価なオープンモデルに置き換えれば、高度な推論が必要な場面で品質が損なわれます。

「Routing DSL」はこの振り分けロジックを宣言的・監査可能・バージョン管理可能なコードとして扱えるようにし、エージェント時代の本番運用に必要な制御性を提供します。開発者はYAMLファイルひとつで、「このタイプのプロンプトはFable 5クラスのモデルで、このタイプは高速・低コストのモデルで」という推論グラフを設計できるようになります。

Routing DSLの概要

提供開始日: 2026年6月15日(月)

アクセス:

ドキュメント: https://docs.orcarouter.ai/ja/routing/routing-dsl

管理画面: OrcaRouterダッシュボード → Routing → Strategy → DSL

記述形式: YAML + CEL(Common Expression Language)

5つのルーティング戦略

Routing DSLでは、以下の5つの戦略を組み合わせて推論グラフを構築できます。

1. 難易度別ルーティング(Route by Difficulty)

プロンプトの複雑度を自動判定し、高度な推論はClaude OpusやGPT-5.5などのフロンティアモデルへ、定型処理はDeepSeek V4 ProやQwen3.6などのオープンモデルへ振り分けます。

2. タスク別ルーティング(Route by Task)

「コード生成」「要約」「翻訳」「データ抽出」など、タスク種別に応じて最適なモデルを選択します。コーディングにはClaude Sonnet、抽出にはDeepSeekといった使い分けが可能です。

3. マルチモデル並列実行(Fan-out to Multiple Models)

同一プロンプトをGPT-5.5、Claude Opus、Gemini 3.1 Pro等に並列送信し、結果を統合。単一モデルを超える回答品質を実現します。

4. フォールバックとジャッジ(Fallbacks & Judges)

モデルの応答を自動評価し、品質が基準を下回る場合は自動的に別モデルへフォールバック。ストリーム途中の切り替えにも対応します。

5. コスト/レイテンシ/品質の最適化(Optimize for Cost, Latency, or Quality)

「コスト優先」「速度優先」「品質優先」のポリシーをグラフ全体に適用。ビジネス要件に応じた最適化を宣言的に記述できます。

詳細を説明した記事はこちら

企業にもたらす価値

1. Fable 5レベルの推論を低コストで実現

単一のフロンティアモデルに依存せず、複数モデルをグラフ構造で組み合わせることで、Fable 5に匹敵する知能レベルの出力を大幅に低コストで実現します。すべてのプロンプトに最高額のモデルを使う必要はありません。

2. 宣言的設定で運用負荷を激減

YAMLファイルによる宣言的設定のため、if/elseのハードコーディングやモデル更新ごとのコード修正が不要です。新モデルがリリースされれば、YAMLの1行を書き換えるだけで推論グラフ全体に反映されます。

3. 透明性と監査性を維持

Routing DSLで構築した推論グラフの判断根拠は、すべてリクエスト単位で可視化されます。どのプロンプトがどのモデルにルーティングされ、どの条件でフォールバックが発生したか、ダッシュボードとレスポンスヘッダーで完全に追跡可能です。

技術的特徴

Routing DSLのルーティング条件はCELで記述され、以下のような表現が可能です:

prompt.difficulty >= 0.8 → フロンティアモデル

prompt.task_type == "code_generation" → コーディング特化モデル

response.quality_score < 0.7 → 自動フォールバック

cost_budget.monthly_remaining > 100 → コスト制約付きルーティング

OrcaRouterの既存機能であるLinUCBコンテキスト・バンディットによる学習的ルーティング、ミッドストリーム・フェイルオーバー、200以上のモデルラインナップとも統合されています。

利用可能モデル例

Anthropic Claude Opus 4.8 API

OpenAI GPT 5.5 API

Gemini 3.5 Flash

MiniMax M3

DeepSeek V4 Pro API

Qwen3.7 Max

今後の展開

OrcaRouterは今後、Routing DSLで構築した推論グラフのテンプレートライブラリを公開し、コミュニティによるベストプラクティスの共有を促進します。また、グラフのパフォーマンス分析機能の強化や、A/Bテストによるルーティング戦略の自動最適化機能の追加を予定しています。

代表コメント

FlashLabs株式会社 代表取締役 細井 洋一

「Fable 5は現時点で最も知的なAIモデルの1つです。しかし、企業が本番環境で扱うすべてのリクエストをFable 5で処理することは、コスト面でも現実性でも正しい選択とは言えません。私たちがRouting DSLにより、難易度の高い推論には最高のモデルを、定型処理には最適なコストのモデルを。その組み合わせの設計図をYAMLで宣言できる世界を実現しました。日本のエンタープライズ企業が、コストを恐れずに最高水準のAIを活用できる基盤として、OrcaRouterを進化させ続けます。」

OrcaRouterに

よくある質問

Routing DSLとは何ですか?

Routing DSLは、YAMLとCELを使ってAI推論のルーティング戦略を宣言的に記述できるドメイン特化言語です。

OrcaRouterはどのような企業向けですか?

主にAIを本番環境で活用する日本のエンタープライズ企業や開発チーム向けです。

Routing DSLで使えるモデルはどれですか?

GPT-5.5、Claude Opus、Gemini 3.5、DeepSeek V4 Pro、Qwen3.7 Maxなど200以上のモデルが利用可能です。

Routing DSLの導入でコストはどれくらい削減できますか?

Fable 5相当の品質を、推論負荷の数分の一のコストで実現できるとされています。

Routing DSLはいつから利用できますか?

2026年6月15日から、OrcaRouterダッシュボード上で利用可能です。