FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一)が運営するLLM自動ルーティングサービス「OrcaRouter」は、Z.ai(旧Zhipu AI)が開発した最新モデル「GLM-5.2」のAPI提供を本日2026年6月17日より開始したことを発表します。

GLM-5.2は、実用的な100万トークンのコンテキストウィンドウを備え、高度なエージェントコーディング能力を実現するオープンウェイトモデルです。OrcaRouterの200以上のモデルラインナップに即時追加され、プロンプトの難易度に応じた最適なモデルへの自動ルーティングが可能になります。

背景

AI利用料は、プロダクトの成長とともに増え続ける「新しい原価」です。すべての処理を高性能なフロンティアモデルに任せると品質は安定しますが、抽出・分類・整形といった定型処理にも高い単価を払い続けることになります。

一方で、オープンモデルの進化は加速しています。2026年6月、Z.aiが公開した「GLM-5.2」は、エージェント型コーディングやツール利用といった実務直結の領域で、フロンティアモデルに迫る性能をオープンウェイトで実現しました。

この変化は、AI活用のコスト構造を見直す好機です。難易度の高い処理も、適切なオープンモデルへ振り分けられれば、品質を保ったままコストを下げられます。OrcaRouterは「すべてを高性能モデルに投げる」のではなく、プロンプトごとに最適なモデルを選ぶという思想で設計されています。

今回の提供開始により、日本の開発者・企業は、最新の高性能オープンモデルを、いち早く・安心して本番環境で利用できるようになります。

Z.ai GLM-5.2について

Z.ai(Zhipu AI)が開発したGLM-5.2は、コーディングと長期エージェントタスクに特化したフラッグシップモデルです。GLM-5シリーズとしては2月のGLM-5、4月のGLM-5.1に続く、わずか4カ月で3世代目の更新となります。

価格(OrcaRouter公開価格・ゼロマークアップ): - 入力:$1.40 / 100万トークン - 出力:$4.40 / 100万トークン ※参考:Claude Opus 4.8は入力$5 / 出力$25

主要仕様: - 実用1Mコンテキスト(最大1,048,576トークン)- 大規模コードベースや長文ドキュメントを一度に処理 - MITライセンスのオープンウェイト - 商用利用・改変・セルフホストが可能 - エージェント型コーディング/ツール利用に強み(後述ベンチマーク参照) - 推論にかける計算量(thinking effort)を切り替え可能 - 品質とコストのバランスを調整 - 約750B規模のMoEアーキテクチャ(アクティブ約40B)

主なベンチマーク: - SWE-bench Pro(ソフトウェア開発):62.1 ― GPT-5.5(58.6)を上回る - MCP-Atlas(エージェント型ツール利用):約77 ― Claude Opus 4.8(77.8)に肉薄 - KingBench 3(独立系コーディング評価):第3位 ― 上位をフロンティアモデルが占めるなか、オープンウェイトとして上位にランクイン - AIME 2026(数学):99.2 / GPQA-Diamond(科学):91.2(いずれもHuggingFaceモデルカード記載値)

企業にもたらす価値

1. 超長文コンテキストによる大規模コードベースの一貫処理 GLM-5.2の実用的な100万トークンのコンテキストウィンドウにより、大規模なレガシーコードベース全体を1回のセッションで分析・リファクタリングできます。コードレビュー、依存関係解析、マイグレーションなどの複雑なタスクを、コンテキスト分割不要で実行可能です。

2. フロンティア品質をオープンモデルのコストで KingBench 3でClaude Opus 4.8に迫るスコア81.43を記録。OrcaRouterのプロンプト判定機能により、難しいコーディングタスクにはGLM-5.2を、定型処理にはさらに低コストなオープンモデルを自動選択することで、品質とコストの最適バランスを実現します。

3. AIエージェントの自律コーディングを可能に OpenCodeとの連携により、AIエージェントが自律的にコードを生成・編集・テストするワークフローに対応。最大128Kトークンの出力により、1回の応答で大規模なコード生成が可能です。

OrcaRouterの特長

OrcaRouterは、単なるモデルプロキシではなく、プロンプトの難易度をリクエスト単位で判定するコンテキスト・バンディット技術を搭載したLLMルーティングサービスです。

主な特長: - プロンプト判定 — 各プロンプトの難易度をミリ秒未満で判定し、最適なモデルへ自動ルーティング - 手数料0% — トークン課金はプロバイダー公開価格と同額 - 学習するルーティング — LinUCBコンテキスト・バンディットにより、リクエスト結果から継続的にルーティング精度が向上 - リクエスト単位の可視化 — 判定結果・モデル・プロバイダー・価格を全リクエストで記録 - 200以上のモデル — 1エンドポイントで多様なモデルにアクセス - ミッドストリームフェイルオーバー — プロバイダー障害時にシームレスに復旧 - 8つのガードレール — PIIマスキング、プロンプトインジェクション対策など - 導入は1行 — OpenAI SDKのbase_urlを変更するだけ

今後の展開

OrcaRouterでは、今後も、フロンティアからオープンまで、最適なモデルを迅速に追加してまいります。また、企業の本番AIワークロードにおけるLLMルーティングのさらなる高度化を目指します。

代表コメント

FlashLabs株式会社 代表取締役 細井 洋一 「OrcaRouterのビジョンは、品質を守りながらAIコストを最適化すること。単に安価なモデルに置き換えるのではなく、プロンプトごとに最適なモデルを選ぶ——このアプローチが日本企業の本番AI運用に必要だと考えています。高性能なオープンモデルが増えるほど、OrcaRouterの価値は高まります」

FACT BOX ・ 要点整理

  • 出典:PR TIMES
  • 分類:新製品
  • 関連組織:Z.ai / Zhipu AI / Anthropic
  • 製品・サービス:OrcaRouter / Z.ai GLM-5.2