由FlashLabs公司(總部:東京都千代田區,代表取締役:細井 洋一)營運的大型語言模型(LLM)自動路由服務「OrcaRouter」,於今日2026年6月17日宣布,開始提供由Z.ai(前身為Zhipu AI)開發的最新模型「GLM-5.2」之API服務。

GLM-5.2是一款開源權重模型,具備實用的一百萬Token超長上下文視窗,能實現高度的AI代理程式編碼能力。此模型已即時加入OrcaRouter超過200個模型的陣容中,可根據提示(prompt)的難易度,自動路由至最適合的模型。

背景

AI使用費是隨著產品成長而不斷增加的「新型營運成本」。若將所有處理都交給高效能的頂尖模型,品質固然穩定,但即使是抽取、分類、格式化等固定處理,也得持續支付高昂單價。

另一方面,開源模型的進化正在加速。2026年6月,Z.ai發布的「GLM-5.2」,在AI代理程式編碼、工具使用等與實務直接相關的領域,以開源權重實現了逼近頂尖模型的效能。

此一變化是重新評估AI應用成本結構的良機。即使是高難度的處理,只要能分配到適合的開源模型,便能在維持品質的同時降低成本。OrcaRouter的設計理念並非「將所有任務都丟給高效能模型」,而是為每個提示選擇最佳模型。

透過本次的服務提供,日本的開發者與企業將能第一時間、安心地在正式生產環境中,使用最新的高效能開源模型。

關於Z.ai GLM-5.2

由Z.ai(Zhipu AI)開發的GLM-5.2是專為編碼和長期AI代理任務設計的旗艦模型。這是GLM-5系列繼2月的GLM-5和4月的GLM-5.1之後,在短短四個月內的第三代更新。

價格(OrcaRouter公開價格,零加價): - 輸入:$1.40 / 100萬Token - 輸出:$4.40 / 100萬Token ※參考:Claude Opus 4.8的價格為輸入$5,輸出$25

主要規格: - 實用的1M上下文(最高1,048,576 Token)- 可一次處理大型程式碼庫或長篇文件 - MIT授權的開源權重 - 可商用、修改、自行部署 - 擅長AI代理程式編碼/工具使用(詳見後述基準測試) - 可切換推論所需的計算量(thinking effort)- 調整品質與成本的平衡 - 約7500億規模的MoE架構(約400億為活躍參數)

主要基準測試: - SWE-bench Pro(軟體開發):62.1 — 超越GPT-5.5(58.6) - MCP-Atlas(AI代理工具使用):約77 — 逼近Claude Opus 4.8(77.8) - KingBench 3(獨立編碼評估):第3名 — 在頂尖模型佔據高位的榜單中,以開源權重模型名列前茅 - AIME 2026(數學):99.2/GPQA-Diamond(科學):91.2(皆為HuggingFace模型卡記載值)

為企業帶來的價值

1. 透過超長上下文對大型程式碼庫進行一致性處理 GLM-5.2實用的一百萬Token上下文視窗,讓開發者能在單一會話中分析和重構整個大型的舊有程式碼庫。程式碼審查、依賴性分析、遷移等複雜任務,無需切分上下文即可執行。

2. 以開源模型的成本獲得頂尖品質 在KingBench 3測試中記錄到81.43分,逼近Claude Opus 4.8。藉由OrcaRouter的提示判斷功能,能將困難的編碼任務自動選擇GLM-5.2,而固定處理則選用成本更低的開源模型,實現品質與成本的最佳平衡。

3. 實現AI代理的自主編碼 透過與OpenCode的整合,支援AI代理自主生成、編輯和測試程式碼的工作流程。最高達128K Token的輸出,讓單次回應即可生成大規模程式碼。

OrcaRouter的特色

OrcaRouter不僅是模型的代理服務,更是一個搭載了情境式賭博機(Contextual Bandit)技術的LLM路由服務,能以請求為單位判斷提示的難易度。

主要特色: - 提示判斷 — 毫秒級判斷各提示難易度,自動路由至最佳模型 - 零手續費 — Token計費與供應商公開價格相同 - 學習型路由 — 透過LinUCB情境式賭博機,從請求結果中持續提升路由準確度 - 請求級別的可視化 — 記錄所有請求的判斷結果、模型、供應商與價格 - 超過200種模型 — 透過單一端點存取多樣化模型 - 中途故障轉移 — 在供應商發生故障時,能從中斷處無縫恢復 - 8項防護機制 — PII遮罩、提示注入攻擊防範等 - 一行整合 — 僅需更改OpenAI SDK的base_url即可導入

未來展望

OrcaRouter未來將繼續迅速地將從頂尖到開源的各種最佳模型加入服務。同時,也將為企業正式AI工作負載中的LLM路由,進一步提升路由策略的擴充性與評估功能。

來自代表的訊息

FlashLabs公司 代表取締役 細井 洋一 「OrcaRouter的願景是在守護品質的同時,優化AI成本。我們認為,為每個提示選擇最佳模型——而非單純替換成廉價模型——這種方法是日本企業在正式AI營運中所必需的。高效能的開源模型越多,OrcaRouter的價值就越高。」

FACT BOX · 重點整理

  • 來源:PR TIMES
  • 分類:新品
  • 相關組織:FlashLabs株式会社 / Z.ai / Zhipu AI
  • 原文日期2026年6月17日 / 2026年6月
  • 產品、服務:OrcaRouter / Z.ai GLM-5.2