Telexistence (TX) 今日公布了參與「Physical AI Fellowship 2026」的成果,該 fellowship 由 Amazon Web Services (AWS)、NVIDIA 與 MassRobotics 共同推動。TX 演示了人型機器人基於 VLA(視覺-語言-動作)的自主動作,並展示了與 NVIDIA 世界模型「DreamZero」共同開發的合作成果。本次活動主題為「From Real Humanoid Data to Physical AI」,TX 首次對外展示了其端到端數據管線,將大規模實際環境遠端遙控收集的數據,直接連結至基礎模型訓練,藉以推動物理 AI 的實現。
1. 單一策略模型自主執行便利商店袋裝作業
本次演示的核心在於,機器人並非執行一系列順序串接的子任務,而是透過單一 VLA 模型(單一策略)端到端地處理從感知到行動的過程。
演示影片顯示,TX 的人型機器人在日本便利商店的櫃檯,雙手接連抓取多樣商品(寶特瓶、飯糰、零食等)並裝入收銀袋中。影片標註了「Autonomous」,明確表示此動作完全無須遠端遙控介入。
2. 與 NVIDIA「DreamZero」的聯合實作:連結真實數據與模型訓練
TX 同時公布了與 NVIDIA 世界模型「DreamZero」的共同研發成果。TX 透過 Fellowship,與 NVIDIA 及 AWS 團隊密切合作,針對實用化場景進行 DreamZero 的實作。
DreamZero 是一款能預測機器人及其周圍場景「未來狀態」的世界模型。團隊不僅在模擬環境進行動作預測,更對真實環境下的遠端遙控數據進行離線預測,證實 TX 在現實世界中收集的數據能有效應用於基礎模型訓練。
理解真實世界動態的世界模型,有望提升物理 AI 對未知情境的應變能力。TX 正與 NVIDIA、AWS 團隊持續深化此研究,將其定位為機器人基礎模型開發的核心。
3. 當前進度與待解決課題
TX 強調本次演示並非最終產品,而是呈現「研究當前的進度」。現階段技術課題明確,並已納入 TX 下階段的開發議程:
- 動作速度:目前的自主動作尚未達到實用速度。演示影片中同時公布了 1 倍速與 8 倍速畫面,誠實展現速度是下一個主要課題。 - 動作流暢度:目前的動作輸出仍顯生硬。開發團隊正致力於研發如何將 VLA 模型輸出轉換為機器人最終控制訊號,包含動作表達設計的優化。 - 泛化能力(Generalization):若物件位置偏移幾公分,動作精度便會下降。TX 認為這屬於數據量與多樣性的問題,可透過擴大規模來解決。TX 擁有從機器人硬體設計、製造到現場實際營運的全端能力,將藉此優勢持續追求高品質的獨有數據。
4. 為何選擇 TX?
TX 正以以下獨特優勢挑戰前所未有的難題: - 真實環境 x 大規模:已在便利商店等商用環境運作機器人,累積學術實驗室難以獲取的真實世界數據。 - 全端整合:從硬體、數據收集、基礎模型到控制系統全數自研,研發成果可立即反映於實機。 - 基礎架構:利用 AWS 先進 GPU 叢集進行大規模訓練,並與 NVIDIA 團隊合作活用 IsaacSim 環境。
FACT BOX · 重點整理
- 來源:PR TIMES
- 分類:活動
- 相關組織:Amazon Web Services (AWS) / NVIDIA / MassRobotics
- 原文日期:2026
- 產品、服務:DreamZero