MakeSomethingNew 公開 LLM 導入模型驗證結果,並免費提供提示工程工具

📋 文章處理履歷

  • 📰 發表: 2026年5月14日 18:25
  • 🔍 收集: 2026年5月14日 09:32
  • 🤖 AI分析完成: 2026年5月15日 08:20(收集後22小時48分鐘)
MakeSomethingNew 株式會社(總部:東京都,代表取締役:杉山英一)宣布,已公開一份調查結果,驗證在將 LLM 導入 Web 服務與業務系統時,哪些模型較具實用性;同時開始免費提供支援 LLM 實作中重要環節的「提示工程工具」,協助提示詞設計、評估與改善。 近年來,以 ChatGPT 為代表的生成式 AI 應用迅速普及。然而,企業在將 LLM 整合進自家 Web 服務或業務系統時,僅選擇高性能模型並不足夠。實際開發現場還需要綜合考量回答準確度、回應速度、成本、穩定性、與既有系統的整合,以及提示詞的可維護性等多個面向。 MakeSomethingNew 過去透過企業 AI Agent 建置服務,從 AI 應用構想整理、需求定義、設計、開發、導入到營運支援,提供一貫協助。透過此次調查結果與免費工具的提供,該公司將更具體地支援企業在把 LLM 導入實際服務時的初期評估與實作流程。 背景方面,隨著生成式 AI 普及,許多企業開始投入以 LLM 為基礎的新服務開發、業務效率化、客服應對、內部知識搜尋與文件撰寫支援。然而,在實際將 LLM 導入 Web 服務或業務系統時,常會遇到不知道該選擇哪個 LLM、難以判斷各模型在準確度、速度與成本上的差異、提示詞依賴個人經驗撰寫、無法管理提示詞改善歷程與評估結果、開發環境可運作但正式服務品質不穩定,以及不清楚如何把 LLM 輸出銜接到業務流程或既有系統等問題。 LLM 應用正從「用聊天方式試用」的階段,轉向「整合進業務與服務並持續改善」的階段。因此,將模型選擇與提示工程視為開發流程的一部分變得相當重要。 本次 MakeSomethingNew 假設將 LLM 導入 Web 服務,針對主要 LLM 從多個觀點進行比較與驗證。調查結果顯示,在 LLM 實作中,重要的不是永遠使用最高性能模型,而是根據回應時間等條件靈活分工使用不同模型。例如,在需要複雜判斷或高精度文章生成的場景,高性能模型具備優勢;而在定型分類、摘要、資訊抽取與簡易客服應對等場景,使用速度與成本表現較佳的模型更為實際。 此外,在導入 Web 服務時,除了單次回答準確度,也需要以持續改善為前提進行設計,包括回應速度、失敗時的重試設計、提示詞版本管理、日誌分析與評估資料累積等。 此次免費提供的提示工程工具,是協助在將 LLM 導入 Web 服務或業務系統時進行提示詞建立、比較與改善的工具。主要功能包括提示詞建立與儲存、多個提示詞比較、確認不同模型的輸出結果、管理提示詞改善歷程,以及針對 Web 服務導入情境的一次性批次確認。透過此工具,開發者與業務負責人不必再以個人方式管理提示詞,而能由團隊共同驗證與改善 LLM 實作。 除調查結果與免費工具外,MakeSomethingNew 也將支援企業在 LLM 應用上的多個領域,包括使用 LLM 的 Web 服務開發、既有服務導入 LLM 功能、AI Agent 設計與開發、與內部資料及業務系統整合、RAG 架構設計與實作、提示詞設計與評估改善、模型選擇與成本最佳化,以及從 PoC 到正式導入的陪跑支援。 MakeSomethingNew 表示,將協助企業不讓生成式 AI 停留在實驗階段,而是能將其導入實際服務與業務流程,成為持續創造價值的機制。未來公司也將進一步強化 LLM Web 服務開發、AI Agent 建置、業務系統整合與提示工程支援,並持續發布依產業與業務別設計的 LLM 應用模板,以及模型選擇與提示詞評估相關資訊,協助企業安全且有效地導入生成式 AI。 公司名稱為 MakeSomethingNew 株式會社,代表者為代表取締役杉山英一,事業內容包括 AI Agent 建置支援、AI 應用支援、LLM 實作支援、系統企劃與開發支援。公司網站為 https://makesomethingnew.jp/ ,相關洽詢可透過服務頁面或公司聯絡表單提出。