WED株式會社(總公司:東京都澀谷區,代表董事:新井 俊樹,以下簡稱「WED」)與開發並提供日語OCR引擎「YomiToku」的MLism株式會社(總公司:千葉縣柏市,代表董事社長:木之下 滉大郎,以下簡稱「MLism」)進行技術合作,共同開發了專為透過可賺取金錢的購物應用程式「ONE」所收集的真實環境收據數據進行優化的客製化OCR模型。此外,透過此項合作,也為提升YomiToku通用模型的精準度做出了貢獻。本次合作的詳細內容將於今日作為導入案例公開。

背景與課題 在高精準度OCR模型開發中,最大的課題是確保能反映真實環境的學習數據。現實文件包含許多通用數據集無法預期的噪音、失真和特殊字體。 WED的「ONE」服務每日累積數百萬張收據圖像。其中混合了印刷文字和裝飾字體,存在大量需要高階OCR處理的真實環境數據。

【合作詳情】 MLism和WED以相互提供數據和技術的方式建立合作夥伴關係,並實施了以下兩項共同措施。 1. 開發WED專用客製化模型 MLism和WED以WED的收據數據為基礎,對YomiToku進行了調校,共同開發了針對WED環境優化的客製化OCR模型。在調校過程中,確認了超出預期的數據多樣性,例如折疊和特殊字體,再次證明了真實環境數據獨有的難度和實用性。 2. 模型成果 透過本次合作開發的WED專用客製化模型,在ONE上的收據讀取處理中實現了比傳統方法更高的精準度。此模型是透過ONE每日累積數百萬張數據的多樣性和規模才得以實現,即使在通用OCR難以應對的條件下(例如折疊、模糊、裝飾字體等),也能發揮穩定的讀取性能,進一步提升了服務品質。 此外,這些成果也應用於YomiToku通用模型的學習。透過此項合作,在特定領域的文字識別精準度達到了90%以上。

公司概要 WED株式會社 代表者:代表董事 新井 俊樹 設立:2016年 所在地:東京都澀谷區 事業內容:提供以收據業務為中心的數據利用型行銷服務 企業願景:「每次消費都充滿期待的世界」 網址:https://wed.company

MLism株式會社 代表者:代表董事社長 木之下 滉大郎 設立:2024年12月 所在地:千葉縣柏市若柴178番地4 柏之葉校園148街區2 商店與辦公大樓6F 事業內容:演算法的研究開發及授權銷售與提供 公司網站:https://www.mlism.com/

FACT BOX · 重點整理

  • 來源:PR TIMES
  • 分類:合作
  • 相關組織:WED株式会社 / 株式会社MLism
  • 原文日期2016年 / 2024年12月
  • 產品、服務:YomiToku / ONE