日語OCR引擎「YomiToku」與WED株式會社技術合作,開發專用於收據讀取的客製化OCR模型
WED株式會社與MLism株式會社透過技術合作,共同開發了針對WED購物應用程式「ONE」所收集的真實環境收據數據進行優化的客製化OCR模型。此舉也有助於提升通用版YomiToku模型的精準度。
📋 文章處理履歷
- 📰 發表: 2026年5月8日 00:00
- 🔍 收集: 2026年5月7日 15:32
- 🤖 AI分析完成: 2026年5月7日 17:36(收集後2小時4分鐘)
WED株式會社(總公司:東京都澀谷區,代表董事:新井 俊樹,以下簡稱「WED」)與開發並提供日語OCR引擎「YomiToku」的MLism株式會社(總公司:千葉縣柏市,代表董事社長:木之下 滉大郎,以下簡稱「MLism」)進行技術合作,共同開發了專為透過可賺取金錢的購物應用程式「ONE」所收集的真實環境收據數據進行優化的客製化OCR模型。此外,透過此項合作,也為提升YomiToku通用模型的精準度做出了貢獻。本次合作的詳細內容將於今日作為導入案例公開。
背景與課題
在高精準度OCR模型開發中,最大的課題是確保能反映真實環境的學習數據。現實文件包含許多通用數據集無法預期的噪音、失真和特殊字體。
WED的「ONE」服務每日累積數百萬張收據圖像。其中混合了印刷文字和裝飾字體,存在大量需要高階OCR處理的真實環境數據。
【合作詳情】
MLism和WED以相互提供數據和技術的方式建立合作夥伴關係,並實施了以下兩項共同措施。
1. 開發WED專用客製化模型
MLism和WED以WED的收據數據為基礎,對YomiToku進行了調校,共同開發了針對WED環境優化的客製化OCR模型。在調校過程中,確認了超出預期的數據多樣性,例如折疊和特殊字體,再次證明了真實環境數據獨有的難度和實用性。
2. 模型成果
透過本次合作開發的WED專用客製化模型,在ONE上的收據讀取處理中實現了比傳統方法更高的精準度。此模型是透過ONE每日累積數百萬張數據的多樣性和規模才得以實現,即使在通用OCR難以應對的條件下(例如折疊、模糊、裝飾字體等),也能發揮穩定的讀取性能,進一步提升了服務品質。
此外,這些成果也應用於YomiToku通用模型的學習。透過此項合作,在特定領域的文字識別精準度達到了90%以上。
公司概要
WED株式會社
代表者:代表董事 新井 俊樹
設立:2016年
所在地:東京都澀谷區
事業內容:提供以收據業務為中心的數據利用型行銷服務
企業願景:「每次消費都充滿期待的世界」
網址:https://wed.company
MLism株式會社
代表者:代表董事社長 木之下 滉大郎
設立:2024年12月
所在地:千葉縣柏市若柴178番地4 柏之葉校園148街區2 商店與辦公大樓6F
事業內容:演算法的研究開發及授權銷售與提供
公司網站:https://www.mlism.com/
背景與課題
在高精準度OCR模型開發中,最大的課題是確保能反映真實環境的學習數據。現實文件包含許多通用數據集無法預期的噪音、失真和特殊字體。
WED的「ONE」服務每日累積數百萬張收據圖像。其中混合了印刷文字和裝飾字體,存在大量需要高階OCR處理的真實環境數據。
【合作詳情】
MLism和WED以相互提供數據和技術的方式建立合作夥伴關係,並實施了以下兩項共同措施。
1. 開發WED專用客製化模型
MLism和WED以WED的收據數據為基礎,對YomiToku進行了調校,共同開發了針對WED環境優化的客製化OCR模型。在調校過程中,確認了超出預期的數據多樣性,例如折疊和特殊字體,再次證明了真實環境數據獨有的難度和實用性。
2. 模型成果
透過本次合作開發的WED專用客製化模型,在ONE上的收據讀取處理中實現了比傳統方法更高的精準度。此模型是透過ONE每日累積數百萬張數據的多樣性和規模才得以實現,即使在通用OCR難以應對的條件下(例如折疊、模糊、裝飾字體等),也能發揮穩定的讀取性能,進一步提升了服務品質。
此外,這些成果也應用於YomiToku通用模型的學習。透過此項合作,在特定領域的文字識別精準度達到了90%以上。
公司概要
WED株式會社
代表者:代表董事 新井 俊樹
設立:2016年
所在地:東京都澀谷區
事業內容:提供以收據業務為中心的數據利用型行銷服務
企業願景:「每次消費都充滿期待的世界」
網址:https://wed.company
MLism株式會社
代表者:代表董事社長 木之下 滉大郎
設立:2024年12月
所在地:千葉縣柏市若柴178番地4 柏之葉校園148街區2 商店與辦公大樓6F
事業內容:演算法的研究開發及授權銷售與提供
公司網站:https://www.mlism.com/