Platinum Bio 在線發布利用 DNA 語言模型的預測 AI 模型創建協議
Platinum Bio 在 Bio-protocol 期刊上發布了一篇協議論文,利用 DNA 語言模型來創建 AI 協議,以應對特定的基因組學挑戰。該論文詳細介紹了 DNABERT-2 的微調和評估,並強調了使用 Sakura Internet 的 GPU 雲端以加速研究。
📋 文章處理履歷
- 📰 發表: 2026年4月15日 19:00
- 🔍 收集: 2026年4月15日 10:31
- 🤖 AI分析完成: 2026年4月19日 10:50(收集後96小時18分鐘)
Platinum Bio Inc.(所在地:廣島縣東廣島市,CEO:奧原啓輔,以下簡稱「本公司」)榮幸地宣布,其題為「工作流程:為特定基因組學問題微調和評估 DNA 語言模型」的協議論文,該論文總結了使用 DNA 語言模型應對特定基因組學挑戰的 AI 創建協議,已於 2026 年 4 月 3 日在生命科學協議專業期刊「Bio-protocol」(ISSN:2331-8325)在線發表(經過同行評審)。本文獻由廣島大學設立的 Platinum Bio 聯合研究講座生物 DX 研究室撰寫,作者包括本公司研發部生物 DX 團隊的首席研究員中前和恭,以及首席科學官(CSO)坊農秀雅。
DNA 語言模型是一種人工智能(AI)類型,它像學習語言規則一樣,從由 A、T、G、C 組成的海量 DNA 序列中進行學習。在本協議中,我們以可再現的方式,逐步展示了對 DNABERT-2(DNA 語言模型的代表性範例)進行額外訓練(微調)並評估其針對特定研究目的性能的步驟。該協議能夠構建出能夠從 DNA 序列中讀取有意義特徵的 AI 模型,而無需僅僅依賴專家直覺或個人專業知識。
在論文中,我們通過微調 DNABERT-2,對基因編輯中存在問題的「非預期 RNA 影響(RNA 脱靶)」進行了預測。此外,通過類似的微調方法,我們還對從基因信息生成擔生命功能的蛋白質所需的啟動子序列進行了預測。我們認為,這類可再現的協議可以為生命科學研究人員預測各種基因組學挑戰並找到解決方案提供基礎。
此外,在微調過程中,我們使用了日本企業 Sakura Internet Inc. 提供的 VM 型 GPU 雲端服務「高火力 VRT」。論文指出,雖然在此環境下通常一天左右即可完成微調處理,但使用五張其他 GPU 的配置則需要約 3-7 天,這表明高性能 GPU 雲端顯著影響研究開發的速度。利用國內雲端基礎設施進行高速 AI 研究也是本次成果之一。
出處:Nakamae, K. and Bono, H. (2026). Workflow for Fine-Tuning and Evaluating DNA Language Models for Specific Genomics Issues. Bio-protocol 16(9): e5676. DOI: 10.21769/BioProtoc.5676.
本公司以「以生物技術開拓未來」為願景,以「透過設計生物功能來解決社會課題」為使命,正在推廣基因編輯與生物 DX 平台。本次文獻公開,展示了本公司結合 AI、基因組數據與計算基礎設施,並將其轉化為研究現場實際可用形式的努力。未來,本公司將繼續在創藥醫療、食品農業科技、環境能源等領域,推進 AI 應用基因組分析和基因編輯的社會實施。
■ 文獻資訊
論文標題:Workflow for Fine-Tuning and Evaluating DNA Language Models for Specific Genomics Issues
刊登處:Bio-protocol
論文連結:https://doi.org/10.21769/BioProtoc.5676
■ 關於 Platinum Bio Inc.
本公司是一家旨在將廣島大學最尖端的生物技術社會化的初創企業。利用我們獨特的生物 DX 技術和基因編輯技術,我們作為能夠設計解決全球社會課題的生物功能的平台提供者,正與各業務合作夥伴推進共創項目。
所在地:廣島縣東廣島市鏡山三丁目 10 番 23 號
成立時間:2019 年 8 月 30 日
代表者:代表取締役 CEO 奧原啓輔
事業內容:透過生物 DX 與基因編輯技術支援數據驅動式育種。
DNA 語言模型是一種人工智能(AI)類型,它像學習語言規則一樣,從由 A、T、G、C 組成的海量 DNA 序列中進行學習。在本協議中,我們以可再現的方式,逐步展示了對 DNABERT-2(DNA 語言模型的代表性範例)進行額外訓練(微調)並評估其針對特定研究目的性能的步驟。該協議能夠構建出能夠從 DNA 序列中讀取有意義特徵的 AI 模型,而無需僅僅依賴專家直覺或個人專業知識。
在論文中,我們通過微調 DNABERT-2,對基因編輯中存在問題的「非預期 RNA 影響(RNA 脱靶)」進行了預測。此外,通過類似的微調方法,我們還對從基因信息生成擔生命功能的蛋白質所需的啟動子序列進行了預測。我們認為,這類可再現的協議可以為生命科學研究人員預測各種基因組學挑戰並找到解決方案提供基礎。
此外,在微調過程中,我們使用了日本企業 Sakura Internet Inc. 提供的 VM 型 GPU 雲端服務「高火力 VRT」。論文指出,雖然在此環境下通常一天左右即可完成微調處理,但使用五張其他 GPU 的配置則需要約 3-7 天,這表明高性能 GPU 雲端顯著影響研究開發的速度。利用國內雲端基礎設施進行高速 AI 研究也是本次成果之一。
出處:Nakamae, K. and Bono, H. (2026). Workflow for Fine-Tuning and Evaluating DNA Language Models for Specific Genomics Issues. Bio-protocol 16(9): e5676. DOI: 10.21769/BioProtoc.5676.
本公司以「以生物技術開拓未來」為願景,以「透過設計生物功能來解決社會課題」為使命,正在推廣基因編輯與生物 DX 平台。本次文獻公開,展示了本公司結合 AI、基因組數據與計算基礎設施,並將其轉化為研究現場實際可用形式的努力。未來,本公司將繼續在創藥醫療、食品農業科技、環境能源等領域,推進 AI 應用基因組分析和基因編輯的社會實施。
■ 文獻資訊
論文標題:Workflow for Fine-Tuning and Evaluating DNA Language Models for Specific Genomics Issues
刊登處:Bio-protocol
論文連結:https://doi.org/10.21769/BioProtoc.5676
■ 關於 Platinum Bio Inc.
本公司是一家旨在將廣島大學最尖端的生物技術社會化的初創企業。利用我們獨特的生物 DX 技術和基因編輯技術,我們作為能夠設計解決全球社會課題的生物功能的平台提供者,正與各業務合作夥伴推進共創項目。
所在地:廣島縣東廣島市鏡山三丁目 10 番 23 號
成立時間:2019 年 8 月 30 日
代表者:代表取締役 CEO 奧原啓輔
事業內容:透過生物 DX 與基因編輯技術支援數據驅動式育種。