11月11日,在華東師范大學化學學科建設與學科交叉發展論壇上,化學領域大模型ChemGPT 2.0正式發布,同期發布的還有以具身智能機器人化學家“華24”為核心的自動化化學合成平臺。
研發團隊負責人,華東師范大學化學與分子工程學院何曉教授介紹,ChemGPT 2.0在多領域展現出強大的潛力,在化學問答、專業推理、逆合成預測等場景表現出色,且在C-Eval評估套件中,針對初中、高中以及大學化學的學科能力測試中全面領先GPT4。
ChemGPT 2.0的研發團隊以化學基礎詞匯為起點,構建了一張龐大的知識圖譜,累積了超過1000萬條高質量指令數據,100多萬條高質量對話數據集,這些數據為知識問答數據庫的更新提供了堅實的基礎。團隊利用來自pistachio 2024版數據庫的反應數據,經過精心篩選和去重,建立了378萬條用于模型微調訓練的高質量逆合成數據。
模型架構的革新使ChemGPT 2.0在問答能力和推理能力上均有顯著提升。通過對1.0版本上線后積累的用戶問答信息進行分析,團隊重塑任務分流模型,實現了對多個子模塊的精準匹配與調用。作為基礎模型,ChemGPT 2.0模型參數量升級至720億,擁有出色的推理能力,并在化學專業領域知識、生物醫療、通用領域、逆合成推理等多種場景下表現優異。
在逆合成預測方面,ChemGPT 2.0采用無模板逆合成預測模型,結合三維分子構象信息與一維SMILES序列,通過引入原子對齊融合和距離加權注意模塊,增強了分子表征。這不僅使模型在基準數據集上表現更加出色,還能更精準地預測復雜3D結構分子的反應物。
現場,何曉還演示了以具身智能機器人化學家“華24”為核心的自動化化學合成平臺。這一平臺通過創新技術,構建并優化了自動化合成反應的整體流程,以微流控芯片為基礎,節省時間達80%。“華24”已經實現了端到端的農藥分子全連續自動合成,并通過訓練多模態具身機器人系統掌握了370余條動作,實現了化學實驗基本操作的自動化。
11月11日,在華東師范大學化學學科建設與學科交叉發展論壇上,化學領域大模型ChemGPT 2.0正式發布,同期發布的還有以具身智能機器人化學家“華24”為核心的自動化化學合成平臺。
研發團隊負責人,華東師范大學化學與分子工程學院何曉教授介紹,ChemGPT 2.0在多領域展現出強大的潛力,在化學問答、專業推理、逆合成預測等場景表現出色,且在C-Eval評估套件中,針對初中、高中以及大學化學的學科能力測試中全面領先GPT4。
ChemGPT 2.0的研發團隊以化學基礎詞匯為起點,構建了一張龐大的知識圖譜,累積了超過1000萬條高質量指令數據,100多萬條高質量對話數據集,這些數據為知識問答數據庫的更新提供了堅實的基礎。團隊利用來自pistachio 2024版數據庫的反應數據,經過精心篩選和去重,建立了378萬條用于模型微調訓練的高質量逆合成數據。
模型架構的革新使ChemGPT 2.0在問答能力和推理能力上均有顯著提升。通過對1.0版本上線后積累的用戶問答信息進行分析,團隊重塑任務分流模型,實現了對多個子模塊的精準匹配與調用。作為基礎模型,ChemGPT 2.0模型參數量升級至720億,擁有出色的推理能力,并在化學專業領域知識、生物醫療、通用領域、逆合成推理等多種場景下表現優異。
在逆合成預測方面,ChemGPT 2.0采用無模板逆合成預測模型,結合三維分子構象信息與一維SMILES序列,通過引入原子對齊融合和距離加權注意模塊,增強了分子表征。這不僅使模型在基準數據集上表現更加出色,還能更精準地預測復雜3D結構分子的反應物。
現場,何曉還演示了以具身智能機器人化學家“華24”為核心的自動化化學合成平臺。這一平臺通過創新技術,構建并優化了自動化合成反應的整體流程,以微流控芯片為基礎,節省時間達80%。“華24”已經實現了端到端的農藥分子全連續自動合成,并通過訓練多模態具身機器人系統掌握了370余條動作,實現了化學實驗基本操作的自動化。
記者丨吳金嬌
來源丨文匯報
編輯丨王藍萱
編審丨郭文君
更多閱讀:
新民晚報 | 華東師大發布ChemGPT 2.0大模型 開啟人工智能驅動化學研究新時代
科學網 | ChemGPT 2.0大模型及具身智能機器人化學家發布
中國日報網 | 華東師大發布化學領域大模型及具身智能機器人化學家
東方網 | 開啟AI驅動化學研究新時代 滬上高校發布“ChemGPT 2.0”
上海科技報|華東師大發布ChemGPT 2.0大模型及具身智能機器人化學家