天天色成人-天天色成人网-天天色色色-天天色色网-久久99欧美-久久99青青久久99久久

兩大AI模型性能提升 登上國際榜單

   2025-01-16 9367
核心提示:近日,由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型,目前位列BFCL Leaderboard總榜單第一。

科技日報訊(記者李禾)近日,由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型,目前位列BFCL Leaderboard總榜單第一。

微信截圖_20250116112700

據悉,榜單BFCL Leaderboard是由加州大學伯克利分校開發的評估LLM工具調用能力基準測試平臺。作為目前大語言模型(LLM)最熱門的研究方向之一,工具調用(Function-Calling)是為了讓LLM理解,并能準確使用API(應用程序編程接口),來執行更復雜而具體的任務。在近期公布的最新一輪評估結果中,Watt的“多輪對話執行能力”相較于排名第二的GPT-4o 領先11分,比排名第十的Gemini-1.5-Pro 領先近40分。

“這個模型將加速大模型落地‘融合’過程。”Watt有關負責人說,還有助于從底層數據標注到人機交互的體系化建設,讓大模型初步實現從“光說不練”到“能文能武”。

此外,由盛大集團NewsBang團隊開發的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模型評測平臺升級版本,采用更全面和嚴格評估標準,對各類開源大語言模型進行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力,通過搭配數據篩選機制等,在多個核心評測維度,該模型性能有了大幅提升。

微信截圖_20250116112743

據公開報道,2023年初,盛大集團宣布All in AI戰略,去年10月,聯合多家高校發表了AI與長期記憶方面的論文,其自研的OMNE大模型多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜志《Science》合作推出全球AI驅動科學大獎,舉辦和支持包括“AI+精神健康”在內的各種高水平國際會議和夏校項目,助力培養跨學科青年AI人才等。

 
分享到: 0
收藏 0
 
更多>同類資訊
免責申明
推薦資訊
點擊排行
最新資訊更多>
最新供應更多>
網站首頁  |  聯系方式  |  關于我們  |  問題解析  |  版權隱私  |  使用協議  |  網站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網站留言  |  RSS訂閱  |  違規舉報  |  粵ICP備1207862號

中國智能化網(zgznh®)--引領工業智能化產業發展 共享智能化+優質平臺

版權所有:深圳市智控網絡有限公司 學術指導:深圳市智能化學會

粵ICP備12078626號

深公網安備案證字第 4403101901094 號 | 粵公網安備 44030702001206號