兩大AI模型性能提升登上國際榜單

2025-01-16 9367

核心提示：近日，由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B，登上國際知名AI排行榜榜首。其中，Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型，目前位列BFCL Leaderboard總榜單第一。

科技日報訊(記者李禾)近日，由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B，登上國際知名AI排行榜榜首。其中，Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型，目前位列BFCL Leaderboard總榜單第一。

微信截圖_20250116112700

據悉，榜單BFCL Leaderboard是由加州大學伯克利分校開發的評估LLM工具調用能力基準測試平臺。作為目前大語言模型(LLM)最熱門的研究方向之一，工具調用(Function-Calling)是為了讓LLM理解，并能準確使用API(應用程序編程接口)，來執行更復雜而具體的任務。在近期公布的最新一輪評估結果中，Watt的“多輪對話執行能力”相較于排名第二的GPT-4o 領先11分，比排名第十的Gemini-1.5-Pro 領先近40分。

“這個模型將加速大模型落地‘融合’過程。”Watt有關負責人說，還有助于從底層數據標注到人機交互的體系化建設，讓大模型初步實現從“光說不練”到“能文能武”。

此外，由盛大集團NewsBang團隊開發的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模型評測平臺升級版本，采用更全面和嚴格評估標準，對各類開源大語言模型進行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力，通過搭配數據篩選機制等，在多個核心評測維度，該模型性能有了大幅提升。

微信截圖_20250116112743

據公開報道，2023年初，盛大集團宣布All in AI戰略，去年10月，聯合多家高校發表了AI與長期記憶方面的論文，其自研的OMNE大模型多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜志《Science》合作推出全球AI驅動科學大獎，舉辦和支持包括“AI+精神健康”在內的各種高水平國際會議和夏校項目，助力培養跨學科青年AI人才等。

標簽： 智能化 AI 人機交互

分享到:

收藏 0

更多>同類資訊

免責申明

推薦資訊

點擊排行

最新資訊更多>

最新供應更多>

中國智能化網（zgznh^®）--引領工業智能化產業發展共享智能化+優質平臺

粵ICP備12078626號

深公網安備案證字第 4403101901094 號 | 粵公網安備 44030702001206號

• 優刻得安全屋+DeepSeek：解鎖數據安全流通與AI	• 借力AI逆襲登頂行業新龍頭：豐e足食CEO深度分享
• 深圳市智能化學會執行會長石錫銘一行赴臺山市考	• 智控網絡攜智造之眼和編碼器專用電池亮相SPS廣
• 2025 漢諾威金屬加工世界（EMO Hannover）——	• 智能化學會攜手會員單位組團參展、參觀SPS廣州
• 毆姆泰酷集團匠郢精密陶瓷(蘇州)有限公司CEO李	• 漲！廣東調整最低工資標準，華成工控助力人機協
• 智能化學會副會長劉衛群陪同深科協學會處處長孫	• 國產傳感器市場洗牌加速，深圳志奮領登頂第一！

天天色成人-天天色成人网-天天色色色-天天色色网-久久99欧美-久久99青青久久99久久

兩大AI模型性能提升 登上國際榜單

兩大AI模型性能提升登上國際榜單