(北京10日綜合電)中國雲計算及人工智能科技公司阿里雲發佈聊天機器人通義千問2.5大模型,並稱有關模型性能全面趕超GPT-4。
《第一財經》報道,阿里雲昨天(9日)發佈通義千問2.5,與通義千問2.1版本相比,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%;與GPT-4相比,中文語境下,通義千問2.5文本理解、文本生成、知識問答及生活建議、閒聊及對話、安全風險多項能力趕超GPT-4。
ADVERTISEMENT
阿里雲表示,隨著通義千問2.5的發佈,在權威基準OpenCompass上,有關模型得分追平GPT-4 Turbo,是中國國產大模型首次在這個基準取得的成績。
GPT-4 Turbo是人工智能聊天機器人ChatGPT的研發公司OpenAI推出的最新大型語言模型。
此前,中國人工智能巨頭商湯科技4月也發佈全新升級的日日新SenseNova5.0大模型。《澎湃新聞》報道,有關模型採用混合專家架構(MoE),超10TB tokens訓練,覆蓋大量合成數據,推理時上下文窗口達200K,綜合能力全面對標GPT-4 Turbo。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT