阿里云發(fā)布通義千問2.5
2024-05-09 14:30
小號
默認
大號
5月9日,阿里云正式發(fā)布通義千問2.5,。阿里云方面表示,,該模型性能全面趕超GPT-4Turbo。阿里云表示,,在權威基準OpenCompass上,,通義千問2.5得分追平GPT-4Turbo,是國產大模型首次在該基準取得該項成績,。 | 相關閱讀(第一財經)
45

裕棠
追求內心的平靜和安寧
今年4月,,清華大學基礎模型研究中心聯(lián)合中關村實驗室發(fā)布了2024年3月版《SuperBench大模型綜合能力評測報告》,報告認為,,在中文推理,、中文語言等評測上,文心一言遙遙領先,,和其他模型拉開明顯差距,,中文理解上,文心一言4.0領先優(yōu)勢明顯,,領先第二名GLM-4 0.41分,,GPT-4系列模型表現(xiàn)較差,排在中下游,,并且和第一名文心一言4.0分差超過1分,。
如今通義千問也是在“中文語境下”趕超GPT-4。但我想說的是,,對于中文,,國內的公司強一點也是正常的,但還是要看到差距的是,,GPT-4幾乎覆蓋了所有的語言,,因此是全球的大模型,,其應用還是要更加廣泛一些,國內的互聯(lián)網(wǎng)公司大可把眼光放長遠和寬泛一些,,不要老是想著只在“中文”上超越國際競爭對手,。
26

懿德資本
文心一言不敢恭維、李彥宏強調說某些方面超過G PT4了,、比如詩詞方面,。我評論說現(xiàn)在年輕人誰好做實習、那還不如說文言文方面更勝一籌呢,,結果我的評論就被屏蔽了,。不是鼓吹國外的東西、都是付費版本,、文心一言就是個小學生,、回答問題不會變通、一板一眼的回答,。而GPT4目前最低也算高中生,、回答問題的邏輯性、拓展性都還可以的,。