Meta推出開源大模型Llama 3
2024-04-19 12:30
文本設(shè)置
小號
默認
大號
Plus(0條)
當(dāng)?shù)貢r間4月18日,,AI領(lǐng)域迎來重磅消息,,Meta正式發(fā)布了人們等待已久的開源大模型Llama 3,。馬克·扎克伯格表示,,Meta提供的生成式AI能力在免費產(chǎn)品中性能是最強大的,。該助理可以回答問題、制作動畫和生成圖像,。 | 相關(guān)閱讀(每日經(jīng)濟新聞)
57
東木
執(zhí)大象 天下往
從剛發(fā)出的博客來看,,Llama 3已幫Meta重奪開源大模型的魁首,并無限接近或者超過GPT,、Gemini和Claude等閉源大模型,。
這個消息的振奮程度,對于AI圈來說,,甚至不亞于所謂的GPT4.5,。畢竟,meta 才是真正的那個"OpenAI,。有多少大模型的生態(tài),,是建立在Llama上的,大家都懂,。
這次還是meta的老規(guī)矩,,雖然寫的是特定條件下商業(yè)使用,但是基本等于完全免費商用了,。而且這次開源了2個模型,,8B和70B。我看網(wǎng)上博客里的評測結(jié)果顯示:8B版本優(yōu)于Mistral 7B和Gemma 7B,,70B版本優(yōu)于Gemini Pro 1.5和Claude 3 Sonnet,。
不過Llama 3也存在兩個可提升的點,一個是知識庫時間,,一個是上下文長度,。知識庫這塊,8B只到2023年3月,,70B到了2023年12月,。而上下文長度更是只有8K。知識庫的時間還好說,,但是這個上下文長度,,在現(xiàn)在動不動200k的時代里,屬實是有點不夠了,。
不過,,瑕不掩瑜,估計接下來學(xué)術(shù)界做模型訓(xùn)練相關(guān)的實驗大多會切換到Llama 3的8B版本,,而等400B版本出來后如果效果接近甚至超過GPT-4,,大家在數(shù)據(jù)標注和評測等難任務(wù)上也會逐漸倒向免費的Llama系列。讓子彈再飛一會兒,。