前兩天,馬斯克旗下的AI公司xAI,發(fā)布了其最新的AI大模型,也就是Grok3,以發(fā)布會上,馬斯克稱其是全球最聰明的AI。
而從各種測試對比來看,Grok3,也確實很厲害,比OpenAI、Deepseek的得分更高。
而Grok3,馬斯克是主打一個大力出奇跡,那就是堆了20萬張H100顯卡,堪稱是全球算力最強的大模型。
馬斯克的Grok3推出,似乎也證明了,規(guī)模定律(Scaling Law)仍然有效,堆算力依然是AI大模型的必由之路。
不過,讓馬斯克尷尬的事出現(xiàn)了,堆了20萬顯卡的Grok3,僅1天,Deepseek就又搞出新東西了,那就是NSA。
DeepSeek在社交平臺X上發(fā)布了一篇關于NSA的純技術論文報告。
按照Deepseek的說法,NSA是一種與硬件高度適配并可原生訓練的稀疏注意力機制,實現(xiàn)超高速長上下文訓練與推理。
NSA和DeepSeek的一慣風格相似,那就是低成本高效,通過對現(xiàn)代硬件的優(yōu)化設計,NSA可以降低預訓練的成本,且不犧牲性能,且NSA的表現(xiàn)可可媲美甚至超越全注意力模型。
也就是說,完全不需要像Grok3這樣,堆20萬張顯卡,NSA依然可以采用低成本的方式,實現(xiàn)對其它AI模型的超越。
可見,目前在AI上,Deepseek主打一個四兩撥千斤,而Grok、Openai們,則主打大力出奇跡,努力的堆顯卡。
本來美國那邊的AI公司認為,限制中國的AI卡,不讓你們獲得先進的AI芯片,那么就肯定打不過我們的AI模型,不曾想,中國的AI模型,不需要堆顯卡,也能實現(xiàn)更強的性能,更好的體驗,這就真的讓美國的這些企業(yè)們懵圈了,更重要的是,這也打破了美國的所謂算力壟斷,整個AI芯片格局,都可能重構。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.