據美國《華爾街日報》報道,美國持續對中國企業作出「制裁」,正促使中國科技公司加快研究步伐,尋求在不依賴美國最先進芯片的情況下開發尖端人工智能(AI),包括使用較低階芯片及國產自研芯片等現有資源。
《華爾街日報》對研究論文的評估及對相關員工的採訪發現,中國公司正研究一些或許能讓它們利用相對較少或沒那麼強大的半導體,打造出尖端AI性能的技術。它們還在研究如何結合使用不同類型的芯片,以避免對任何一種硬件的依賴。中國通訊設備供應商華為、搜尋公司百度和電商巨頭阿里巴巴等多家公司,都正設法更有效利用現有電腦芯片。
研究人員和分析師表示,利用這些變通方法來追趕美國AI領頭羊公司仍是一個重大挑戰。不過他們說,有些實驗已讓人們看到了前景,這種研究若成功推進,中國科企或許能克服美國「制裁令」帶來的困境,並在面對未來的限制時有更強的適應能力。
發掘算力彌補頂級硬件缺乏
目前將類似AI聊天機械人ChatGPT的模型商業化的競賽日益升溫,全球各地公司都急需更強大的芯片,並設法更有效地利用芯片,以壓低激增的AI開發成本。美國科企Meta專門研究AI基礎設施和大語言模型的研究員蘇珊·張(Susan Zhang,譯音)表示,從各種跡象可看出,中國公司正試圖發掘一切可以利用的算力,以彌補頂級硬件的缺乏。在AI行業,算力指一組芯片可提供的運算能力。
去年10月,美國商務部對向中國供應芯片實施全面限制,此後美國總統拜登政府已暗示可能實施進一步「制裁」。「制裁」導致中國企業與AI開發行業無法獲取美國芯片製造商英偉達(Nvidia)生產的最先進芯片A100,以及今年3月推出具更強運算能力的H100。英偉達設計了降級版芯片專供中國市場,分別為A800和H800,以符合「制裁」要求。
不同芯片訓練大規模AI模型
經營AI基礎設施公司的新加坡國立大學教授尤洋表示,許多中國公司正研究組合三四塊較低階芯片包括A800和H800,來替代英偉達最先進的處理器。騰訊上月便發布了一個新的可用於AI大模型訓練的運算集群,這些互聯芯片中使用了英偉達H800。
尤洋說,這種組合低階芯片的方法可能成本很高,為此部分中國科企正加速開發技術,使用不同類型的芯片來訓練大規模AI模型。論文顯示,阿里巴巴、百度和華為已尋求使用A100、上一代英偉達芯片V100和P100,以及華為昇騰芯片的各種組合。
與此同時,中國公司也正研究使用各種軟件技術,來降低訓練大規模AI模型的運算強度,這種方法已在全球範圍內加速推廣,包括在美國公司。不過論文顯示,與美國公司不同,中國公司在結合使用多種軟件技術方面更積極主動,中國研究人員並已取得了一些成功。
在今年3月一篇論文中,華為研究人員展示他們如何利用這種技術,只使用該公司的昇騰芯片而不是英偉達的芯片,來訓練其最新一代大語言模型。研究人員稱,儘管存在一些缺點,但這個名為「盤古」的大語言模型,在處理閱讀理解和語法挑戰等一些中文任務上都具有最先進性能。
專家:中國研究看來有效 或可規避「制裁」
半導體研究與顧問公司SemiAnalysis首席分析師帕特爾表示,在拿不到美國芯片製造商英偉達最新的H100芯片的情況下,中國研究人員的難關會更高,H100含有額外的性能提升功能,尤其有助訓練類似人工智能聊天機械人ChatGPT的模型。然而去年百度公司與深圳鵬城實驗室一份論文顯示,研究人員正以無需H100額外提升功能的方式,訓練大型語言模型。帕特爾指出,儘管研究還在初步階段,但看來有效。
帕特爾表示,如果研究進展順利,則可以有效地規避美國對華出口限制和「制裁」。另據《華爾街日報》援引知情人士說,百度近年來一直在尋求將國產芯片納入其AI開發,包括海光資訊的DCU和華為的AI訓練芯片昇騰,以及百度本身的昆侖芯。
沒有留言:
張貼留言