構建未來,共話AI基礎設施|2024WAIC“探索下一代大模型的基礎研究”論壇成功舉辦

zhouping 11個月前 (07-08)

上海,7月4日 —— 在2024世界人工智能大會論壇上,國內外院士、專家學者齊聚“超越邊界:探索下一代大模型的基礎研究”論壇

上海,7月4日 —— 在2024世界人工智能大會論壇上,國內外院士、專家學者齊聚“超越邊界:探索下一代大模型的基礎研究”論壇,共同探討“AI for Science 基礎設施建設”和“下一代通用人工智能方法”兩大前沿技術話題。本次論壇由世界人工智能大會組委會辦公室主辦,上海算法創新研究院和北京科學智能研究院承辦,上海市人工智能行業協會提供支持。論壇旨在搭建推動下一代人工智能技術交流協作的平臺,推動基礎設施建設,激發創新效能。

共建AI for Science基礎設施,邁向平臺科研時代

“AI for Science在材料、生命科學、能源化工等領域落地成果的不斷涌現,讓我們看到其帶來的巨大前景。但AI for Science帶來的不僅僅是點狀的突破,而是系統性地帶動科學研究基礎設施的建設,推進邁向“平臺科研”時代。”論壇伊始,中國科學院院士鄂維南為大會帶來了引導發言。他深入分析了AI for Science目前所處的發展階段,以及推動AI for Science的基礎設施建設的重要性,并設計了“四梁N柱”架構,鄂院士提到,“回顧科學研究的基本資源和基本方法,無論哪個科研方向,都少不了基本原理、實驗、文獻、算力的支撐。因此,構建科學研究的通用基礎平臺,即基本原理和數據驅動的模型算法與軟件、替代文獻的數據庫與知識庫、高效率、高精度的實驗表征方法、高度整合的算力平臺,可以推動共性問題的解決。

AI的方法大大提升了我們的科研能力,但是離真正解決問題還有距離,這剩下的“最后一公里”該如何打通?在會上這場重磅嘉賓陣容的圓桌對話里,中國科學院院士鄂維南、龔新高、丁洪,美國國家工程院院士、香港大學工程學院院長David J. Srolovitz,上??萍即髮W副教務長劉志,上海大學教授劉軼,北京應用物理與計算數學研究所研究員王涵在圓桌對話中對此進行了探討,從構建科學大模型、科學大裝置等基礎設施方面表達了看法,并共識了一個富有啟發性的觀點:“AI for Science的基礎設施建設需要跨學科的合作,這是實現科學突破的關鍵。我們應聚焦產業關鍵問題,賦能工業應用的實際場景。”那么,我們采取什么樣的道路才能實現真正的科學大模型呢?專家們指出,“在聚焦算力和算法的同時,要重點關注數據,而這些數據不單單是計算數據,還有來自于實驗所產生的數據,從這些數據中誕生新的模型。而驗證這些數據的準確性,同樣需要AI的賦能。”

在共性平臺的基礎上,圍繞具體應用(如生物醫藥、新材料、電池等),可高效率地推動對具體問題的研究。材料是AI for Science的重要應用場景之一。“AI for Materials”(AI4M)已成為材料科學研究與開發的重要組成部分,加深了我們對成分-結構-性能關系的理解,并促進了具有目標性能的材料設計。“AI技術能夠在全周期加速材料研發,提高材料研發的成功率”。會上,美國國家工程院院士、香港大學工程學院院長David J. Srolovitz從AI與材料科學的結合與應用展開了報告, “諸如深度勢能等AI for Science代表方法在材料研究方面的廣泛應用,已經推動實現了第一性原理精度的大規模模擬。”報告內容再次展示了人工智能應用在科學研究中的強大能力,以及AI賦能的原子間作用勢能研究,“整合了提示詞工程的大語言模型在材料發現和設計領域已經展現了卓越的性能,它能夠解析并理解材料成分、結構、以及性質之間的復雜關系。”

學科的交叉可以碰撞出新的火花,對 AI for Science基礎設施建設的創新思路也有新的啟迪。“AI智能體引入,將為科研人員賦能,激發創新靈感,大幅縮短研究周期,填補研發人員的短板,讓科學家有工程思維,工程師有產品思維。從而減少每個研發步驟之間的隔閡。同樣,材料科學也為AI帶來了新的挑戰,AI硬件問題的解決也需要材料科學推動。”中國科學院院士、北京大學副校長、北京大學博雅講席教授張錦院士提到。

我們欣喜地看到,業內已經有產品化與平臺化的成果產出,OpenLAM就是“平臺科研”與“開源共建”的一個典型代表。“語言數據的爆炸性增長孕育了大語言模型,同樣地,微觀尺度數據的累積也催生了一種創新的模型——大原子模型。”北京科學智能研究院院長、深勢科技創始人張林峰表示“這一模型的誕生,將帶來仿真設計在時空尺度與覆蓋范圍的量級式提升,實驗表征信號將能被更好地解析,它將成為原子級生產制造的重要組成部分。”OpenLAM計劃已于2023年底正式發起,北京科學智能研究院協同DeepModeling開源社區以及30多家共建單位,并邀請了原子級建模、表征、制造以及AI產業的多位院士、專家組成顧問團,共同推動構建大原子模型的“社區模式”。秉承“廣泛覆蓋、謹慎評估、開源開放、開箱即用”的開發理念,本論壇上最新發布了在合金、動態催化、分子反應、藥物小分子、固態電池、半導體、高溫超導7個領域模型解決方案,這些模型均以開放社區的形式發展而來,并在科學智能廣場可下載。“實驗科學家的語言和視角還未與AI技術和數據庫形成有效的連接,為此我們開發了‘晶體造句’APP,希望更多實驗科學家通過這個APP的窗口,來發現并合成更多人們尚未充分探索的材料。”

AI for Science的各項基礎設施正在全面落地建設,不僅僅是OpenLAM,本次論壇還同期發布了AI for Science的另一重要基礎設施,替代文獻的數據庫和知識庫的優秀實踐產品——Science Navigator 1.0。當前,對學科交叉檢索、原文內容溯源、科研數據解讀的需求已經遠遠超出了傳統文獻檢索工具的能力范圍,新一代科研文獻開放平臺Science Navigator應運而生。“Science Navigator 強大的自然語言對話式檢索能力,能夠迅速定位到科研工作者所需的信息,且回答可溯源到文獻原文。”北京科學智能研究院副院長李鑫宇介紹道,“AI向量數據庫疊加大語言模型讓訓練和推理成本大幅降低,等效實現3-6倍參數量模型效果。Science Navigator 1.0不僅僅是一個為科研工作者量身打造的AI平臺,它更是一個全新的科研生態系統。Science Navigator開放了絕大部分能力的API接口,使用者可以在這個平臺的基礎上構建自己的應用和智能體,以滿足科研復雜的個性需求,釋放更多的時間精力在解決關鍵問題與創新思考上。”

專家云集,共話下一代人工智能方法路在何方

從基礎理論到通用算法,AI技術的快速發展不僅改寫了范式,也正在將萬物智聯的未來視野變為現實。

“雖然目前人工智能算法、大模型已經取得了突出的進步,但是我們還需要繼續探索新的技術路線,以適合我國的實際發展需要。”面向下一代通用人工智能方法這一話題,引發了參會嘉賓們的思考。為此,中國科學院院士鄂維南、中國人民大學高瓴人工智能學院執行院長文繼榮、復旦大學教授邱錫鵬、華為云大數據與人工智能總裁尤鵬、墨奇科技聯合創始人/CTO湯林鵬、上海算法創新研究院研究員楊泓康展開了激烈討論,參會嘉賓認為,“必須且亟需建立人工智能的底層能力,探索出一條更加可持續、能夠解決當前大規模能源資源消耗問題的通用人工智能方法。也有嘉賓指出,“大模型的完善要從優化知識存儲能力和提高知識使用效率雙管齊下,催生模型”慢思考“能力。當模型有了解決復雜問題的能力,可能會帶來一系列的變化,比如在科研和技術的加速,新材料的發現等等,值得我們的持續關注。”與會嘉賓在此共識,“要實現下一代通用人工智能,需要在算力資源、數據資源、AI數據庫能力、下一代模型和人才資源等方面久久為功。”人工智能方法還是有很多沒有被探索,應該與場景去結合,從應用到底層技術進行創新。

針對當下通用人工智能的技術熱點與未來人工智能發展的必然趨勢,論壇嘉賓分享了他們獨到的技術見解。“生成式AI或者擴散模型遠遠不只于生成視頻或者圖片,使其應用于生命科學和材料科學,如蛋白質結構,RNA序列研究,晶體結構的設計等。”普林斯頓大學教授、普林斯頓人工智能創新中心主任王夢迪分享道。“不管是生成式AI,擴散模型,還是大語言模型,讓它變得更有用,更有意思,和人類的價值對齊,我認為我們需要做到的事情是讓這些模型可控,這是通向AGI的必經之路。”

我們當前正處在一波人工智能真實場景應用的浪潮之中,也為支持人工智能的硬件發展提出了多功耗,多場景覆蓋等更高的要求。在算力方面,未來我們期望的AI,不僅是解決特定問題的工具,更是能夠跨領域學習和創新的合作伙伴。華為昇騰計算業務CTO周斌以“大模型算力基礎設施的挑戰和發展探討”為主線展開報告,分享了他的觀點。“構建彈性靈活的算力基礎設施,并發展對應的數據軟件框架與優化算法,是確保下一代人工智能發展至關重要的基礎環節。業界主流模型從千億稠密到萬億稀疏,并逐步走向百萬級超長序列和多模態,大規模算力成為支撐高質量大模型創新落地的關鍵基礎。” 

那么下一代通用人工智能模型是什么樣的?論壇上的專家們也給出了各自的見解。其中之一是類比人腦記憶與思考方式的記憶分層大模型。目前記憶分層的大模型已經在上海算法創新研究院實現。會上,上海算法創新研究院大模型中心負責人熊飛宇發布了最新科研成果——憶³大模型(Memory³),該模型創新地引入了顯性記憶機制,顯著提高了性能并降低了訓練與推理成本。憶³在傳統的模型參數(隱性記憶)與上下文鍵值(工作記憶)之外,增加了第三種形式的記憶——顯性記憶。模型無需訓練即可將文本轉換為顯性記憶,并在推理時快速且稀疏地使用記憶。通過外部化模型存儲的知識,顯性記憶減輕了模型參數的負擔,進而提高了模型的參數效率與訓練效率,使基準測試上憶³能夠實現約3倍參數量模型的性能?;趹?sup3;架構的AI搜索引擎,利用顯性記憶的快速讀寫,使回答的時效性更強,準確率更高,內容更完整,還能夠根據用戶的反饋實時更新和優化答案。隱性記憶使搜索引擎能夠理解復雜的上下文關系,提供更精準和個性化的搜索結果?;趹?sup3;的特性,這款AI搜索引擎不僅提高了用戶的搜索體驗,還在信息檢索領域樹立了新的標桿。此外,憶³已在金融、媒體等行業落地應用。

隨著以深度學習、大模型為代表的 AI 技術迅速發展,圖像、視頻、文本、語音等的非結構化數據處理的需求和能力也有了爆發式的增長。高維向量是非結構化數據的統一語義表征,但主流的向量數據庫存在通用數據管理能力不足,面對海量數據時性能、可擴展性不佳的問題,難以應對大規模復雜 AI 應用的需求,而 MyScale 的初衷就是克服這些問題并成為 AI 時代的數據底座。墨奇科技聯合創始人/CTO湯林鵬介紹道,“MyScale 是國際上首個專為大規模結構化和非結構化數據處理設計的 AI 數據庫,支持海量結構化、向量、文本等各類異構數據的高效存儲和聯合查詢,綜合性能比國內外其他產品提高 4-10 倍。在實際生產中,MyScale AI 數據庫成功扮演了大模型+大數據雙輪驅動下的統一 AI 數據底座。在金融文檔分析、科研文獻智能問答分析、企業私域知識管理、工業/制造業智能化、零售行業客戶服務、人力資源行業智能化、法律行業智能化等應用場景中均幫助客戶創造了巨大價值,加速了大模型和場景數據結合的技術創新和應用落地。”

此外,本次論壇嘉賓也在人工智能人才培養上提出了建議與期待。目前,我國人工智能領域的人才需求量巨大,亟需打造體系化、高層次的人工智能和基礎研究人才培養平臺,培養使用戰略科學家,支持青年科技人才挑大梁、擔重任,加快凝聚一批跨學科發展研發隊伍,鼓勵更多研究人員投身交叉科學研究和基礎研究。

未來,從現在出發。在不斷探索人工智能邊界的道路上,培植下一代通用人工智能方法、完善AI for Science的基礎設施極為關鍵,它將推動科技向前發展,解鎖以前難以想象的創新可能性。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到