大模型下半場戰爭硝煙四起,AI進化論第二季開啟 | 第一季DeepSeek十日談精彩回顧
在全球 AI 競爭白熱化的今天,DeepSeek 以“國運級創新”橫空出世,不僅刷新了國產大模型的技術高度,更點燃一場關...
在全球 AI 競爭白熱化的今天,DeepSeek 以“國運級創新”橫空出世,不僅刷新了國產大模型的技術高度,更點燃一場關于 AI 技術革命的熱烈討論。正是在這樣的背景下,CSDN 策劃推出了“DeepSeek 暨 AI 進化論十日談”系列直播,旨在深入剖析 DeepSeek 所代表的技術創新如何重塑 AI 行業的未來。
這十場直播匯聚了頂級院校的 AI 學者、AI 專家、AI 領域的頂尖人士。他們以專業的視角和豐富的經驗,分享了對 AI 技術和市場的深刻見解。期間,他們直擊 AI 和大模型的核心技術問題,探討了 Scaling Law 是否已經過時?如何構建可持續的開源生態?大模型的護城河究竟在哪里?強化學習是否會帶來大模型的范式轉換?DeepSeek 有意識了嗎?哪些行業將會被顛覆……每一期都干貨滿滿,在 CSDN 視頻號矩陣吸引超 50 萬人次觀看,引發企業高管、學者、技術專家等行業人士的強烈共鳴。
Deepseek 暨 AI 進化論十日談主題一覽:
DeepSeek 技術創新及對 AI 生態的影響
強化學習是否會帶來大模型的范式轉換
直擊 Deepseek 技術真相,對我們究竟意味著什么?
十問解讀 Deepseek 的“國運級創新”
聊聊關于 Deepseek 的誤區與思考
Deepseek 及大模型創業生態
Deepseek 與軟件開發智能化
Deepseek 對 AI 技術及開發者的刷新
從 Deepseek 出發聊聊意識本質和人類未來
Deepseek 開啟的大模型下半場戰爭
第一談:DeepSeek 技術創新及對 AI 生態的影響
在“DeepSeek 暨 AI 進化論十日談”的第一場直播中,來自 CSDN 高級副總裁李建忠深入探討了 DeepSeek 的三大核心技術創新,以及它對大模型生態的深遠影響。作為國產大模型的典范,DeepSeek 不僅在技術上實現了突破,更通過其獨特的架構設計、算法優化、工程創新推動了整個 AI 行業的快速發展。
DeepSeek 的創新不僅改變了技術層面,還對大模型生態產生了深遠影響。首先,它將大模型的成本壓縮至與搜索引擎相當,降低了 AI 應用的門檻。隨著 AI 應用和智能體的快速發展,多個行業,尤其是醫療、金融、零售等,將迎來智能化升級的巨大機會。
更重要的是,DeepSeek 重塑了“AI 鐵三角”——算法、算力、數據的關系,推動了 AI 產業版圖的重構。最后,DeepSeek 的開源策略為 AI 創新提供了長期發展的平臺,推動了全球技術共享與進步。
第二談:強化學習是否會帶來大模型的范式轉換?
這一講邀請到了 CSDN 高級副總裁李建忠、復旦大學教授張奇、中國人民大學高瓴人工智能學院副教授劉勇。嘉賓們首先介紹了強化學習(RL)如何在 AI 中發揮作用,特別是在大模型的訓練中。李建忠通過 AlphaGo 到 AlphaZero 的經典案例,闡述了大模型如何通過推理能力的提升,從“快思考”到“慢思考”逐步推進。而劉勇和張奇則分別講解了強化學習的核心框架和在大模型中的應用歷史,深化了觀眾對 RL 的理解。
在討論強化學習對大模型范式轉變的影響時,嘉賓們深入剖析了大模型學習范式:模仿學習與探索學習的區別,以及如何通過強化學習實現更為高效的訓練流程。特別是在 DeepSeek R1 的應用中,強化學習的引入不僅顯著提升了推理能力,還可能減少對人工標注的依賴。通過 RLHF 與純 RL 的對比,嘉賓們探討了純 RL 如何改變傳統的監督微調方式,以及它是否意味著“人類標注師失業論”的到來。此外,嘉賓們也討論了強化學習在加速科研工程、推動 AGI 發展的潛力,以及 DeepSeek 在這一進程中的技術貢獻。
第三談:直擊 Deepseek 技術真相,對我們究竟意味著什么?
本期直播在 CSDN &《新程序員》執行總編唐小引的主持下,邀請到三位重量級嘉賓來為我們揭示 DeepSeek 的技術真相:硅谷資深 AI 技術專家吳雙,北京郵電大學人機交互與認知工程實驗室主任劉偉,以及《知識增強大模型》作者、前達觀數據副總裁王文廣。
在本次直播中,三位專家圍繞 DeepSeek 的技術實力展開了多維度的深入探討。他們首先分享了對 DeepSeek 及其 R1 模型的初步印象與獨特體驗,進而聚焦于 DeepSeek 技術創新的核心本質,剖析其強大之處究竟源于算法突破還是工程優化,并深入辨析了圍繞 DeepSeek 的諸多熱點議題,例如“蒸餾”爭議、低成本高效訓練的實現路徑、以及開源與閉源模式的優劣勢。討論還延伸至 DeepSeek R1 對下一代模型研究方向的潛在影響,并試圖從技術、產業、生態等多個層面,解碼 DeepSeek 現象背后所蘊含的更深層次的行業啟示與未來趨勢。
詳細內容,歡迎閱讀「直擊 DeepSeek 技術真相,對我們究竟意味著什么?| 萬有引力」一文。
第四談:犀利十問,解讀 DeepSeek 的“國運級創新”
本期 CSDN 高級副總裁李建忠對話北京大數醫達創始人 & CEO、復星集團首席 AI 科學家鄧侃,兩位 AI “老炮兒”火力全開“硬核”對話,圍繞十大犀利議題,分享最前沿的認知干貨。
第一問:DeepSeek 之后,還要不要相信 Scaling Law,要不要囤卡“大力出奇跡”?
第二問:強化學習驅動的推理計算范式轉移之后,數據還是否重要?
第三問:DeepSeek 的趕超到底是雕蟲小技?還是國運級創新?
第四問:大模型如何構建開源生態?DeepSeek 會成為 Linux 還是 Android or other?
第五問:如果 DeepSeek 是 Android,誰是中國 iOS?閉源模型是否還有機會?
第六問:大模型到底有沒有護城河?如果你是梁文鋒,如何建立 DeepSeek 的護城河?
第七問:DeepSeek 首先會顛覆誰?誰最危險?誰最安全?
第八問:AGI 時代,互聯網的哪些邏輯會變?哪些邏輯不會變?
第九問:DeepSeek 利好哪些職業,哪些職業會更危險?
第十問:推理計算范式下,代碼能力越來越強,程序員是否會大規模失業?
有關這十問的詳細內容,歡迎大家前往「十道靈魂之問,十日談解讀 DeepSeek 的“國運級創新”!」閱讀,本文進行了詳細整理與描述。
第五談:聊聊關于 DeepSeek 的十大錯誤認識
CSDN 高級副總裁李建忠在第五談中撥云見日,旨在厘清公眾對 DeepSeek 的認知誤區。他首先糾正了將 AI 發展視為線性“科技樹”的片面觀點,強調 AI 更像復雜系統,多維度協同創新才是關鍵,而非局限于單一技術分支或學派之爭。針對 “贏家通吃,模型即產品” 的誤解,李建忠強調大模型應定位為 AI 生態的基礎設施,而非最終產品,開源共享方能促進行業繁榮。
對于“Chatbox 是唯一產品形態”的誤讀,他指出 Chatbox 僅是淺層應用,大模型潛力在于賦能各行業,催生多元產品形態。關于 “DeepSeek 會推翻一切” 的論斷,李建忠認為技術發展是進化式迭代,DeepSeek 乃加速進化而非顛覆,其價值在于開辟新路徑、樹立新標桿。在此部分,李建忠也進一步闡釋了 DeepSeek 的出現對“Scaling Law”的傳統認知帶來的挑戰與反思。而將“大模型等同于操作系統”則是概念的混淆和作用的夸大,大模型是應用層技術,需與操作系統協同而非取代。
最后,針對“DeepSeek 缺乏創新”的論斷,李建忠有力反駁,力證 DeepSeek 在模型效率、成本控制及強化學習探索上的顯著創新。在厘清誤區后,李建忠引導思考 DeepSeek 是否引領 AGI 之路,肯定其為通往 AGI 的“先行者”與“探路人”,未來可期。
第六談:DeepSeek 及大模型創業生態
經過幾期對 DeepSeek 技術和生態的剖析,我們本期將目光轉向創業者,邀請到 CSDN 高級副總裁李建忠,維智科技創始人、PPTV前兼CEO陶闖圍繞大模型創業十問展開討論。
這十問分別是:
DeepSeek 浪潮是技術奇點還是范式轉變?
基礎模型之后,垂直模型是否還有生存空間?
AI 應用 Killer App 將在哪些賽道爆發?
AI 應用與模型之間,中間件將呈現何種形態?
數據資產價值何在?數據、數據資產與 AI 的關系是什么?
時空人工智能、時空智能學、空間智能三者有何關系?
DeepSeek 對具身智能行業有何影響?
AI 革命是工具革命到智能革命的范式轉變嗎?
智能眼鏡體系與時空智能有何關系?在大模型發展中將如何演進?
中國 VC 為何難投出 DeepSeek?如何構建健康創業生態?
第七談:DeepSeek 與軟件開發智能化
“DeepSeek 暨 AI 進化論十日談”第七講中,CSDN 高級副總裁李建忠探討了 DeepSeek 如何推動軟件開發智能化。他指出,DeepSeek R1 的推理能力有望將軟件開發帶向 L4 高度自動編程水平(關于 L1-L5 的等級劃分,詳見《大模型驅動軟件開發的一些誤區和思考》)。
李建忠剖析軟件開發智能化三大核心要素:復雜性、動態性、協作性。DeepSeek R1 雖擅長解決復雜性問題,但在軟件開發的動態迭代與多人協作方面仍存挑戰。他強調,大模型驅動軟件開發并非“無代碼”神話,推理能力提升使大模型從“碼農”向“設計師”、“架構師”躍遷,但并非代碼質量不再重要,反之,高質量代碼更易于被大模型理解和優化。
針對軟件開發的協作性難題,李建忠援引 Titus 論斷——軟件工程本質是多人多版本開發活動,Agent 智能體是破解協作難題的關鍵,Agent 的記憶、規劃、協作三大能力將重塑軟件開發模式。未來 “Agent 組織者” 將涌現,負責調度 Agent 團隊,但創新性協作仍需人類主導,Agent 尚不能完全取代人類在復雜協作中的核心地位。
第八談:DeepSeek 對 AI 技術及開發者的刷新
“DeepSeek 暨 AI 進化論十日談”第八講,由 CSDN&《新程序員》執行總編唐小引主持,上海人工智能實驗室青年科學家崔淦渠與中國石油大學(北京)副教授呂仲琪共同聚焦 DeepSeek 對開發者的意義、技術創新及未來。
專家們討論深入 DeepSeek R1 模型及 GRPO 算法的創新性,GRPO 算法在提升訓練效率和降低算力成本上展現優勢,驗證了純強化學習路線,盡管價值函數設計引發學術界的技術性探討。
針對 DeepSeek 未獲蘋果的“青睞”這一熱點事件,專家解讀為 DeepSeek 側重技術研究,商業應用非首要目標,與商業化企業定位不同。
在討論人類在 AI 時代的核心競爭力時,呂仲琪將程序員分為三類:設計 AI 程序的程序員、創造型高級程序員以及傳統碼農。他認為,設計 AI 程序的程序員和創造型程序員在 AI 時代不會被取代,而傳統碼農則面臨被 AI 替代的風險,需要積極提升自身技能。兩位嘉賓建議積極探索 AI 在工作和生活中的應用,不斷學習和適應 AI 驅動的變革。
第九談:DeepSeek 有意識嗎?
“DeepSeek 暨 AI 進化論十日談”第九講由 CSDN 創始人蔣濤主持,與復旦大學教授、高分子科學智能研究中心副主任李劍鋒、科幻作家、《云球》作者白丁一同探討“DeepSeek 是否會有意識”這一前沿且深刻的議題。
討論伊始,眾嘉賓從生物學角度引入意識的起源,引發對意識與智能關系的思考:李劍鋒認為,即使 AI 在決策、情感模擬甚至完成人類任務方面表現卓越,也并不等同于具備意識;白丁借《云球》中“意識場”的概念,呼應意識不可分割的整體性,探討精神與意識的可分性;李建忠強調意識與死亡這一核心哲學命題緊密相連,他認為意識的核心在于主觀體驗,而 AI 雖可模仿情緒,卻缺乏生命體驗,尤其對死亡的感知。
在觀眾問答環節,嘉賓們對“AI 可能加劇的貧富差距”、“產生意識的 AI 將優先與誰競爭”、“AI 生成內容的真偽辨別與知識準確性”等十幾道提問作出回答,直播間氣氛活躍。尾聲,嘉賓們金句頻出,從“未來的小孩應該選什么專業”這一提問,引發對 AI 未來及人類自身價值的更深層次思考。
第十談:DeepSeek 開啟的大模型下半場戰爭
“DeepSeek 暨 AI 進化論十日談”終結篇,CSDN 高級副總裁李建忠深度剖析 DeepSeek 的出現標志著大模型競爭進入下半場,重心從預訓練轉向推理及應用爆發。技術成本的降低和開源生態的構建將推動 AI 應用迎來寒武紀般的爆發。DeepSeek 目前專注于模型層,但其影響力將深入計算范式、開發范式和交互范式,尤其是在生產力工具和信息搜索領域,有望顛覆舊的互聯網格局,降低創作門檻,重塑內容生產與消費的比例。
在生態層面,DeepSeek 的開源技術將對云產業產生深遠影響,并催生基于 DeepSeek 的 Agent 平臺和云產業聯盟。微信接入 DeepSeek 主要增強了其搜索能力,但社交領域仍然是 AI 最難啃的骨頭。對話類 AI 產品的終局是 Agent 平臺,這將重塑應用生態,獨立的 App 或將消失,人機交互將更加自然。蘋果與阿里的合作,以及操作系統廠商對 Agent 分發入口的爭奪,都體現了 AI 時代新的競爭格局,而 DeepSeek 的未來,或將通過收購手機廠商改造操作系統,構建新一代 AI Agent 商店,并在國際競爭中,通過開源生態構建起強大的三層生態鏈。
關于 AI 進化論
AI 進化論系列直播秉持開放、思辨、前沿的理念,邀請眾多 AI 領域專家,帶來深度、尖銳、前瞻的思想碰撞,直面 AI 技術挑戰與機遇,一同探尋 AI 的無限可能,共同見證 AI 的蓬勃發展。
“如果說「AI 進化論第一季 DeepSeek 十日談」是對技術原理的深入探索,那么現在,我們將把目光投向實踐與落地!「AI 進化論第二季:智能應用崛起」將聚焦 DeepSeek 如何賦能千行百業?智能應用如何解決實際問題,創造商業價值?等業界關注的核心話題,邀請行業先鋒分享他們的經驗和洞見。
進化永不終止,追問永不停歇。關注「CSDN 視頻號」讓我們在下一次的「AI 進化論」中相遇。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
