「不完美」的百度文心一言,背水一戰

jh 2年前 (2023-03-17)

國產ChatGPT應用,仍待市場檢驗。

大概百度CEO李彥宏自己也沒有想到,GPT-4會突然“搶跑”。

因此在今日下午的文心一言發布會現場,李彥宏的話語之間少了些從容,多了幾分緊張,開場白中也多次提及GPT-4。

在隨后的展示環節中,李彥宏親自展示了文心一言在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解以及多模態生成。

不過由于現場采用錄播的形式進行演示,因此不少觀眾對評論中紛紛表達出失望。

資本市場更是直接用股價“表達”不滿,在李彥宏臺上講話的同時,百度股價在港股市場上直接跳水,一度暴跌10%。

那么文心一言真的如網友所評價的一樣“不堪”嗎?

中國版ChatGPT,能力如何?

十月懷胎,一朝分娩”。

每個人都在期待這個預熱多時的AI大模型文心一言長什么樣?

在進行簡單的開場白后,李彥宏直接展示了文心一言的五大能力:

· 文學創作

在這一環節,李彥宏拿出了知名科幻小說《三體》和文心一言進行了六輪對話,主要體現文心一言所具有的總結能力、推理能力等等。

作為大模型的最基本能力,文心一言采用了5500億知識圖譜的事實的訓練數據,來保證事實性問題回答準確。

從回答來看,文心一言的準確性相當不錯。

“不完美”的百度文心一言,是否還有驚喜?

· 商業文案創作

李彥宏以一家科技服務創業公司為例,要求文心一言從取名、Slogan等方面提出建議。

文心一言表現出的能力也符合預期,還為生成的5個公司名稱進行了解釋。

“不完美”的百度文心一言,是否還有驚喜?

· 數理邏輯推算

用大模型做題,是ChatGPT的亮點之一,文心一言也具備這一能力。

這一環節,李彥宏提出了“雞兔同籠”這一中國古代典型數學題。

一開始,題目中給出一個錯誤的數據,文心一言及時給出了提示。

在修改數據后,文心一言不僅給出了正確答案,同時也給出了解題步驟。

“不完美”的百度文心一言,是否還有驚喜?

· 中文理解

毫無疑問,這是國產大模型與英文大模型最大的區別之一。

據李彥宏表示,文心一言使用了大量中文數據集來進行訓練。

在現場展示的有關“洛陽紙貴”的一系列問題時,文心一言合理解釋了這個帶有內涵的成語,同時秀了一首藏頭詩。

不過李彥宏也坦言,文心一言在處理英文問題時還存在差距,部分原因是因為在訓練數據樣本還不夠大。

由此可見,文心一言還是更貼近中文語境。

“不完美”的百度文心一言,是否還有驚喜?

· 多模態生成

對比上一代產品,GPT-4最大的特點是支持多模態生成。而這一次,文心一言也展示了自身多模態生成能力。

在現場,文心一言現場秀了一段四川話,還展示了一段文字轉視頻的能力。

“不完美”的百度文心一言,是否還有驚喜?

有趣的是,李彥宏在展示這一環節時,百度的股價一度有回升的態勢,但李彥宏隨后表示視頻暫時還沒有對外開放后,上漲的勢頭突然就被“撲滅”……

從上述五大能力來看,文心一言已經具備了ChatGPT擁有的能力,甚至在“雞兔同籠”、“洛陽紙貴”等表現上更勝一籌。

但奈何GPT-4直接降維打擊,沖擊感更大,能力也更強。

當文心一言拋出這些“新功能”時,很難再稱得上是一種驚喜。

“不完美”的文心一言,沒有退路

在發布會上,李彥宏提出一個問題,百度是不是真的Ready了?

這一問題上,李彥宏并沒有給出直接答復,而是從側面指出,百度是全球大廠中第一個發布對標ChatGPT的產品,甚至超過了微軟和谷歌(注:李彥宏指出,微軟是直接調用GPT)。

同時他指出,選擇于此時發布,主要是基于市場需求。

眾所周知,隨著GPT-4的震撼發布,OpenAI在產品力上又向前邁進一步,這對于國內廠商來說并不是什么好消息。

目前國內追趕OpenAI的陣營中,百度在大模型上的研發投入屬于第一梯隊,從發布會上的演示來看,文心一言的表現其實表現的非常出色,在多個環節表示完全不輸ChatGPT。

但眾所周知,發布多時的ChatGPT是基于GPT-3.5架構開發,而GPT-4已經是新一代的升級版本。

隨著GPT-4以狂飆之勢涌入主流視野,百度的進度一瞬間就被甩開了一大截。

作為百度的帶路人,李彥宏自然深知行業的一舉一動,如果此時再不上馬“文心一言”,后面的壓力可想而言。

因此在進退兩難面前,李彥宏還是選擇迎頭直面OpenAI。

或許文心一言的demo演示或多或少讓人感到失望,但當下目前最重要的任務還是搶占市場還是。

值得一提的是,在百度 CTO 王海峰上臺分享了背后的技術與百度多年的技術積累后,百度的股價再次“抬頭”。

“不完美”的百度文心一言,是否還有驚喜?

多年沉淀,文心一言仍有機會顛覆

不可否認的是,文心一言在一些細節上仍顯得不足,李彥宏也正視了文心一言與頂尖模型GPT-4的差距。

不過,中文大模型與英文大模型從背后邏輯來看存在差異。多數業內人士指出,中文與英文的互聯網環境互相不同,訓練的難度也有所不同。

即便是ChatGPT,在一些中文問題上也會有水土不服的現象,例如“藏頭詩”,GPT-4就很難理解。

而這一點,在中文環境中沉淀多時的文心一言就表現的更好。

事實上,文心一言并不是一個新事物,該大模型從2019年誕生的預訓練模型ERNIE1.0開始,歷經多年的迭代,最終構成了如今的文心大模型。

而在發布會上,王海峰也介紹道,文心一言是新一代知識增強大語言模型,是在ERNIE及PLATO系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。

“不完美”的百度文心一言,是否還有驚喜?

換句話說,文心一言更像是百度多年以來AI能力的大合集。

除了AI對話以外,文心大模型涉及的應用非常多,包括搜索、智能云、自動駕駛、繪畫等多個領域。涉及的行業也涵蓋了金融、能源、媒體、政務等千行百業。另外在會上,百度表示已有超過650家企業宣布接入文心一言生態。

因此,在實際應用面前,文心一言的商業能力還是遠超其他公司。這也驗證了李彥宏所說的:“此時發布,主要是基于市場需求。”

隨著后期越來越多的用戶接入文心一言,該大模型的能力也會不斷提升。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到