編故事神器的完整版代碼來了!但OpenAI不保證不被濫用

巫盼 6年前 (2019-11-08)

技術永遠是把雙刃劍。

時隔九月,OpenAI終于放出了旗下最強NLP模型 GPT-2模型的完整代碼,包含15億參數。

編故事神器的完整版代碼來了!OpenAI不保證不被濫用

這套模型最初是被OpenAI的工程師用來根據文本中已知的單詞預測下一個單詞,后來經過大量數據訓練后,成為了現在的AI文本生成系統。該模型不僅可以根據給定的文本流暢地續寫句子,甚至可以形成成篇的文章,寫作水平堪比人類,被外界成為新一代“編故事”神器。

另外,GPT-2模型還可以執行機器翻譯、問答、閱讀理解和總結段落等任務。之前,OpenAI 已經發布了不同參數大小的三種GPT-2模型,今年2月,他們原本要釋出完整的GPT-2模型,期望GPT-2能夠被用來開發成寫作AI助手或是語言理解系統等應用。

但是許多研究人員持反對意見,認為該套模型會被用于制造假新聞,甚至被極端主義團體濫用進行意識形態的干涉影響,技術引發的爭議讓OpenAI決定暫緩完整代碼的開源,僅發布較小型的模型、范例和技術白皮書,供外部研究人員使用。

經過幾個月的調查,OpenAI表示還未發現改模型被濫用的證據,所以選擇釋出模型的完整代碼。同時他們也開發了一種檢測模型,來防范模型產生的造假文件,面對由GPT-2 生成的文本,檢測模型能夠帶來95%的成功率。

編故事神器的完整版代碼來了!OpenAI不保證不被濫用

但OpenAI的研究人員也表示,隨著文字生成器的輸出質量持續提升,被濫用的可能性就會提高,而檢測的挑戰性也更高。

所以,后續OpenAI會持續研究語言模型存在的偏差,并通過參與Partnership on AI的“Responsible Publication Norms for Machine Learning”項目,與其他AI研究人員共同探討此類問題。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到