NVIDIA 通過企業級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業智能

zhouping 2年前 (2023-12-05)

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優化語義檢索,實現準確的 AI 推理

亞馬遜云科技 re:Invent — 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務,支持企業將自定義大語言模型與企業數據相連接,使其 AI 應用能夠提供高度準確的響應。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一個用于構建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務,通過企業級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應用。

作為一項語義檢索微服務,NeMo Retriever 借助經 NVIDIA 優化的算法,幫助生成式 AI 應用作出更加準確的回答。使用該微服務的開發者,可以將其 AI 應用與位于各個云和數據中心的業務數據相連通。該服務為 AI 代工添加了 NVIDIA 優化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務中。

NVIDIA 創始人兼首席執行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應用是企業的下一個殺手級應用。借助 NVIDIA NeMo Retriever,開發者可以創建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業的業務數據,通過準確且有價值的生成式 AI 智能來提高生產力。”

全球頭部企業借助 NeMo Retriever 提高大語言模型(LLM)準確性

電子系統設計領導廠商 Cadence 為超大規模計算、5G 通信、汽車、移動、航空航天、消費和醫療市場的企業提供服務。該公司正與 NVIDIA 合作,為工業電子設計領域的生成式 AI 應用開發 RAG 功能。

Cadence 總裁兼首席執行官 Anirudh Devgan 表示:“生成式 AI 引入了創新方法來滿足客戶需求,比如能在設計流程早期發現潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進一步提高生成式 AI 應用的準確性和相關性,以便發現問題,并幫助客戶更快地將優質產品推向市場。”

破解精確的生成式 AI 應用的“密碼”

與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業可行性的模型、API 穩定性、安全補丁和企業級支持,來為生產就緒型生成式 AI 賦能。

經 NVIDIA 優化的算法使 Retriever 的嵌入模型能夠產出準確性最高的結果。經過優化的嵌入模型能夠捕捉單詞之間的關系,使 LLM 能夠處理和分析文本數據。

企業可以使用 NeMo Retriever 將 LLM 連接到多個數據源和知識庫,這樣用戶就可以輕松地與數據交互,并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅動的應用,企業可以使用戶安全地訪問多種數據格式的信息,如文本、PDF、圖像和視頻等。

借助 NeMo Retriever,企業能夠以更少的訓練獲得更準確的結果,加快產品上市時間,并減少生成式 AI 應用開發產生的能耗。

通過 NVIDIA AI Enterprise 實現可靠、簡單且安全的部署

企業可以在幾乎任何數據中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅動的應用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。

供應情況

開發者可以注冊并搶先體驗 NVIDIA NeMo Retriever。

關于 NVIDIA

自 1993 年成立以來,NVIDIA(NASDAQ: NVDA)一直是加速計算領域的先驅。NVIDIA 1999 年發明的 GPU 驅動了 PC 游戲市場的增長,并重新定義了現代計算機圖形,開啟了現代 AI 時代,正在推動跨市場的工業數字化。NVIDIA 現在是一家全棧計算公司,其數據中心規模的解決方案正在重塑整個行業。

本新聞稿中的部分聲明包括但不限于有關以下內容的聲明:我們的產品、服務和技術,包括 NVIDIA NeMo Retriever、NVIDIA NeMo、NVIDIA AI Enterprise 的優勢、影響、性能和供貨情況;部分企業率先與 NVIDIA 一起將生產就緒型 RAG 功能整合到其自定義生成式 AI 應用和服務;具有 RAG 功能的生成式 AI 應用成為企業的下一個殺手級應用;企業擁有數百個自定義生成式 AI 聊天機器人、AI 助手和摘要工具,它們能夠通過訪問企業的數據,提供準確和有價值的智能;全球頭部企業借助 NeMo Retriever 提高 LLM 的準確性,包括其帶來的好處和影響等均為前瞻性聲明,存在風險與不確定性,且最終結果可能與預期存在極大差異??赡軐е聦嶋H結果出現極大差異的重要因素包括:全球經濟狀況;我們在制造、組裝、包裝和測試產品方面對第三方的依賴性;技術發展和競爭的影響;新產品和技術的發展或對我們現有產品和技術的改良;市場對我們的產品或合作伙伴產品的接受情況;設計、制造或軟件缺陷;消費者偏好或需求的變化;行業標準和界面的變化;將我們的產品或技術集成到系統中時意外損耗的性能;以及 NVIDIA 近期提交給美國證券交易委員會 (SEC) 的報告(包括但不限于 Form 10-K 年報及 Form 10-Q 季報)中屢次具體說明的其他因素。提交給 SEC 的報告副本發布在公司網站上,且可免費從 NVIDIA 獲得。這些前瞻性聲明不能保證未來的表現,僅在規定日期有效。除非法律另有要求,否則 NVIDIA 對更新這些前瞻性聲明以反映未來事件或環境不承擔任何責任。

©2023 NVIDIA Corporation。版權所有。NVIDIA、NVIDIA 徽標、NVIDIA NeMo、NVIDIA Triton 推理服務器、NVIDIA TensorRT 是 NVIDIA Corporation 在美國和其他國家的商標和/或注冊商標。其他公司和產品名稱可能為與之相關的各自公司的商標。功能、價格、供貨情況和規格如有變更,恕不另行通知。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到