NVIDIA NIM 微服務和 AI Blueprint 助力開發者和發燒友在 PC 上構建 AI 智能體和創意工作流
拉斯維加斯—CES—2025 年 1 月 6 日— NVIDIA 今日發布能在 NVIDIA RTX™ AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
這些基礎模型以 NVIDIA NIM™ 微服務的形式提供,由全新 GeForce RTX™ 50 係列 GPU 加速,提供最高可達 2375 AI TOPS 和 32GB 顯存。基於 NVIDIA Blackwell 架構的 RTX 50 係列 GPU是首批支持 FP4 計算精度的消費級 GPU。與上一代產品相比,AI 推理性能提升 2 倍,並讓生成式 AI 模型在本地以更小的顯存占用空間運行。
長期以來,GeForce™ 一直是 AI 開發者的重要平台。早在 2012 年,首個由 GPU 加速的深度學習網絡 AlexNet 就是在GeForce GTX 580 上進行訓練的。在去年發表的 AI 研究論文中,超過 30% 都提及了對 GeForce RTX 的使用。
現如今,在生成式 AI 和 RTX AI PC 的助力下,任何人都能成為開發者。借助 AnythingLLM、 ComfyUI 和 LangFlow 等新一代低代碼和無代碼工具,發燒友能夠通過簡單的圖形用戶界麵 (GUI) 在複雜的工作流中使用 AI 模型。
連接到這些 GUI 的 NIM 微服務使獲取和部署最新生成式 AI 模型輕而易舉。NVIDIA AI Blueprint
基於 NIM 微服務構建,旨在為數字人、內容創作等應用提供易於使用的預配置參考工作流。
為滿足 AI 開發者和發燒友日益增長的需求,領先 PC 製造商和係統集成商即將推出搭載 GeForce RTX 50 係列 GPU 且支持 NIM 的 RTX AI PC。
NVIDIA 創始人兼首席執行官黃仁勳表示,“AI 正在以光速發展,從感知式 AI 到生成式 AI,再到如今的代理式 AI。NIM 微服務和 AI Blueprint 為 PC 開發者和發燒友探索 AI 提供了基礎模塊。”
NIM 提供迅捷 AI 體驗
基礎模型,即使用海量原始數據訓練而成的神經網絡,是生成式 AI 的基礎模塊。
NVIDIA 將發布一係列來自包括 Black Forest Labs、Meta、Mistral 和 Stability AI 等頂尖模型開發者的適用於 RTX AI PC 的 NVIDIA NIM 微服務。涵蓋大語言模型 (LLM) 、視覺語言模型、圖像生成、語音、檢索增強生成 (RAG) 的嵌入模型、PDF 提取和計算機視覺等應用場景。
Black Forest Labs 首席執行官 Robin Rombach 表示,“支持 FP4 計算精度的 GeForce RTX 50係列 GPU 將使一大批此前僅適用於大型數據中心的模型得以在 PC 上運行。把 Flux 打造成 NVIDIA NIM 微服務,讓更多用戶以更快的速度部署和體驗 AI,同時提供超乎想象的性能。”
NVIDIA 今天還宣布推出 Llama Nemotron,這是一係列開放許可的基礎模型,能夠在各類代理式任務中提供極高的精度。Llama Nemotron Nano 模型將作為麵向 RTX AI PC 和工作站的 NIM微服務提供,在指令遵循、工具調用、聊天、代碼和數學等代理式 AI 任務方麵表現出眾。
NIM 微服務包含在 PC 上運行 AI 所需的關鍵組件,並針對 NVIDIA GPU 的部署進行優化,無論
GPU 在 RTX PC 、工作站,還是在雲端。
開發者和發燒友將能快速下載這些 NIM 微服務,並可在帶有適用於 Linux 的 Windows 子係統
(WSL) 的 Windows 11 PC 上設置和運行。
微軟副總裁,Windows 業務負責人 Pavan Davuluri 表示:“AI 正在快速驅動 Windows 11 PC 創新,適用於 Linux 的 Windows 子係統 (WSL) 和 Windows Copilot Runtime 為 Windows 11 上的 AI 開發提供出色的跨平台環境。NVIDIA NIM 微服務為 Windows PC 提供優化,為開發者和 發燒友提供可立即集成到其 Windows 應用中的 AI 模型,從而進一步加速 Windows 用戶的 AI 功能部署。”
運行在 RTX AI PC 上的 NIM 微服務將兼容先進 AI 開發和智能體框架,包括 AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow 和 LM Studio。開發者可以通過行業標準端點,將基於上述框架構建的應用和工作流連接到運行 NIM 微服務的 AI 模型,無論在雲端、數據中心、工作站還是 PC 上,都可通過統一的接口使用最新技 術。
發燒友還可通過即將發布的 NVIDIA ChatRTX 技術 Demo 體驗一係列 NIM 微服務。
讓代理式 AI 擁有擬人表情
為了向 RTX 發燒友和開發者展示使用 NIM 微服務構建 AI 智能體和助手的方法,NVIDIA 今天首 度公開 Project R2X。這是一款具有視覺能力的 PC 虛擬形象,它可以讓用戶需要的信息觸手可及、協助用戶使用桌麵應用、進行視頻會議、閱讀和總結文檔等。
該虛擬形象采用全新生成式 AI 算法 NVIDIA RTX Neural Faces 渲染而成,這種算法可利用完全生成的像素來增強傳統光柵化渲染。然後,麵部通過基於擴散原理的全新 NVIDIA Audio2Face™- 3D 模型驅動動畫,該模型可改善唇部和舌頭動作。R2X 可以通過 CrewAI、Flowise AI 和 LangFlow 等開發者框架連接到 OpenAI 的 GPT 4o 或 xAI 的 Grok 等雲端 AI 服務,以及 NIM 微服務和 AI Blueprint,如 PDF 檢索器或其他 LLM。注冊以關注 Project R2X 的更新。
AI Blueprint 即將登陸 PC
NIM 微服務還可通過 AI Blueprint(可在 RTX PC 上本地運行的參考 AI 工作流)供 PC 用戶使 用。借助這些藍圖,開發者能夠基於 PDF 文檔創建播客、生成由 3D 場景引導的令人驚豔的圖像等。
將 PDF 轉換為播客的藍圖可從 PDF 中提取文本、圖像和表格,創建可供用戶編輯的播客腳本。它還能根據此腳本,使用藍圖中提供的語音或基於用戶的語音樣本生成完整的音頻錄音。此外,用戶還能與 AI 播客主持人進行實時對話,了解有關特定主題的更多信息。
該藍圖利用像 Mistral-Nemo-12B-Instruct 這樣的 NIM 微服務來處理語言,借助 NVIDIA Riva
進行文本轉語音和自動語音識別,以及使用 NeMo Retriever 微服務集合進行 PDF 提取。
使用由 3D 引導的生成式 AI Blueprint,藝術家能對圖像生成進行更精細的控製。雖然 AI 可以通過簡單的文本提示生成令人驚歎的圖像,但僅使用文字控製圖像的內容極具挑戰。有了上述藍 圖,創作者可以借助使用 Blender 等 3D 渲染器布置簡單的 3D 物體來引導 AI 圖像生成。藝術家可手動或使用 AI 生成創建 3D 資產,將其放置在場景中,並設置 3D viewport 相機。由 Flux NIM 微服務提供支持的預打包工作流將可以通過插件 (例如 Blender 中由開發者 ACGGit 開發的 ComfyUI-BlenderAI-node )使用當前布景生成與 3D 場景相匹配的高質量圖像。
NVIDIA NIM 微服務和 AI Blueprint 將從 2 月起開始提供,首發支持的硬件包含 GeForce RTX 50 係列、GeForce RTX 4090 和 4080 以及 NVIDIA RTX 6000 和 5000 GPU ,未來還會陸續提供對其他 GPU 的支持。宏碁、華碩、戴爾、惠普、聯想、微星、雷蛇將推出支持 NIM 的 RTX AI PC。
關注 NVIDIA CES 動向,了解 NIM 微服務、AI Blueprint 以及支持 NIM 的RTX AI PC 如何加速生成式 AI。
關於 NVIDIA
NVIDIA (NASDAQ: NVDA) 是加速計算領域的全球領導者。
# # #
媒體谘詢:
Jade Li
NVIDIA GeForce, Studio PR
郵箱:jadli@nvidia.com
該新聞稿所含若幹陳述包括(但不限於)有關以下各項的陳述:NVIDIA 產品、服務和技術的優勢、影響、性能,包括 NVIDIA RTX AI PCs, GeForce RTX 50 Series GPUs, NVIDIA Blackwell architecture, GeForce GTX 580, Project R2X, NVIDIA ACE and NIM microservices, NVIDIA AI Blueprints, NVIDIA Project DIGITS, NVIDIA Grace Blackwell platform, Llama Nemotron, NVIDIA ChatRTX, NVIDIA RTX Neural Faces, NVIDIA Audio2Face-3D model, Mistral- Nemo-12B-Instruct for language, NVIDIA Riva, NeMo Retriever,FLUX NIM microservice, GeForce RTX 4090 and 4080, and NVIDIA RTX 6000 and 5000 professional GPUs third parties using or adopting NVIDIA’s products and technologies, and the benefits and impact thereof; and AI advancing at light speed, from perception AI to generative AI and now agentic AI 均屬前瞻性陳述,受製於可能導致結果與預期有重大差異的風險和不確定因素。可 能導致實際結果產生重大差異的重要因素包括:全球經濟狀況;我們依靠第三方來製造、組裝、包裝和測試我們的產品;技術發展和競爭的影響;新產品和技術的開發或者現有產品升級;我們產品或合作夥伴產品的市場認可度;設計、製造或軟件缺陷;消費者偏好或需求的變化;行業標準和接口變化;我們產品或技術在集成到係統中時發生的意外性能損失; NVIDIA 向美國證券交易委員會(SEC)提交最新報告中不時詳述的其他因素,這些報告包括(但不限於)采用 10-K 表
的年度報告和采用 10-Q 表的季度報告。向SEC 提交的報告的副本均在 NVIDIA 的官方網站上發布,並可免費下載。以上前瞻性陳述並非未來表現的保證,僅以本協議日期為準;除法律要求外,NVIDIA 不承擔更新以上前瞻性陳述以反映未來事件或情況的任何義務。
© 2025 NVIDIA Corporation 保留一切權利。NVIDIA,NVIDIA 商標 NVIDIA, the NVIDIA logo, ConnectX, CUDA, DGX, Project DIGITS, NGC, NVIDIA Grace, NVIDIA NeMo, NVIDIA NIM, NVIDIA RAPIDS and NVLink 均為 NVIDIA Corporation 在美國和/或其他國家的商標和/或注冊商標。其他公司和產品名稱可能是與其相關的各家公司的商標。功能、價格、可用性和規格如有更改,恕不另行通知。
推薦設計
優秀海報設計精選集(8)海報設計2022-09-23
充滿自然光線!32平米精致裝修設計2022-08-14
親愛的圖書館 | VERSE雜誌版版式設計2022-07-11
生活,就該這麼愛!2022天海報設計2022-06-02
最新文章
麥克保羅瓷磚亮相2025成都設計新聞2025-04-27
KACO 2025新品發布,百款新設計新聞2025-04-26
DOJUS度假式家私:跨越川藏設計新聞2025-04-25
晶耀春時,奢宴雅聚:A設計新聞2025-04-24