设计之家 > 設計資訊 > 設計新聞 >

借助 Tensor Core GPU、LLM和適用於RTX PC 和工作站的工具,NVIDIA為數百萬用戶帶來生成式AI

作者:佚名 來源:設計之家 時間:2024-01-09

全新 GeForce RTX SUPER GPU、各大OEM的AI筆記本電腦為領先的AI平台帶來 RTX 加速

美國拉斯維加斯—CES—2024年1月8日—NVIDIA發布具有高性能生成式AI功能的GeForce RTX™ SUPER桌麵端GPU,來自OEM合作夥伴的全新AI筆記本電腦,及麵向開發者和消費者的全新NVIDIA RTX™加速的AI應用和工具。

數十年來,NVIDIA在PC領域一直處於領軍地位,現已有超1億RTX GPU在推動著AI PC時代的發展,NVIDIA正通過提供工具以提升PC上的生成式 AI體驗:NVIDIA TensorRT™加速用於文本生成圖像工作流的熱門Stable Diffusion XL模型、NVIDIA RTX Remix與生成式AI紋理工具、NVIDIA ACE微服務以及更多使用DLSS 3幀生成技術(Frame Generation)的遊戲。

此外,NVIDIA TensorRT-LLM (TRT-LLM) 是一個開源庫,可加速和優化最新大語言模型 (LLMs) 的推理性能,現已支持更多麵向PC的預優化模型。本月,NVIDIA發布由TRT-LLM加速的Chat with RTX技術Demo,讓AI愛好者能與他們的筆記、文檔和其他內容進行交互。

NVIDIA創始人兼首席執行官黃仁勳表示:"生成式AI是計算史上最重要的平台轉變,它將改變包括遊戲在內的所有行業。NVIDIA擁有超過1億台RTX AI PC和工作站的用戶基礎,為開發者和玩家提供保證,讓他們盡享生成式AI的魔力。”

在 PC 上本地運行生成式AI對於隱私、延遲和成本敏感型應用至關重要。但這需要大量AI係統安裝基礎,以及合適的開發者工具來調優PC平台的AI模型。

為滿足這些需求,NVIDIA正通過其整個技術棧提供創新,推動新體驗,並在現已支持超過 500 款NVIDIA RTX遊戲和應用的AI PC基礎上更進一步。

RTX AI PC 和工作站

NVIDIA RTX GPU能以最高性能運行各種應用,充分釋放 PC上生成式AI的潛力。RTX GPU 中的Tensor Core可顯著加速工作和娛樂應用中要求最嚴苛的AI功能。

今天在 CES 發布的全新 GeForce RTX 40 SUPER 係列GPU包括 GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER,提供出色的 AI 性能。在AI工作負載方麵,GeForce RTX 4080 SUPER 生成視頻的速度比 RTX 3080 Ti 快 1.5 倍,生成圖像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的Tensor Core可提供最高可達 836 AI TOPS,在遊戲、創作和日常工作等方麵提供革命性的AI性能。

包括宏碁、華碩、戴爾、惠普、聯想、微星等合作夥伴發布全新 RTX AI 筆記本電腦,為用戶帶來開箱即用的生成式 AI體驗。與使用NPU相比,RTX AI筆記本電腦的性能可提升 20-60 倍。

配備RTX GPU的移動工作站可運行NVIDIA AI Enterprise軟件,包括TensorRT和NVIDIA RAPIDS™,用於簡化、安全的生成式AI和數據科學開發。每台NVIDIA A800 40GB Active GPU都包含為期三年的NVIDIA AI Enterprise許可證,為AI和數據科學提供理想的工作站開發平台。

用於構建AI模型的全新 PC 開發者工具

為幫助開發者使用 PC 級的性能和顯存快速創建、測試和定製預訓練生成式 AI 模型和 LLM,NVIDIA於近期發布統一、易用的工具包NVIDIA AI Workbench。

AI Workbench 將於本月底推出測試版,提供對Hugging Face、GitHub 和 NVIDIA NGC™ 等熱門資源庫的流暢訪問、簡化用戶界麵,使開發者能輕鬆複製、協作和遷移項目。

項目可擴展到數據中心、公有雲或 NVIDIA DGX™ Cloud等任何地方,然後再回到PC 或工作站上的本地 RTX 係統進行推理和輕量定製。

NVIDIA通過與惠普的合作,將 NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟件開發工具包)集成到惠普AI Studio中,這是一個集成化的數據科學平台,從而簡化AI模型的開發。這將使用戶能跨 PC 和雲輕鬆搜索、導入和部署優化後的模型。

為PC使用場景構建AI模型之後,開發者可使用NVIDIA TensorRT 對其進行優化,以充分利用 RTX GPU 的Tensor Core。

最近,NVIDIA通過TensorRT-LLM for Windows將TensorRT擴展到基於文本的應用,TensorRT-LLM for Windows是一個用於加速LLM的開源庫。TensorRT-LLM 最新更新現已發布,將Phi-2加入不斷增長的 PC 預優化模型列表,與其他backend相比,推理速度提升5倍。

RTX 加速生成式AI為全新 PC 體驗提供動力

在CES 2024上,NVIDIA及其開發者合作夥伴發布全新生成式AI驅動的 PC 應用和服務,包括:

● NVIDIA RTX Remix,用於創建令人驚歎的經典遊戲 RTX 重製版的平台。測試版將於本月底發布,提供生成式AI工具,可將經典遊戲中的基本紋理轉化物理精準的4K高精度材質。

● NVIDIA ACE 微服務,包括生成式AI驅動的語音和動畫模型,使開發者能為遊戲添加智能、動態的虛擬數字人物。

● TensorRT 加速Stable Diffusion XL (SDXL) Turbo 和LCM,這是兩種最熱門的Stable Diffusion加速方法。與之前最快的實現相比,TensorRT 將這兩種方法的性能提升 60%。Stable Diffusion WebUI TensorRT 擴展的更新版現在也已發布,包括 SDXL、SDXL Turbo、LCM-LoRA加速以及優化的 LoRA支持。

● NVIDIA DLSS 3 支持幀生成技術(Frame Generation),可利用AI將幀率提高到原生渲染的 4 倍,將用於已發布的 14 款全新 RTX 遊戲中的十幾款遊戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon’s Dogma 2)。

● NVIDIA技術Demo "Chat with RTX"將於本月晚些時候發布,讓AI愛好者使用名為 " 檢索增強生成retrieval-augmented generation(RAG)"的熱門技術,輕鬆地將PC LLM連接到自己的數據。該Demo由 TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內容進行交互。作為開源參考項目,開發者可輕鬆地在自己的應用中實現相同的功能。

歡迎參加 NVIDIA在美國拉斯維加斯舉行的CES 2024,進一步了解生成式AI的最新突破。

關於NVIDIA
自1993年成立以來,NVIDIA (NASDAQ: NVDA) 一直是加速計算領域的先驅。NVIDIA 1999年發明的GPU驅動了PC遊戲市場的增長,並重新定義了現代計算機圖形,開啟了現代AI時代,正在推動跨市場的工業數字化。NVIDIA現在是一家全棧計算公司,其數據中心規模的解決方案正在重塑整個行業。更多信息,請訪問https://nvidianews.nvidia.com/ 。

# # #

媒體谘詢:

Jade Li

NVIDIA GeForce, Studio PR

郵箱:jadli@nvidia.com

标签:NVIDIA

推薦設計

最新文章