英偉達發布新GPU Rubin CPX,專為長上下文AI推理設計
關鍵詞: 英偉達Rubin CPX AI推理運算 Vera Rubin NVL144 CPX 長上下文推理 視頻生成
英偉達周二(9月9日)宣布,推出專為長上下文推理和視頻生成應用設計的專用GPU Rubin CPX,用于翻倍提升當前AI推理運算的工作效率,特別是編程、視頻生成等需要超長上下文窗口的應用。
英偉達創始人兼CEO黃仁勛說:“正如RTX徹底改變了圖形和物理AI一樣,Rubin CPX是首款專為海量上下文AI打造的CUDA GPU,這種AI模型可以同時處理數百萬個知識token的推理。”
Rubin是英偉達將在明年發售的下一代頂級算力芯片,基于Rubin的CPX預計也要到2026年底出貨。下一代英偉達旗艦AI服務器的全稱叫做NVIDIA Vera Rubin NVL144 CPX——集成36個Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。
Rubin CPX配備128GB GDDR7內存,NVFP4精度下AI算力可達30PFLOPS,非常適合運行長上下文處理(超過100萬個token)和視頻生成任務。
Vera Rubin NVL144 CPX平臺可在單機架集成144張Rubin CPX GPU、144張Rubin GPU、36張Vera CPU,提供8EFLOPS的AI性能(NVFP4精度)和100TB的快速內存,內存帶寬達到1.7PB/s。
其AI性能是英偉達Vera Rubin NVL144平臺的2倍多,是基于Blackwell Ultra的GB300 NVL72系統的7.5倍,相比GB300 NVL72系統還能提供3倍更快的注意力機制。
