Novi Nvidia B200 čip zauvijek će promijeniti umjetnu inteligenciju

Nvidia, pionir u tehnologijama umjetne inteligencije, nedavno je potvrdila svoju poziciju tržišnog lidera uvođenjem inovacija koje mijenjaju igru ​​i koje bi mogle dodatno proširiti njezinu konkurentsku prednost. S H100 AI čipom, prestigavši ​​divove poput Alphabeta i Amazona. Međutim, njegov najnoviji potez u industriji mogao bi ostaviti konkurente još više iza sebe: uvođenje novog Blackwell B200 GPU-a i GB200 “superčipa”.

Tijekom livestreama GPU Technology Conference događaja, Nvidijin CEO Jensen Huang predstavio je novi B200 GPU, uz sada poznati H100, otkrivajući računalnu snagu do 20 petaflopa FP4 zahvaljujući svojih 208 milijardi tranzistora. Još je impresivniji GB200, koji integrira dva B200 GPU-a s jednim Grace procesorom, pružajući do 30 puta veću izvedbu za zaključivanje velikog jezičnog modela (LLM), uz značajna smanjenja troškova i potrošnje energije do 95% u usporedbi s H100.

Uvježbavanje modela s 1,8 trilijuna parametara, koji je prethodno zahtijevao 8000 Hopper GPU-a i 15 megavata snage, sada se može postići sa samo 2000 Blackwell GPU-a, koji troše samo četiri megavata. U usporedbi s LLM GPT-3 benchmarkom sa 175 milijardi parametara, GB200 pokazao je približno sedam puta veću izvedbu od H100, učetverostručujući brzinu treninga. Jedno od Nvidijinih glavnih poboljšanja je druga generacija Transformer Enginea, koji udvostručuje računalnu snagu, propusnost i veličinu modela, koristeći samo četiri bita po neuronu umjesto osam. Još jedna značajna inovacija pojavljuje se pri povezivanju velikog broja ovih GPU-a: NVLink prekidač sljedeće generacije koji omogućuje međusobnu komunikaciju 576 GPU-a, s dvosmjernom propusnošću od 1,8 terabajta u sekundi.

Arhitektura Blackwell također je značajna po dodatku FP4 i FP6 formata i mogućnosti skaliranja do desetaka tisuća GB200 superčipova, povezanih putem 800Gbps mreža s novom Quantum-X800 InfiniBand ili Spectrum-X800 ethernet tehnologijom. Nvidia tu ne staje i također predstavlja DGX Superpod za DGX GB200, koji kombinira osam sustava u jednom za ukupno 288 CPU-a, 576 GPU-a, 240TB memorije i 11,5 exaflopsa FP4 računalne snage, obećavajući revoluciju u polju AI obuka u velikom broju. Oblačni divovi poput Amazona, Googlea, Microsofta i Oraclea već planiraju ponuditi NVL72 police u svojim ponudama usluga u oblaku, označavajući početak nove ere u računalnim snagama dostupnim za umjetnu inteligenciju.

Rating
( No ratings yet )
Loading...
VRT