Følg oss her

AI

Nvidia Vera i full produksjon: OpenAI, Anthropic og SpaceX først i køen

Nvidias nye prosessor for AI-agenter er i full produksjon, og de største AI-laboratoriene står først i leveringskøen.

Publisert

d.

Nvidia Vera i full produksjon: OpenAI, Anthropic og SpaceX først i køen

De første systemene ble håndlevert i mai til Anthropic, OpenAI og SpaceX, mens bredere tilgjengelighet hos cloud-leverandører først ventes til høsten. Det skaper en flaskehals som kan forplante seg gjennom hele det europeiske AI-markedet, også i Norge.

Vera er den første CPU-en Nvidia har bygget spesifikt for autonome AI-agenter. Brikken har 88 egendesignede Olympus-kjerner og opptil 1,2 terabyte i sekundet i minnebåndbredde, og selskapet oppgir at den kan utføre agent-arbeidsbelastninger inntil 1,8 ganger raskere enn ledende x86-prosessorer.

Hvorfor Vera betyr noe nå

Tradisjonelle datasenter-CPU-er er bygget for generelle arbeidsbelastninger. AI-agenter, som ikke bare svarer på spørsmål men også utfører handlinger, krever en annen profil med mye orkestrering, verktøykall og parallell håndtering av lange kontekster.

Det er der Vera skal komme inn. Konsernsjef Jensen Huang sier at "AI-agenter blir de største brukerne av datakraft", og at Vera er "den første CPU-en designet for den fremtiden, bygget for å kjøre agentbasert AI i hyperskala med ekstraordinær ytelse, effektivitet og programmerbarhet".

Brikken erstatter Nvidias forrige Grace-prosessor. Mens Grace brukte ferdige Arm Neoverse-kjerner, har Nvidia denne gangen designet kjernene selv. Antall tråder er 176 via Spatial Multithreading, og minnekapasiteten kan strekkes opp mot 1,5 terabyte LPDDR5X.

Håndleveranse til AI-elitens hovedkvarterer

Ian Buck, Nvidias visepresident for hyperskala og høyytelses databehandling, leverte de første systemene personlig. Anthropic, OpenAI og SpaceX fikk besøk fredag 17. mai, mens Oracle Cloud Infrastructure i Santa Clara mottok sine systemer mandag 20. mai.

"Agentbasert AI skaper et nytt CPU-øyeblikk i AI-fabrikken", sa Buck i forbindelse med leveransene. "Etter hvert som modellene går fra å svare til å handle, er Vera bygget for å holde det arbeidet i gang i stor skala."

James Bradbury, som leder datakraft hos Anthropic, sier at selskapet er glade for å se "Vera bli en lovende del av økosystemet for agent-arbeidsbelastninger".

Hva køen betyr for Norge

Køen kommer til å bli lang. Oracle Cloud Infrastructure har varslet at de planlegger å ta i bruk "hundretusenvis" av Vera-CPU-er fra 2026, og systembyggere som Dell, HPE, Lenovo og Supermicro skal også produsere serverkonfigurasjoner basert på brikken.

Det berører Norge direkte. Stargate Norway, det planlagte AI-anlegget i Kvandal utenfor Narvik, skal etter avtalen mellom Nscale, Aker og OpenAI levere 100.000 Nvidia-GPU-er innen utgangen av 2026. Anleggets første fase har en kapasitet på 20 megawatt, med ambisjoner om utbygging videre opp mot 520 megawatt (230 megawatt pluss 290 megawatt i en ekspansjonsfase).

Når Vera-CPU-ene leveres til de største amerikanske hyperskala-kundene først, skyves selv massive europeiske prosjekter lenger ned i køen. Det kan bety forsinkelser i den AI-kapasiteten Norge skal kunne forsyne det europeiske markedet med, og samtidig melder kraftbehovet seg parallelt. Statnett har allerede stanset nye krafttildelinger i Nord-Norge av hensyn til forsyningssikkerheten.

For norske bedrifter som leier AI-kraft, betyr det at prisene på beregningstunge tjenester sannsynligvis ikke faller med det første. Det er først når Vera-volumene kommer ut til de bredere cloud-leverandørene senere i år at tilbudssiden begynner å løsne.

Annonse