AI
ChatGPT bytter motor: GPT-5.5 Instant slår forgjengeren med stor margin
OpenAI har gjort GPT-5.5 Instant til ny standardmodell i ChatGPT, og spranget på matematikk og pålitelighet er større enn versjonsnummeret antyder.
Den nye modellen ble rullet ut tirsdag 5. mai 2026 og erstatter GPT-5.3 Instant som alle ChatGPT-brukere møter når de skriver inn et spørsmål.
Endringen merkes raskest på oppgaver som krever resonnering. På matematikktesten AIME 2025, der modellene løser oppgaver fra den amerikanske olympiadekvalifiseringen, hopper resultatet fra 65,4 til 81,2 poeng. På MMMU-Pro, en test for multimodal resonnering der modellen må kombinere tekst og bilder, går scoren fra 69,2 til 76.
Færre påfunn i sensitive spørsmål
Den største praktiske forskjellen ligger trolig et annet sted. På spørsmål om medisin, jus og finans produserer GPT-5.5 Instant ifølge OpenAIs egne målinger 52,5 prosent færre hallusinerte påstander enn forgjengeren. Hallusinering er begrepet for at en språkmodell finner på fakta som høres troverdige ut, men som ikke stemmer.
I samtaler som brukerne har flagget for faktafeil, faller andelen unøyaktige påstander med 37,3 prosent. Modellen er også laget for å være mer konsis, og bruker omtrent 30 prosent færre ord enn forgjengeren på en typisk oppgave.
Husker tidligere samtaler
Sammen med modellbyttet får ChatGPT en ny form for kontekstbevissthet. Modellen kan trekke inn tidligere samtaler, opplastede filer og innhold fra Gmail når den svarer, slik at den slipper å starte fra null hver gang. Funksjonen kommer først til Plus- og Pro-abonnenter på nett, mens gratisbrukere og bedriftskontoer får tilgang i ukene som kommer.
Selve modellen er imidlertid tilgjengelig for alle innloggede brukere uten ekstra kostnad. Det betyr at norske skoleelever, studenter og frilansere som bruker ChatGPT gratis nå har en betydelig kraftigere motor i bunnen.
Tett kappløp mot Claude og Gemini
Hvordan plasserer den nye modellen seg mot konkurrentene? På Terminal-Bench 2.0, en test for autonome agenter som jobber i et terminalvindu, scorer GPT-5.5 82,7 prosent mot 69,4 prosent for Anthropics Claude Opus 4.7. Men Claude leder på SWE-bench Pro, en målestokk for komplekse kodeoppgaver, med 64,3 prosent mot 58,6.
På vitenskapelig resonnering ligger Google Gemini 3.1 Pro fortsatt i tet. Forskjellen mellom de tre frontmodellene er liten på de fleste målinger, og bildet er at hver modell har sine spesialiteter snarere enn at én dominerer på tvers av oppgaver.
For utviklere blir GPT-5.5 tilgjengelig via OpenAIs programmeringsgrensesnitt under navnet «chat-latest». Den gamle GPT-5.3-versjonen forblir tilgjengelig for betalende API-kunder i tre måneder, slik at programmer som er bygget mot den eldre modellen får tid til å migrere.

