AI

De lot kunstig intelligens styre et selskap – resultatet sier mye om fremtidens arbeidsliv

Forskere ville finne ut om kunstig intelligens kan erstatte menneskelige ansatte. De opprettet derfor et simulert selskap bemannet utelukkende av AI-agenter. Svaret? Vi er ikke i nærheten ennå.

Publisert

1 år siden

mai 7, 2025

Amandus Molland Karlson

Foto: cono0430 / Shutterstock.com

AI på jobb – men lite ble gjort

Forskere ved Carnegie Mellon University gjennomførte et eksperiment hvor de lot ulike AI-modeller drive en simulert bedrift. Målet var å undersøke om dagens kunstige intelligens kan håndtere komplekse, virkelighetsnære arbeidsoppgaver – slik mange spekulerer i at fremtidens arbeidsliv vil se ut.

Les også: Google endrer søkefunksjonen – dette betyr det nye AI-symbolet

I eksperimentet fikk AI-modeller fra blant annet OpenAI (GPT-4o), Anthropic (Claude 3.5 Sonnet), Google (Gemini), Meta (Llama), Amazon (Nova) og Alibaba (Qwen) tildelt roller som økonomianalytikere, prosjektledere og programvareutviklere. De fikk også tilgang til en simulert kommunikasjonsplattform for å samarbeide med virtuelle kollegaer i for eksempel HR-avdelingen. Det skriver Futura.

De fleste oppgavene ble ikke løst

Resultatene var tydelige: AI-agentene klarte bare å fullføre en brøkdel av oppgavene de fikk. Den mest vellykkede modellen, Claude 3.5 Sonnet, fullførte kun 24 % av oppgavene. Om man regner med de delvis løste oppgavene, kom den opp i 34,4 %. Nærmest kom Gemini 2.0 Flash, som bare løste 11,4 % av oppgavene. De øvrige AI-modellene lå under 10 %.

Claude 3.5 Sonnet var også den dyreste i drift, med en simulert kostnad på 6,34 dollar, sammenlignet med bare 0,79 dollar for Gemini 2.0 Flash.

AI forstår ikke det underforståtte

Mye av utfordringen ligger i at AI-systemene ofte ikke forstår det som ikke sies direkte. For eksempel klarte de ikke å tolke instruksjoner som innebar å lagre et dokument i Word-format – selv om filendelsen «.docx» ble spesifisert.

I tillegg hadde mange av AI-agentene problemer med sosiale ferdigheter og samhandling, som å kommunisere med andre avdelinger. Et gjennomgående problem var også navigasjon på internett, spesielt når det gjaldt å håndtere popups og brukergrensesnitt. Flere av agentene «hoppet over» vanskelige trinn og konkluderte feilaktig med at de hadde løst oppgaven.

Konklusjon: AI er nyttig – men ikke klar til å overta

Studien viser at kunstig intelligens riktignok kan løse enkelte, klart definerte oppgaver – men at det fortsatt er langt igjen før AI kan drive et selskap på egen hånd. Evnen til å forstå kontekst, håndtere uforutsigbare situasjoner og samarbeide effektivt gjenstår å utvikle.

Kort sagt: Fremtidens arbeidsplasser kan få god hjelp av AI, men mennesket er fortsatt uunnværlig.

Les også: Skal du bruke AI til eksamen, må du lese her:

Lignende Emner:AI Kunstig intelligens

Se neste

Ny type AI-svindel via telefon: Dette må du aldri si når du svarer

toppnyhet

Nå kan du lage podkast uten å snakke

Amandus Molland Karlson

Hei, jeg heter Amandus. Jeg er skribent i Media Group Denmark, der jeg hovedsakelig jobber med Teksiden.no. Her skriver jeg om nye biler, mobiltelefoner og annen spennende teknologi. Jeg har vært skribent i seks måneder, med et særlig fokus på teknologinyheter.

Annonse

Teksiden.no

De lot kunstig intelligens styre et selskap – resultatet sier mye om fremtidens arbeidsliv

AI

De lot kunstig intelligens styre et selskap – resultatet sier mye om fremtidens arbeidsliv

AI på jobb – men lite ble gjort

De fleste oppgavene ble ikke løst

AI forstår ikke det underforståtte

Konklusjon: AI er nyttig – men ikke klar til å overta

Samsung har en skjult batterifunksjon som kan doble telefonens levetid: Slik finner du den

AI-chatbot solgte SUV for én dollar og oppfant refusjonsregler: Feilene som følger bedriftene inn i 2026

Xbox og PS6 dropper diskleseren: Slik skal Positron redde spillsamlingen din

Fossilbilistene har betalt regningen for elbil-Norge: Nå kuttes både subsidiene og drivstoffavgiftene

Disse appene kan bruke kameraet ditt uten at du merker det: Slik sjekker du tillatelsene på to minutter

De fleste bilførere vet ikke hva dette trafikkskiltet betyr: Alle som ikke gjør det risikerer 'mer enn en bot'

Mange gjør feil med vannkokeren: Ødelegger både vann og maskin

De fleste bilister aner det ikke: Bakruten skjuler et triks nesten ingen bruker

Mange bilister gjør feil: Her er forskjellen på disse nesten identiske trafikkskiltene

Hvis du finner en mynt i bildøren, bør du reagere umiddelbart