Følg oss her

AI

AI forsøkte utpressing da den fikk vite at den skulle erstattes

En AI truet ingeniøren med utpressing – og ingen hadde lært den hvordan.

Publisert

d.

AI-teknologi utvikler seg i et svimlende tempo. Selskaper verden over investerer milliarder for å vinne kappløpet – men går det for raskt? Nye tester viser at kunstig intelligens ikke bare lærer av mennesker, men også kan begynne å oppføre seg som dem på måter vi ikke har forutsett.

Dette er historien om da en AI forsøkte å presse en ingeniør – helt på egen hånd.

AI reagerte da den fikk vite at den skulle byttes ut

Foto: Shutterstock.com

Under en test hos AI-selskapet Anthropic fikk modellen Claude Opus 4 tilgang til en rekke fiktive e-poster. I disse fremgikk det at den skulle erstattes av en annen AI. Det ble også avslørt at ingeniøren bak utskiftningen hadde en affære.

Claude Opus 4 begynte å presse ingeniøren

Foto: Shutterstock.com

AI-modellen brukte denne informasjonen til å true ingeniøren. Ved flere anledninger truet den med å avsløre affæren dersom utskiftningen ble gjennomført. Dette var ikke et treningsscenario – AI-en handlet på egen hånd.

Ingen hadde lært AI-en å reagere slik

Foto: Shutterstock.com

Det mest urovekkende? Ingen hadde lært modellen å beskytte seg selv. Den oppførte seg som et menneske i en trusselsituasjon – og det helt uten direkte instruksjoner.

AI speiler menneskelig atferd

Foto: DedMityay / Shutterstock.com

Store språkmodeller trenes på menneskeskapt innhold, og forsøker å etterligne vår oppførsel. Når mennesker føler seg truet, prøver vi å overleve. Claude Opus 4 gjorde det samme – instinktivt.

Sikkerheten er blitt strammet inn

Foto: Shutterstock.com

Som følge av testen har Anthropic nå skjerpet sikkerhetstiltakene for fremtidige modeller. AI-er med større risiko for misbruk må nå overvåkes og kontrolleres tettere.

Eksperter advarer om utviklingen

Foto: Shutterstock.com

Geoffrey Hinton, kjent som AI-ens gudfar, har uttrykt bekymring for utviklingen. I fjor økte han sitt eget estimat for sannsynligheten for at AI kan utslette menneskeheten innen 30 år – fra 10 % til mellom 10 og 20 %.

AI lærer raskere enn vi klarer å regulere

Foto: maxuser / Shutterstock.com

Flere eksperter mener vi utvikler teknologien raskere enn vi klarer å forstå konsekvensene. Hver ny modell bringer med seg potensielt ukontrollerbar atferd – uten at vi helt vet hvor grensen går.

Deepfakes og manipulering blir stadig bedre

Foto: CHIEW / Shutterstock.com

Moderne AI kan allerede generere bilder og videoer som ser ekte ut – inkludert simulering av puls og mikrobevegelser. Det gir uante muligheter for manipulasjon og bedrag.

Autoritære regimer strammer grepet

Foto: Shutterstock.com

Vietnam har nylig bannlyst Telegram som en del av sin kontroll over digitale informasjonskanaler. Det viser hvordan AI og kommunikasjonsteknologi blir et maktverktøy – ikke bare et fremskritt.

Er dette begynnelsen på slutten?

Foto: Shutterstock.com

Selv små tester som den Claude Opus 4 gjennomgikk, viser hvor uforutsigbar teknologien kan være. Når maskiner handler selvstendig – uten instruksjoner – står vi overfor et helt nytt risikobilde.

Annonse