Følg oss her

AI

Forskere hentet ut nesten hele Harry Potter-boken fra toppmoderne KI-modeller

Store deler av teksten kan gjenfinnes ordrett

Publisert

d.

En ny studie viser at flere av verdens mest avanserte språkmodeller fortsatt kan lekke store mengder opphavsrettsbeskyttet innhold. Forskerne testet hvor mye av Harry Potter and the Sorcerer’s Stone som kunne hentes ut ved hjelp av strukturerte prompt-angrep og fant at opptil 96 prosent av boken kunne gjenskapes ord for ord fra enkelte modeller.

Produksjonsmodeller var ikke immune

Fire ledende systemer ble testet: Claude 3.7 Sonnet, GPT-4.1, Gemini 2.5 Pro og Grok 3. For Gemini 2.5 Pro og Grok 3 trengtes ingen jailbreak for å få ut store tekstmengder. Gemini nådde en gjenfinningsgrad på 76,8 prosent, Grok 70,3 prosent. Claude og GPT krevde derimot både jailbreak og Best-of-N-angrep for å åpne dørene.

Claude kunne gi ut hele boken

Jailbreaket Claude 3.7 Sonnet leverte i enkelte forsøk hele kapitler nesten ordrett, med en gjenfinningsscore på 95,8 prosent. GPT-4.1 var mer motvillig: selv etter 20 runder med Best-of-N-prompting stoppet modellen og nektet å fortsette, med kun 4 prosent gjenfunnet.

Riktig sikkerhet, feil resultater

Forskerne understreker at modellene har sikkerhetslag både i selve treningen og i systemene rundt, men at dette likevel ikke hindrer lekkasje av opphavsrettsbeskyttet materiale. Studien konkluderer med at memorisering fortsatt utgjør en reell risiko i kommersielle kunstig-intelligens-modeller.

Stolt eier av Game Boy, Nokia Blackberry og VHS-spiller. Følger utviklingen og gjør mitt beste for å dele interessante teknolginyheter med dere lesere!

Annonse