AI
Klarer du å skille ekte bilder fra AI? De fleste gjør det ikke
Prøv selv med denne quizen

En ny studie viser at mennesker knapt er bedre enn en mynt når det gjelder å avsløre AI-genererte bilder. Nå kan du teste deg selv.
De fleste lar seg lure av kunstig intelligens
Med noen tastetrykk kan hvem som helst i dag lage bilder som ser ekte ut, selv om de aldri har eksistert. Tidligere krevde det avansert kunnskap og lang tid å lage overbevisende falske bilder. Nå gjør AI-verktøy som Midjourney og DALL·E jobben på sekunder.
Men hvor gode er vi til å avsløre dem? Ifølge en ny studie fra Microsofts AI for Good Lab er svaret: ikke særlig gode. Undersøkelsen baserer seg på over 287 000 bildevurderinger, og deltakerne hadde i snitt en treffsikkerhet på bare 62 prosent. Det er bare litt bedre enn å gjette.
«Det er rimelig å anta at våre resultater faktisk overvurderer dagens evne til å skille AI-bilder fra virkelige,» skriver forskerne bak studien.
Ansikter lettere enn landskap
Mennesker er best på å avsløre AI-manipulerte bilder av andre mennesker, med 65 prosent treffsikkerhet. Når det gjelder landskap og natur, er det verre, her var deltakerne nede i 59 prosent riktige.
Forskerne mener forklaringen ligger i hjernens evne til å kjenne igjen ansikter. Vi er rett og slett koblet slik at vi legger ekstra merke til ansiktstrekk og øyekontakt, mens et AI-generert fjell i solnedgang glir rett under radaren.
Et interessant funn er at AI-detektorer, altså verktøy som er laget for å avsløre kunstige bilder, allerede gjør det bedre enn mennesker. Enkelte slike systemer har en treffprosent på over 95 prosent. Men forskerne understreker at også disse verktøyene kan ta feil, særlig når treningsdataene ligner sterkt på ekte bilder.
Prøv selv, tar du feil?
Vil du finne ut om du er flinkere enn gjennomsnittet? Microsofts quiz Real or Not er fortsatt tilgjengelig på nett. Den viser deg ulike bilder, og du må avgjøre om de er ekte eller generert eller redigert av AI.
Flere av bildene som brukes i quizen er laget med avanserte AI-generatorer, som blant annet GAN-modeller. Disse hadde høyest feilrate blant deltakerne, med 55 prosent bom.