Følg oss her

AI

Sora 2 er på vei

Må overgå Googles Veo 3 for å vinne AI-video-kampen

Publisert

d.

Foto: OpenAI

OpenAI forbereder seg på å lansere Sora 2, den neste versjonen av selskapets AI-verktøy for tekst-til-video.

Klar for konkurranse fra Google

Sora 2 vil møte sterk konkurranse fra Googles Veo 3, som allerede har etablert seg med funksjoner Sora mangler. Blant annet støtter Veo 3 både tale og omgivelseslyd, noe OpenAIs første Sora-modell ikke gjorde. For at Sora 2 skal hevde seg, må den ikke bare forbedre bildeproduksjonen – den må også løse utfordringer knyttet til lyd og brukervennlighet.

Sora imponerte – men manglet lyd

Da OpenAI lanserte Sora tidligere i år, fikk modellen ros for imponerende videokvalitet, men videoene var helt uten lyd. Veo 3 tok det et steg videre ved å inkludere realistiske lydeffekter, stemmer og bakgrunnsstøy. Dermed kunne man ikke bare se kaffe bli helt i en kopp – man kunne også høre det. Denne typen opplevelser har satt en ny standard for AI-genererte videoer.

Lyd blir avgjørende for neste runde

OpenAI må finne en måte å integrere troverdige stemmer og synkron lyd inn i videoene. Det holder ikke bare at en munn beveger seg – lyden må komme fra riktig person, på riktig tidspunkt. Veo 3 er heller ikke perfekt, men har demonstrert imponerende lyd-bilde-koordinasjon. For at Sora 2 skal overgå dette, må både synkronisering og stemmekvalitet fungere sømløst.

Lengre videoer kan gi Sora 2 et fortrinn

Der Veo 3 foreløpig er begrenset til åtte sekunder lange klipp, kan Sora 2 allerede generere opptil 20 sekunder – og kanskje mer. Om denne lengden kombineres med stabil kvalitet og lyd, kan det bli en avgjørende faktor for innholdsskapere som trenger mer rom.

Del av en større plattform

Sora er integrert i ChatGPT, noe som gir brukere tilgang til verktøyet som en del av en helhetlig AI-løsning. Men uten lyd, fremstår den fortsatt som et uferdig alternativ. Lyden må på plass, og den må fungere like godt som i Veo 3 – ellers vil brukere trolig velge konkurrenten.

Lyd øker risikoen for misbruk

Et nytt element i Sora 2 blir hvordan OpenAI håndterer etiske utfordringer. Med realistiske stemmer og lyder øker risikoen for manipulasjon. Både Sora og Veo 3 blokkerer allerede forespørsler som involverer ekte personer, vold og opphavsrettsbeskyttet materiale, men lyd legger til en ny dimensjon av kompleksitet.

Hva med prisen?

Google har plassert Veo 3 bak et betalingsnivå på 250 dollar i måneden. OpenAI kan velge en mer inkluderende modell og tilby Sora 2 til brukere av ChatGPT Plus og Pro. En lavere terskel kan gi Sora 2 et fortrinn og gjøre det mer tilgjengelig for et bredt publikum.

Brukervennlighet og pris avgjør

Valget mellom Sora 2 og Veo 3 vil for mange handle om hva det koster og hvor enkelt det er å bruke. OpenAI må levere både kvalitet og tilgjengelighet hvis Sora 2 skal bli mer enn et glimt i konkurransen om AI-generert video. Vi får trolig svaret snart.

Annonse