Imponerende videoer generert av kunstig intelligens
Nå snakker vi kunstig intelligens! Fytti, for en kvalitet. I en verden der teknologien tar stadige skritt fremover, foregår det en spennende utvikling hos Open AI akkurat nå. De har nettopp lansert Sora, et splitter nytt verktøy innen kunstig intelligens (KI) som tar steget inn i fremtiden med stormskritt. Sora er ikke hvilken som helst KI; de kan nemlig generere videoer basert på tekstbeskrivelser, og det er ikke småtterier vi snakker om her!
Forestillingen om at en KI kan ta en enkel tekst og omskape den til en levende, bevegelig scene på skjermen, er egentlig noe rett ut av en sci-fi roman. Sora gjør dette likevel til virkelighet. De kan lage videoer på opptil et helt minutt, fylt med komplekse scener, flere karakterer, og spesifikke bevegelser, alt mens de beholder en høy visuell kvalitet og holder seg trofast til brukerens instruksjoner.
Mulighetene er mange! Fra å visualisere komplekse konsepter for utdanningsformål til å skape detaljerte forhåndsvisninger for designere, filmskapere, markedsførere og visuelle kunstnere – Sora åpner opp en helt ny verden av kreativ utfoldelse. Det er som å ha en egen filmstudio i lommen, der eneste begrensning er egen fantasi.
Men, som med all kraftig teknologi, kommer Sora med sine utfordringer og ansvarsområder. Mens de kan skape magi på skjermen, har de ennå til gode å mestre den fullstendige fysikken i vår relativt komplekse verden. For eksempel, hvis du ber dem om å vise noen som tar en bit av en kjeks, kan det hende at kjeksen etterpå ser uforandret ut. Og ja, de kan noen ganger rote til med detaljer som venstre og høyre, eller følge en spesifikk hendelse over tid.
Sikkerhetshensyn
Sikkerhet er topp prioritet, i følge OpenAI, og før Sora blir gjort tilgjengelig i OpenAIs produkter, tar de flere viktige sikkerhetsskritt. De samarbeider med eksperter som tester modellen for potensielle skadeområder – alt fra spredning av feilinformasjon til fordomsfullt innhold. De utvikler også verktøy for å avsløre villedende innhold, noe som er kritisk i dagens digitale verden. Dette betyr at ikke alle har tilgang til verktøyet riktig enda. Noe som for så vidt er helt topp, så slipper vi at misbruken tar overhånd før folk flest blir mer forberedt på hva som er i vente.
Hvordan funker det?
Sora bruker en diffusjonsmodell, som starter med en video som ser ut som statisk støy og gradvis forvandler den ved å fjerne støyen over mange steg. Dette, kombinert med en transformer-arkitektur lik den i GPT-modellene, tillater Sora å skalere overlegen ytelse.
Sora representerer et fundament for modeller som kan forstå og simulere den virkelige verden. Denne evnen er et viktig milepæl på veien mot å oppnå generell kunstig intelligens (AGI - artificial general intelligence), en fremtid hvor KI-systemer kan utføre enhver oppgave en menneskelig hjerne kan.
Sora er virkelig et glimt inn i hva fremtiden bringer, og vi snakker veldig nær fremtid. Jeg er absolutt en tilhenger av at vi bør utforske og omfavne, med alle de muligheter Sora bringer med seg, men ikke helt uten et kritisk blikk. Jeg er 100 % sikker på at vi kommer til å se tydelige misbruk og mye falsk innhold i tiden som kommer. Men, så lenge vi er klar over at utfordringene er der, og vi kan ha et kritisk blikk på hva vi konsumerer, er jeg supergira på å se hvor utviklingen tar oss.
For mer informasjon, besøk OpenAI sin nettside om Sora.