Sora, ontwikkeld door OpenAI, is een geavanceerd model dat in staat is om op basis van een tekstuele prompt of een stilstaand beeld een video van maximaal een minuut te genereren. De gegenereerde video's hebben een videokwaliteit van 1080p en kunnen meerdere karakters en gedetailleerde achtergronden bevatten. Het model heeft een diep begrip van taal en kan daardoor nauwkeurig de aanwijzingen van gebruikers interpreteren en boeiende karakters creëren die levendige emoties kunnen uitdrukken. Bovendien kan Sora meerdere shots samenvoegen in één enkele gegenereerde video met behoud van de nauwkeurigheid van de karakters en visuele stijl.
Hoewel Sora indrukwekkende mogelijkheden heeft, heeft het model nog steeds enkele beperkingen. Zo kan het moeite hebben met het nauwkeurig simuleren van de fysica van complexe scènes en begrijpt het misschien niet altijd oorzakelijke relaties goed. Een voorbeeld hiervan is dat wanneer een persoon een hap neemt uit een koek, het mogelijk is dat er geen bijtafdruk op de koek verschijnt.
OpenAI werkt echter continu aan het verbeteren van het model en het wegwerken van deze beperkingen. Sora bouwt voort op het onderzoek van OpenAI's DALL-E, een model dat afbeeldingen kan genereren op basis van prompts.
Op dit moment is Sora nog beperkt beschikbaar. Red teams worden uitgenodigd om het model te testen en mogelijke problemen op te sporen. Daarnaast krijgt een selecte groep visuele professionals, designers en filmmakers toegang tot Sora, zodat zij feedback kunnen geven om het model verder te verbeteren en geschikt te maken voor creatieve doeleinden.