Netflix komt met een eigen AI-videotool genaamd VOID, wat staat voor Video Object and Interaction Deletion. De tool is gemaakt voor het bewerken van beelden waarbij door de bewerking de interactie tussen objecten verandert. De tool is verkrijgbaar onder de Apache License 2.0-licentie.
Volgens onderzoekers van Netflix kan VOID in allerlei situaties beelden aanpassen, met grote gevolgen voor de overige objecten in de beelden. Zo noemen de onderzoekers het voorbeeld van twee auto's die tegen elkaar botsen. VOID moet de ene auto kunnen verwijderen, waarna de tweede auto gewoon blijft doorrijden.
Ook tonen de onderzoekers een rij van omvallende blokken. Door VOID de middelste blokken te laten verwijderen, zou het laatste blok in de rij niet meer moeten omvallen. In tegenstelling tot 'gewone' videomodellen bewerkt VOID niet alleen visueel de beelden, maar dus ook inhoudelijk om de beelden in de nieuwe context kloppend te maken. Overigens zijn er meer modellen die over deze functie beschikken.
Het is onduidelijk in hoeverre Netflix de tool wil gaan gebruiken voor zijn eigen content. Vooralsnog gaat het om een wetenschappelijke tool die via Hugging Face te downloaden is. Gebruikers mogen het model onder de Apache License 2.0 hergebruiken, aanpassen en onder vermelding van deze licentie verspreiden.
VOID werkt door de inputbeelden meermaals te analyseren en te bewerken om tot een realistisch resultaat te komen. Gebruikers zouden in eerste instantie een object kunnen aanklikken om het te verwijderen. Het zogenoemde vision language model verwijdert het object en maakt een berekening van hoe de andere objecten in de scène zouden moeten reageren.
De tweede pass is bedoeld om artefacten en andere visuele fouten te verwijderen. Deze tweede ronde is optioneel en vermoedelijk hangt het van de scène en de situatie af of er fouten in de eerste versie zitten.
Source: Tweakers.net