Видео недоступно для предпросмотра
Смотреть в Telegram
На сегодняшний день качество генеративного видео, созданного при помощи нейросетей в некоторых экспериментальных моделях уже очень сложно отличить от реальной видеосъемки. Эти нейросети перед с процессом генерации патчей видеоряда преобразуют текстовый запрос (промпт) пользователя в информацию об окружающем мире посредством больших языковых моделей (LLM), по-сути воспроизводя сначала у себя в памяти модель окружающего мира (сцены). Именно такой подход позволил получить наиболее впечатляющие результаты преобразования текста в видео. Лидером в этой технологии сегодня безусловно является OpenAI с моделью SORA: