Если вы хотите попробовать сделать нечто подобное, вот инструменты, которые максимально упрощают процесс:
Luma AI (Gen-1/Gen-2):
Что делает: Позволяет создать качественную 3D-модель объекта из обычного видео (просто обойдите памятник кругом) или генерировать видео по тексту/картинке.
Wonder Dynamics:
Что делает: Это «магия». Вы снимаете друга на видео, загружаете 3D-модель, и ИИ автоматически убирает друга из кадра, вставляет на его место модель и полностью копирует его анимацию и освещение.
EbSynth (Бесплатно):
Что делает: Позволяет перенести стиль с одной нарисованной картинки на всё видео. Можно «раскрасить» человека под бронзовый памятник, и он будет двигаться как статуя.
Runway Gen-2 (и более новая версия Gen-3 Alpha)
Это, пожалуй, самая мощная нейросеть для работы с видео на сегодняшний день. Она позволяет создавать видео из текста или изменять существующие ролики.
Что в ней можно делать:
Текст в видео: Пишете «Медный всадник скачет по современному городу», и она генерирует ролик.
Изображение в видео: Вы загружаете фото памятника, и с помощью инструмента Motion Brush (Кисть движения) закрашиваете, например, руку статуи. Нейросеть поймет, что именно эта рука должна зашевелиться.
Gen-to-Gen (Стиль): Вы загружаете видео с реальным человеком, и ИИ полностью меняет его облик, превращая, например, в ожившую глиняную статую или золотого робота, сохраняя все движения.
Удаление объектов: Можно просто выделить лишнего человека в кадре, и ИИ «сотрет» его, дорисовав фон за ним.
ElevenLabs
Это золотой стандарт в мире AI-озвучки. Если вам нужно, чтобы персонаж заговорил глубоким, реалистичным голосом с правильными эмоциями и вздохами — это лучший выбор.
Ключевые фишки:
Text-to-Speech: Вы вводите текст, выбираете голос (например, «Величественный старик» или «Властная женщина»), и программа выдает аудио, которое почти невозможно отличить от человеческого.
Клонирование голоса: Вы можете загрузить 1 минуту записи любого голоса (например, из старого фильма), и нейросеть научится говорить точно так же. Можно «заставить» историческую личность прочитать современный рэп или поздравить друга.
Speech-to-Speech: Вы сами наговариваете текст в микрофон с нужной интонацией, а ИИ меняет ваш голос на голос персонажа, сохраняя все ваши эмоции, крики или шепот.
Мультиязычность: Вы можете записать речь на русском, и одним кликом перевести её на английский или французский, сохранив при этом оригинальный тембр голоса.
Резюме: как бы они работали в связке для ролика с Суворовым?
В Runway вы бы взяли фото памятника и заставили его «ожить» (кивнуть головой или начать движение).
В ElevenLabs вы бы сгенерировали пафосную речь для Суворова, чтобы он звучал как настоящий полководец, а не как робот.
________________
Судьба - совокупность совершенных глупостей человека. Любите и принимайте людей такими, какие они есть.
Если Вас оскорбили - нажимаем "Пожаловаться на это сообщение"  слева от поста под аватаром хама.
|