EN


“AI-инструменты для ускорения рабочих процессов блогеров и журналистов”. Часть 2: работа с изображениями и звуком

Материал подготовлен по итогам вебинара Виктора Прокушева, состоявшегося 4 сентября 2024 года. Первую часть карточек — о работе с текстами и массвивом данных  — смотрите здесь

​1.

Генерация изображений с помощью нейросетей

1. Принципы создания изображений

Для создания качественных изображений в нейросетях важно правильно формулировать запросы. Идеальный промпт должен содержать:

Объект: что именно вы хотите увидеть (например, кошка, город, человек).

Количество: сколько объектов должно быть на изображении.

Окружение: добавление контекста (например, интерьер, природа, городской пейзаж).

Стиль: уточнение, как изображение должно выглядеть (например, фотореализм, мультяшный стиль, минимализм).

Соотношение сторон: форматы 1:1, 16:9 и другие варианты помогут четче определить, как будет выглядеть изображение.

Примеры качественных промптов:

"Один кот в интерьере в стиле минимализм, дневной свет, реалистично, формат 16:9."

"Толпа людей в мегаполисе, ночное освещение, в стиле киберпанк, фотореализм".

2. Ограничения и сложности: Нейросети, как правило, плохо справляются с генерацией сложных объектов, таких как руки или редкие элементы, например, уникальные архитектурные сооружения. Например, руки могут быть искажены из-за недостатка качественных изображений в обучающих данных. Промпты, содержащие отрицания, такие как "без бороды", тоже работают некорректно — сеть может отрисовать именно бороду из-за присутствия этого слова в запросе.

3. Рекомендации по использованию стилей: Для создания картин в определённом стиле можно использовать описания, основанные на художниках или жанрах, например, "в стиле Айвазовского" для морских пейзажей. Нейросети могут имитировать стили, ориентируясь на множество примеров, что позволяет создавать уникальные изображения на основе вашего запроса.

4. Расширенные возможности генерации: Современные сервисы предлагают возможность добавлять на изображение дополнительные элементы, расширять его или редактировать его части. Пример: добавление лиц или изменение частей изображения через инструмент "inpainting", где можно указать конкретные изменения в изображении. Если вам не нравится определенная часть картинки, нейросеть может заменить её с учётом новых данных.

5. Полезные инструменты для генерации изображений: Среди популярных нейросетевых сервисов для генерации изображений выделяются такие платформы как:

MidJourney — платформа для генерации качественных изображений на основе текста.

DALL·E — мощный генератор изображений от OpenAI, который можно использовать для создания фотореалистичных изображений или художественных композиций.

 • MidJourney — платформа для генерации качественных изображений на основе текста.

  krea.ai — генерирует картинки в реальном времени на основе текстов и референтов.  

 DALL·E — мощный генератор изображений от OpenAI встроенный в ChatGPT, который можно использовать для создания фотореалистичных изображений или художественных композиций.

​​2.

Работа со звуком и голосом в нейросетях

Нейросети могут создавать не только изображения, но и музыку. Сервисы позволяют генерировать музыкальные композиции на основе заданных параметров. Например, Suno.ai предоставляет возможность создавать мелодии или целые треки в разных жанрах, от поп-музыки до классики.

Пример использования: вы можете запросить нейросеть создать фоновую музыку для видео на YouTube, указав жанр, настроение и длительность трека. Это особенно полезно для блогеров, которые хотят получить уникальные музыкальные фрагменты без нарушения авторских прав. 

11Labs — для озвучки текстов и генерации реалистичных голосов.

Suno.ai — генерация музыки и звукового контента.

Resemble.ai — еще один мощный инструмент для создания голосовых аватаров и дубляжа.

Использование нейросетей для создания изображений и звуков открывает множество возможностей для профессионалов, работающих в области визуального контента и медиа. Они позволяют ускорить рабочие процессы, оптимизировать создание контента и обеспечить высокую степень персонализации.