Как рисуют нейросети: пробуем сервисы
2022-08-24
Уже несколько лет говорят: «Еще чуть-чуть — и нейросети окончательно заменят художников».
За это время генеративные картины прошли путь от причудливых абстракций до качественных изображений, которые создаются за считаные минуты. Главным прорывом стала модель DALL-E от OpenAI: разработчики научили алгоритм довольно точно «рисовать» по текстовому описанию. Второе поколение нейросети совсем недавно перешло в стадию бета-теста: в ближайшее время доступ к технологии получит миллион человек.
Но и без DALL-E достаточно примечательных сервисов, которые можно протестировать уже сейчас. Мы проверили их и попытались дать всем программам одну и ту же задачу: нарисовать Бэтмена в Москве. Исключение — сервисы, у которых нет возможности сгенерировать супергероя.
С ПОМОЩЬЮ ТЕКСТА
DALL-E Mini
Где попробовать: сайты Dall-e Mini и Craiyon, телеграм-бот
DALL-E Mini, несмотря на название, напрямую не связана с DALL-E от OpenAI. Американский разработчик Борис Дайма вдохновился нейросетью и попытался воспроизвести ее результаты с помощью моделей с открытым кодом. Первую версию он выпустил еще в июле 2021, но настоящая слава к нему пришла год спустя.
В мини-версии DALL-E привлекает простота: не нужно авторизовываться и разбираться в настройках, нет требований к вычислительным мощностям. Достаточно сформулировать запрос на английском языке и нажать на кнопку.
Нейросеть генерирует по описанию сразу девять картинок — так можно увидеть разные попытки изобразить задумку. Это идеальный формат, чтобы визуализировать любую безумную идею. Именно поэтому сервис настолько полюбился в соцсетях и стал очень популярным.
Коллаж из девяти миниатюр еще и скрывает недостатки нейросети. DALL-E Mini проигрывает в качестве многим аналогам: лица получаются смазанными, видны артефакты — искажения после обработки нейросетью. Но все это перекрывается тем, что алгоритм хорошо подстраивается под запрос, а результаты часто получаются очень смешными.
С ПОМОЩЬЮ ТЕКСТА
ruDALL-E
Где попробовать: сайт, приложение «Салют», discord-канал, телеграм-бот
ruDALL-E — сервис от разработчиков «Сбера», поэтому он умеет генерировать картинки по описанию на русском языке. Есть две версии ruDALL-E: первое поколение под названием «Малевич» и второе, более продвинутое — «Кандинский».
«Малевич» генерирует одно изображение за раз. У итоговой картинки высокое разрешение, а вот с точностью генерации есть проблемы: нейросеть не всегда понимает, что от нее хотят. Например, во время тестового запроса ruDALL-E то «терял» Бэтмена, то никак не изображал хоть что-то похожее на Москву. Поэтому лучше отправлять запрос несколько раз подряд, чтобы добиться приемлемого результата.
У «Малевича» есть официальный бот в «Телеграме». Там не нужно вводить капчу для каждого запроса, а за то же время генерируются сразу три картинки. Но есть и свой минус — водяной знак по центру каждого изображения.
Результаты «Кандинского» на порядок лучше: нейросеть довольно узнаваемо генерирует сразу девять картинок и у любой можно увеличить разрешение. Нейросеть интегрировали в экосистему «Сбера», так что воспользоваться сервисом можно на умных устройствах компании или в мобильном приложении «Салют» — вход осуществляется через Sber ID. Альтернатива — вступить в официальное discord-сообщество и генерировать картинки там.
С ПОМОЩЬЮ ТЕКСТА
Midjourney
Где попробовать: discord-сервер проекта
Midjourney совсем недавно перешла в стадию бета-теста: любой может присоединиться к каналу разработчиков в Discord и протестировать алгоритм прямо в чате. Для этого достаточно ознакомиться с правилами сообщества, затем ввести команду /imagen, после чего сформулировать запрос на английском языке. Сервис сгенерирует четыре варианта: у каждого можно увеличить разрешение или попросить нейросеть переделать в том же духе.
Картинки получаются достаточно качественными и узнаваемыми, хоть и не без промахов. Бесконечно генерировать изображения не выйдет: есть лимит на каждого человека. Когда он будет исчерпан, можно остаться в сообществе и смотреть, что генерируют другие пользователи.
С ПОМОЩЬЮ ТЕКСТА
Dream by WOMBO
Где попробовать: сайт, приложения для iOS и Android
Это популярный сервис для создания вертикальных обложек. Арты делаются легко: нужно сформулировать текстовый запрос, выбрать стилистику, а при желании — еще и прикрепить картинку-референс. Веб версия-бесплатная, а вот в приложениях стили доступны только по подписке.
Результат выглядит очень абстрактно, но почти всегда красиво. Особо примечательный арт можно купить в высоком качестве в виде реального постера. В «Тиктоке» был флешмоб, где пытались угадать сгенерированные в Dream обложки фильмов и альбомов.
С ПОМОЩЬЮ ТЕКСТА
Starryai
Где попробовать: сайт, приложения для iOS и Android
Нейросеть создает арты на основе текстового описания, но с дополнениями. Можно сразу задать стилистику изображения, прикрепить картинку-референс, добавить дополнительные параметры. Прогресс виден практически в прямом эфире: алгоритм на глазах превращает размытое нечто в полноценный арт.
Программа устроена как тематическая соцсеть: там доступны и чужие работы, чтобы вдохновиться или подсмотреть наиболее эффективные запросы. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать, выполняя разные задания: например, посмотреть рекламу или поделиться работой в соцсетях.
Результаты получаются разные, от абстракций в духе ранних ИИ-моделей до качественных работ, почти неотличимых от настоящих картин. Готовое изображение можно пропустить через нейросеть еще раз или увеличить разрешение — за дополнительные кредиты.
С ПОМОЩЬЮ ТЕКСТА
Pixray
Где попробовать: сайт
Это не столько самостоятельный сервис, сколько адаптация сразу нескольких моделей с открытым исходным кодом. Работает только в веб-версии, зато бесплатно и без ограничений или встроенных покупок.
Для генерации достаточно ввести текстовое описание на английском языке и выбрать одну из моделей для рендера: среди вариантов есть как популярные VQGAN и CLIPDraw, так и менее востребованные алгоритмы. Третьим пунктом можно ввести дополнительные настройки по приложенной инструкции либо оставить поле пустым.
Результаты зависят от модели и настроек. Обычно работы далеки от реализма, но, как правило, передают запрос пользователя. Генерируются изображения от нескольких минут, а в процессе можно увидеть промежуточные варианты итоговой версии.
ПО НАБРОСКАМ
Pix2pix
Где попробовать: Где попробовать: демо-сайт разработчика
Pix2pix — это не конкретный сервис, а название модели в основе множества небольших сайтов. Она может имитировать стиль оригинального рисунка, дорисовывать кадры или превращать рисунки в реалистичные изображения. С помощью pix2pix, например, продолжали ролики и преобразовывали старые карты в снимки со спутников.
Исследователи представили модель еще в 2017 году. Тогда же разработчик OpenAI Кристофер Хессе создал демосайт, чтобы любой желающий мог протестировать Pix2pix. В четырех демонстрационных модулях нейросеть рисует объект по наброскам пользователя: кота, фасад здания, сумку или обувь. Алгоритм буквально на лету пытается понять задумку и подстраивается под каждый новый штрих.
Результат сложно назвать реалистичным, зато можно нарисовать кота в форме хлеба или здание, которое полностью состоит из дверей. Пространство для фантазии гораздо шире, а результат нагляднее, чем при текстовом запросе.
По нынешним меркам это устаревшая нейросеть: демоверсиям уже несколько лет, а технологии с тех пор сделали огромный шаг вперед. Но можно попробовать и другие сервисы на основе Pix2pix: разработчики-энтузиасты сделали сайты, где можно нарисовать портрет человека или Пикачу.
ПО НАБРОСКАМ
GauGAN
Где попробовать: программа Canvas для Windows, демосайт
GauGAN — нейросеть, разработкой которой занимается компания NVIDIA. Главная фишка — умение превращать даже не очень умелые наброски пользователей в фотореалистичные пейзажи. Во второй версии ИИ научился делать то же самое на основе текстового описания.
У GauGAN есть набор «материалов»: можно прямо указать нейросети, где должны быть облака, вода, солнце, деревья или здания. Смена инструментов может за пару штрихов полностью изменить пейзаж — но он останется таким же реалистичным. Модель уже встроена в сервис NVIDIA под названием Canvas: бета-версию программы можно бесплатно скачать с сайта разработчика. Но системные требования у нее солидные: Windows 10 или 11, видеокарта с поддержкой RTX, жесткий диск SSD.
Есть вариант проще: демосайт с ограниченными функциями. Сервис генерирует пейзаж на основе рисунка, заранее загруженного изображения или текстового описания — либо всех инструментов одновременно.
Из-за большого количества настроек с ходу разобраться на сайте может быть трудно. При первом запуске активируется инструкция, а на «Ютубе» есть обучающие ролики. Рекомендуем сначала ознакомиться с ними.
БЕЗ УЧАСТИЯ ЧЕЛОВЕКА
This X Does Not Exist
Где попробовать: погенерировать людей, животных, кроссовки, резюме и идеи для стартапов
Если у вас нет конкретного запроса или времени, можно зайти на один из сайтов с общей концепцией «Этого X не существует». На таких страницах вообще не придется ничего настраивать, вводить и даже кликать — после каждого обновления выводится уникальное сгенерированное нейросетью изображение. Причем довольно качественное: порой нужно долго всматриваться, чтобы заметить артефакты.
Материалы взяты с сайта https://journal.tinkoff.ru/list/neuroart/
Нейронные сети
Возраст от 14 лет. Требуются знания программирования.
Искусственные Нейронные Сети (ИНС) - одна из самых актуальных творческих и интересных областей знаний. Нейронные сети помогают при решении задач, с которыми невозможно справиться путем написания привычных программ. Это развивающаяся область искусственного интеллекта, набирающая всё больше популярности.
Курс предназначен для студентов 14-18 лет, знающих любой язык программирования, принципы алгоритмизации, способы написания и отладки программ.
В курсе используется язык программирования Python, а так же рассматриваются примеры программ на других языках (C++, PHP), призванные показать независимость области от языка программирования.
Каждая тема подкреплена наглядными иллюстрациями, примерами и практическими заданиями. Информация подается доступным и понятным образом.
Курс не перегружен формулами и не требует глубокого знания математики.
Курс состоит из следующих частей:
- Синтаксис языка Python.
- Введение в ИНС.
- Математические основы ИНС.
- Программное обеспечение для построения ИНС.
- Архитектура ИНС.
- Виды ИНС для решения разных типов задач.
Результаты прохождения курса:
После прохождения курса студенты владеют навыками написания программ на языке Python, знают области применения ИНС, биологические и математические основы ИНС, на простых и понятных примерах понимают сложные инструменты высшей математики (производные, интегралы, матрицы и.т.д.), знают принципы построения и работы ИНС, владеют навыками написания собственных нейронных сетей для решения различных задач.
Некоторые области применения нейронных сетей:
- Решение задач классификации.
- Прогнозирование событий, явлений, цен.
- Распознавание и создание изображений.
- Распознавание и синтез естественной речи.
Для чего нужен курс:
Погрузиться в перспективную практическую область знаний, познакомиться с искусственным интеллектом, увеличить свои знания в области программирования, узнать способы решения нестандартных задач, расширить знания и понимания математических инструментов.
Назад