Искусственный интеллект который рисует картины
Перейти к содержимому

Искусственный интеллект который рисует картины

  • автор:

9 лучших сервисов, где нейросети рисуют картинку по описанию

Современные технологии продолжают стремительное развитие, превращая нейросети, которые недавно казались лишь игрушкой, в серьезных и эффективных помощников для человека.

Они уже не только применяются в задачах, требующих точного анализа огромного объема данных, но и проявляют свою творческую способность. В настоящее время нейросети могут рисовать.

Они создают картины, портреты и даже воплощаются в рисунках на основе текстовых описаний. И нет, это не шутка.

Ознакомимся с несколькими интересными нейросетями:

  • Kandinsky 2.1 – нейросеть, способная понимать русский язык;
  • Шедевриум – многообещающий прототип с ограниченными возможностями;
  • Stable Diffusion – нейросеть, работающая на вашем компьютере;
  • DALL-E 2 — нейросеть, которая творит произведения искусства по текстовым описаниям;
  • GLIDE — нейросеть для создания удивительных рисунков;
  • GauGAN 2 — нейросеть, способная создавать изображения по вашему запросу;
  • ruDALL-E — онлайн-нейросеть, которая рисует по командам;
  • DALL·E mini — нейросеть, способная создавать портреты;
  • Dream by Wombo — нейросеть, которая воплощает картины на основе текстовых описаний.

Эти инновационные разработки в области нейросетей открывают новые возможности в мире искусства и креативности.

Что такое нейросеть

Прежде чем погрузиться в художественные навыки нейросетей, полезно разобраться в понятии нейронной сети (также известной как искусственная нейронная сеть).

Термин «нейросеть» имеет свои корни в исследованиях человеческого мозга и в современности относится к связанному семейству моделей, обладающих гибкой структурой и большим параметрическим пространством.

Возможно, это сложно понять? Ничего удивительного, ведь работа с нейросетями сама по себе не является простой для неподготовленного человека.

Однако, на самом деле, нейросеть функционирует по принципу человеческого мозга: она состоит из нейронов, которые связаны синапсами, передающими электрохимические импульсы. В нейросети роль нейронов выполняют вычислительные элементы, имитирующие работу человеческого мозга.

Конечно, несмотря на все достижения науки, нейросетям все еще требуются значительные вычислительные ресурсы, включая мощные компьютеры. Кроме того, они пока не могут сравниться с мозгом человека, где количество синапсов значительно больше, и способность работать параллельно.

Нейросети в настоящее время функционируют путем разбиения любой задачи, даже самой простой, на последовательность шагов для ее выполнения. Однако уже сегодня нейронные сети значительно помогают людям в повседневных задачах.

Нейросети используются для распознавания лиц в системах видеонаблюдения, диагностики заболеваний при анализе медицинских данных пациентов, замены людей в колл-центрах в роли голосовых помощников, а также даже привычные всем чат-боты основаны на принципе нейронных сетей.

Сервисы по имитации голосов и созданию дипфейковых изображений также основаны на нейросетях. В последнее время нейронные сети были вовлечены даже в творческую сферу. Нейросети теперь занимаются написанием стихов и рекламных слоганов, композицией музыки и разработкой сценариев для фильмов.

Они также применяются для разработки и визуализации промышленного дизайна. Но самым удивительным достижением стало превращение слов в изображение.

Нейросеть рисует: 5 способов создать картинку по фото или описанию

Фото: Unsplash

Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые нейросети бесплатны и доступны всем желающим

Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. «РБК Тренды» подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).

Фото:Freepik

1. DALL-E Mini

  • зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
  • найти раздел dall-e;
  • ввести текстовое описание на английском языке, разделяя слова пробелами;
  • нажать Run;
  • когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.

Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.

Фото:Glif

2. ruDALL-E Kandinsky

Как попробовать ruDALL-E Kandinsky:

  • зайти на официальный сайт нейросети;
  • выбрать «Попробовать»;
  • ввести текстовое описание в окне через пробелы на русском языке;
  • ввести код подтверждения;
  • скачать готовую картинку или поделиться ею в соцсетях через специальную кнопку.

Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).

Картинка по описанию ruDALL-E Kandinsky

Картинка по описанию ruDALL-E Kandinsky

Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе уже есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.

В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. Она доступна в приложении «Салют» от SberDevices и в боте Discord. По словам разработчиков, генерация изображений учитывает точное описание желаемого и создает уникальные изображения, которые раньше не существовали. Их можно использовать для иллюстраций статей, а также в копирайтинге и рекламе.

Фото:Изображение сгенерировано нейросетью midjourney по запросу «новые медиа»

3. Midjourney

  • зарегистрироваться на платформе для геймеров Discord;
  • зайти на официальный сайт Midjourney и авторизоваться через Discord;
  • перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
  • ввести описание на английском языке в плашке Prompt;
  • кликнуть «Отправить»;
  • появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
  • нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.

Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. В бесплатной версии можно сгенерировать 25 сетов в низком разрешении или меньше, так как попытки улучшить изображения засчитываются как новая попытка генерации. По сравнению с конкурентами Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом.

4. Starryai

  • перейти на сайт Starryai, кликнуть «Start Creating»;
  • пройти верификацию через Google или Apple;
  • выбрать опцию Altair или Orion;
  • в окне Prompt ввести текстовое описание на английском языке;
  • в окне появится картинка, которая будет преобразовываться прямо на глазах;
  • кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.

Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.

Фото:пресс-служба «Яндекса»

5. Dream by WOMBO

  • зайти на сайт Dream;
  • в окне Prompt вбить текстовое описание на английском языке;
  • выбрать стиль картинки и кликнуть Create;
  • нажать Save, также можно повторить попытку генерации, нажав Generate Again.

Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.

В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.

Картинка, сгенерированная Imagen / Google AI

Картинка, сгенерированная Imagen / Google AI

Сначала Google открыла свой сервис для ограниченного бета-тестирования, но теперь оно, похоже, закрыто. Видимо, в ближайшем будущем Imagen станет общедоступным.

ИИ научился рисовать: 5 программ для создания и обработки изображений

Более 50% работающих на фрилансе программистов, дизайнеров и маркетологов выполняют задачи с помощью нейросетей, приводит Forbes исследование сервиса Solar Staff. 61,1% дизайнеров, принимавших участие в опросе, заявили, что чаще всего используют ИИ для генерации изображений и поиска референсов, 30% рассказали, что обращаются к нейросетям при ретуши изображений. Мы проанализировали несколько сервисов, которые помогут в этих и других процессах.

Flair AI: обрабатывает фото для рекламы

Нейросеть помогает быстро сгенерировать брендированный визуальный контент для рекламы или карточек на сайтах и маркетплейсах. Необходимо загрузить фото продукта, а Flair AI создаст для него фон на основе текстового описания.

С помощью технологии распознавания объектов Flair AI идентифицирует особенности объекта на фото, чтобы органично подобрать фон, добавить тени и отражения. Также сервис самостоятельно удаляет фон с оригинала и предлагает около 140 шаблонов для редактирования.

Autodraw: исправляет скетчи

Это графический редактор от Google, который автоматически распознает рисунок пользователей, дорабатывает его и предлагает более профессиональный его вариант. Autodraw отлично подойдет для создания иллюстраций, диаграмм и других графических изображений.

Пользователю на пустом холсте сервиса нужно нарисовать эскиз или выбрать что-то из предложенных форм и символов, которые AutoDraw автоматически превращает в скетч. В рисунок можно вносить дополнения, а также изменять его элементы.

Stock IMG: генерирует уникальные картинки

Stock IMG при помощи искусственного интеллекта генерирует уникальные высококачественные изображения. Здесь можно разработать картинку, постер, логотип, обложку, QR-код и другие визуалы за несколько минут.

Для создания картинки необходимо ввести текстовое описание желаемого продукта, выбрать настройки и разрешение, а дальше сервис сделает все самостоятельно. Изображение можно редактировать и исправлять до тех пор, пока результат вас не устроит.

Booth AI: создает реалистичные фото с товарами

Платформа работает на базе искусственного интеллекта и генерирует высококачественное фото с вашими товарами и продуктами. Booth AI поможет сделать презентацию, сгенерировать фото, добавить на изображение предмет или человека, и даже «одеть» этого человека в ваш товар.

В сервис необходимо загрузить фото товара и составить текстовое описание желаемого результата. Через несколько минут Booth AI пришлет готовый результат, который можно будет редактировать при необходимости.

Clipdrop: помогает профессионально редактировать изображения

Clipdrop — это целый набор приложений, в котором при помощи искусственного интеллекта можно быстро редактировать изображения, например, заменять фон, удалять объекты или исправлять дефекты, добавлять предметы, делать цветокоррекцию и даже генерировать разные варианты картинки на основе оригинала.

Для работы необходимо загрузить изображение, выбрать инструмент, например, «замена фона», выделить необходимую область и воспользоваться подсказками или шаблонами. Готовый результат можно многократно редактировать.

9 сервисов, где нейросети рисуют картинку по описанию

Обзор смартфона Honor X7b: три дня без подзарядки

Это увлекательно: описываете, что хотите видеть, а нейросеть предлагает вам готовые картинки. Хотите попробовать? Читайте, как это сделать.

9 сервисов, где нейросети рисуют картинку по описанию

Современные технологии развиваются так стремительно, что нейросети, совсем недавно бывшие лишь нелепой забавой, сегодня стали серьезными и эффективными помощниками человека. Причем не только в механической работе, требующей точности в изучении огромного массива данных, но и в творческих задачах. Уже сейчас нейросеть рисует. Нейросеть рисует картины, нейросеть рисует портреты и нейросеть рисует по словам. И нет, это не шутка.

Подпишитесь на наши каналы, чтобы не пропустить интересные новости и полезные статьи

Подпишитесь на наши каналы, чтобы не пропустить интересные новости и полезные статьи

Что такое нейросеть

Прежде чем разбираться с художественными навыками нейросетей, стоит для начала понять, что же это такое — нейронная сеть (она же artificial neural network в английском наименовании). Термин нейросеть своими корнями уходит к исследованиям работы мозга человека и в наши дни применяется к свободно связанному семейству моделей, которые характеризуются большим параметрическим пространством и гибкой структурой. Непонятно? Ничего удивительного, ведь и работа самих нейросетей не самая простая для человека неподготовленного.

Но, кроме шуток, нейросеть работает по принципу человеческого мозга — он состоит из нейронов, которые связаны передающими электрохимические импульсы синапсами — а в нейросети роль нейронов играют вычислительные элементы, которые имитируют мозг человека.

9 сервисов, где нейросети рисуют картинку по описанию

Правда, несмотря на все достижения науки, пока нейросети требуют большого количества технических ресурсов, включая мощнейшие компьютеры, а также не могут соперничать с мозгом человека, где и синапсов больше, и работать они могут параллельно друг с другом. А нейросети пока функционируют лишь через разделение любой, даже самой простой задачи, на череду последовательных шагов к её выполнению. Но уже сейчас нейронные сети способны существенно помогать человеку в повседневных задачах.

Нейросетям доверено распознавать лица в системах видеонаблюдения, диагностировать болезни при анализе данных пациентов, заменять человека в колл-центрах в роли голосовых помощников да даже привычные всем чат-боты тоже используют в своей основе принцип нейронных сетей. Сервисы по имитации голосов и созданию изображений-дипфейков построены также на нейросетях. А в последнее время нейронным сетям доверили даже творческие задачи — написание стихов и рекламных слоганов, сочинение музыки и сценариев для фильмов, разработку и визуализацию промышленного дизайна, а кроме того — превращение слов в изображение.

Крыса-геймер — нейроинженер научил крыс играть в Doom II

Kandinsky 2.1 — нейросеть, которая понимает русский

Kandinsky 2.1 не зря стал самым быстрорастущим сервисом искусственного интеллекта в мире, всего за 6 дней добравшись до отметки в миллион уникальных пользователей. За считанные секунды нейросеть способна сгенерировать изображение по текстовому описанию на одном из 101 поддерживаемых языков мира, включая и русский.

9 сервисов, где нейросети рисуют картинку по описанию

Она умеет создавать картину в режиме бесконечного полотна, смешивать изображения и дорисовывать их. Разработкой и обучением нейросети занимались специалисты Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

По сути, она стала улучшенной версией предыдущей Kandinsky, дообученной на 170 млн пар «текст — изображение» и специально собранном датасете из двух миллионов пар качественных изображений. Сильно помогло в улучшении генерации изображений и использование новой обученной модели автоэнкодера. Ну а сгенерировать изображения можно, как в Telegram-боте нейросети, так и на ее официальной странице или в приложении Салют.

Шедевриум — перспективный прототип с ограниченными возможностями

Новая нейросеть от команды Яндекса пока находится только в начале своего пути, но уже доступна для бета-тестирования пользователями в виде приложений для Android и iOS. Она умеет рисовать картины по текстовому описанию на русском и английском языках, но, как и все подобные сервисы, очень любит конкретику — чем более полным окажется описание изображения, тем точнее будет итоговый результат.

9 сервисов, где нейросети рисуют картинку по описанию

Нейросеть может подражать стилю известных художников и их полотен, работает в заданных стилях и поддерживает, в том числе, и фотореализм, когда изображение будет почти неотличимо от обычной фотографии.

Делаем аватарки с помощью нейросети: какой сервис лучше

Главный минус Шедевриума в том, что возможности работы с сервисом пока сильно ограничены. Скачав приложение, вы сможете без проблем посмотреть уже имеющиеся работы, а вот создать собственное изображение получится только после одобрения составленной заявки. Впрочем, учитывая бета-статус сервиса, это неудивительно.

Stable Diffusion — нейросеть на вашем компьютере

После того, как бесплатный доступ к Midjourney оказался закрыт, популярность Stable Diffusion… ну не возросла до небес, но все-таки достаточно ощутимо увеличилась. Оно и неудивительно. Нейросеть не только построена на открытом исходном коде, полностью бесплатна и предлагает множество вариантов доступа.

9 сервисов, где нейросети рисуют картинку по описанию

Чего только стоит возможность установить ее на собственный компьютер. Причем особо мощный ПК для этого не нужен — достаточно, чтобы он имел видеокарту Nvidia 10XX или свежее с 4 Гбайт видеопамяти. Поддержать разработчиков деньгами вы, конечно, можете, но это совсем необязательно — сервис полностью бесплатен.

Stable Diffusion немного уступает тому же Midjourney по выразительности рисовки, но и результаты, выдаваемые нейросетью, более предсказуемы и точнее отвечают введенным запросам.

DALL-E 2 — нейросеть, которая рисует по словам

В 2021 году одно из детищ Илона Маска, занимающаяся разработкой и лицензированием технологий на основе машинного обучения американская компания OpenAI, представила нейросеть DALL-E, способную создавать изображение по его текстовому описанию. Опыт был признан удачным и в 2022 году анонсировали DALL-E 2 — дальнейшее развитие своего прародителя.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *