Безграничные возможности самовыражения через синергию ИИ с пластиковым конструктором.
YouTube-канал Creative Mindstorms создал уникальный Lego-принтер, который автоматически собирает мозаики из кубиков Lego, подобные шедеврам искусства, таким как «Мона Лиза» да Винчи или «Большая волна» Хокусая. Новинка, получившая название «Pixelbot 3000», использует технологию искусственного интеллекта для упрощения процесса создания мозаики.
Изначально идею вдохновила другая разработка — Bricasso. Этот принтер, представленный восемь лет назад, требовал весьма долгого подготовительного процесса: сначала необходимо было вручную создать дизайн мозаики, распечатать его на бумаге и просканировать камерой принтера, чтобы он начал творить. Тем временем, Pixelbot 3000 значительно упрощает этот процесс.
Чтобы создать мозаику с помощью Pixelbot 3000, достаточно лишь ввести описание желаемого изображения. Запрос отправляется в генеративную нейросеть DALL-E — это глубокая нейронная сеть, разработанная компанией OpenAI. Она использует архитектуру трансформера для генерации изображений с помощью заданных текстовых описаний. DALL-E является развитием предыдущей модели GPT-3 и специализируется на создании уникальных иллюстраций на основе текстовых запросов.<br /> <br /> Для обучения DALL-E использовалась большая база данных, содержащая миллионы изображений. Нейронная сеть была обучена связывать текстовые описания с соответствующими визуальными представлениями, что позволяет ей генерировать новые изображения, соответствующие заданным текстовым описаниям. С конца 2023 года генерация DALL-E доступна прямо из другого популярного продукта OpenAI — ChatGPT." data-html="true" data-original-title="DALL-E" >DALL-E от OpenAI, которая создаёт упрощённое изображение размером 1024 x 1024 в мультяшном стиле.
Затем, так как от DALL-E сложно сразу получить идеально подходящее для печати пиксельное изображение, написанный автором код делит картинку на сетку 32 x 32 и производит автоматическую цветокоррекцию, чтобы снизить число используемых на изображении цветов до 15.
Всё из-за того, что данный Lego-принтер использует именно такой набор деталей по цветам, в то время как весь диапазон конструктора Lego составляет порядка 70 цветов. И даже эта цифра всё ещё несопоставима со стандартом в 16+ миллионов цветов, поддерживаемых цветовой моделью RGB.
Преобразование изображения из нейросети для корректной работы принтера
Создание, сборка и программирование Pixelbot 3000 потребовала у автора ролика значительных усилий и заняла около шести месяцев. Для тех, кто ищет способ расслабиться, рекомендуется посмотреть 15-минутное видео от Creative Mindstorms, демонстрирующее процесс превращения идеи Pixelbot 3000 в реальность.
На перекрестке науки и фантазии — наш канал