«Сбер» представил нейросеть для создания изображений по словесному описанию

«Сбер» представил нейросеть для создания изображений по словесному описанию
Агентство городских новостей Москва  /  Денис Воронин

«Сбер» разработал искусственный интеллект, который создает иллюстрации, используя слова на русском языке. Нейросеть под названием ruDALL-E является уникальным проектом на территории России и СНГ.

Для обучения искусственного интеллекта понадобилось 23 000 GPU-часов, что стало самым крупным нейросетевым вычислительным процессом на постсоветском пространстве.

Создатели отмечают, что для создания изображений отсутствует лимит, а обучение компьютера происходит за счет картинок и текста. Для успешной работы было задействовано сразу три нейросети, где первая занимается обработкой текста и определением количества возможных изображений, на втором этапе отсеиваются лучшие варианты, а третья нейросеть способна увеличить картинки с сохранением качества.

Сообщается, что модель ruDALL-E XL имеет 1,3 миллиарда параметров и находится в открытом доступе на GitHub. Кроме того, существует ее аналог с 12 миллиардами параметров — ruDALL-E 12B. Обе системы вскоре появятся на площадке ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.

Вам понравилась статья?