Петербургская компания Statanly Technologies занимается разработкой нейросети, которая будет генерировать изображение по текстовому описанию. Примечательно, что над подобной системой работает и Илон Маск.
Технология называется text–to–image и она предполагает, что с помощью выданного набора слов искусственный интеллект будет выдавать соответствующий пейзаж. Набор слов может быть, к примеру, море, песок, закат , корабль и так далее. Генеральный директор Statanly Technologies Сергей Фёдоров отметил, что полноценное решение такой задачи может занять не один год.
При этом уже имеются некоторые разработки. Учредители петербургской компании основали в США стартап Deflamel.
«Мы разбираем текст по тегам — ключевым словам. Делаем запрос, накладываем картинки друг на друга — получается оригинальное изображение. Своего рода коллаж, у которого не будет проблем с авторским правом», —подчеркнул Сергей Федоров.
А вот другой проект Witsart только занимается поиском подходящего изображения к тексту. Для того, чтобы создать такую систему может потребоваться десятки миллионов рублей. В настоящий момент компания в разработку инновации вкладывает только собственные средства, сообщает «Деловой Петербург».
«Для генерации произвольных изображений из произвольного текста высока вероятность столкнуться, во–первых, с очень наукоёмкими проблемами, которые потребуют привлечения дорогих разработчиков, математиков, а возможно, даже лучших мировых учёных в этой области. А во–вторых, с необходимостью поиска, покупки или формирования больших наборов данных (датасетов). В таком случае бюджет проекта легко вырастает до десятков, а то и сотен миллионов долларов», — отметил директор по акселерации по направлению технологий виртуальной и дополненной реальности фонда «Сколково» Алексей Каленчук.
Известно, что уже есть некоторые технологии, например, от Open AI Илона Маска. Они умеют уже генерировать простые объекты — стол, стул или окно. Однако нейросетям пока не удаются сложные пейзажи.