Специалисты лаборатории DeepMind создали универсальную архитектуру Perceiver IO для обработки всех типов входных и выходных данных. To tackle all the challenges we meet while solving intelligence, we need tools that are as adaptable as possible. Announcing the paper & code for Perceiver IO, an architecture that handles a wide range of data and tasks, all while scaling gracefully: https://t.co/9UU9b6276q 1/4 pic.twitter.com/PO9JSHt7yL — DeepMind (@DeepMind) August 3, 2021 В ее основе — оригинальная модель Perceiver, представленная в июне 2021 года. Она обрабатывает изображения, аудио, видео и их комбинации, однако ограничивается задачами с простыми выходными данными, такими как классификация. Для решения этой проблемы исследователи создали более общую версию архитектуры — Perceiver IO.
Она может выдавать широкий спектр выходных данных из разнообразия входящей информации, что делает ее применимой к таким областям, как обработка естественного языка, компьютерное зрение и мультимодальное понимание. Результаты оценки оптического потока или отслеживания движения всех пикселей изображения с помощью Perceiver IO. Цвет каждого пикселя показывает направление и скорость движения. Данные. DeepMind. Perceiver и Perceiver IO построены на архитектуре трансформеров, которые хорошо работают для входных данных, содержащих нескольких тысяч элементов. Однако, по словам исследователей, изображения, аудио и видео могут содержать миллионы таких элементов. «С помощью оригинального Perceiver мы решили главную проблему универсальной архитектуры: масштабирование трансформеров на очень большие входные данные без введения допущений, специфичных для предметной области», — говорится в блоге. Исследователи также считают, что Perceiver IO может достичь беспрецедентного уровня универсальности. Они опубликовали исходный код архитектуры на GitHub и надеются, что это поможет исследователям и практикам разрабатывать приложения без необходимости тратить ресурсы на создание индивидуальных решений с использованием специализированных систем. Напомним, в конце июля DeepMind представила обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта. В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold. В июне ученые из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением. Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!
Свежие комментарии