Новая крупномасштабная платформа моделирования для обучения роботов выполнению повседневных задач.

Новая крупномасштабная платформа моделирования для обучения роботов выполнению повседневных задач.
Новая крупномасштабная платформа моделирования для обучения роботов выполнению повседневных задач.

RoboCasa — это среда моделирования для обучения роботов-агентов широкого профиля. Изображение предоставлено: Юке Чжу и Соруш Насириани.

Производительность инструментов искусственного интеллекта (ИИ), включая большие вычислительные модели для обработки естественного языка (НЛП) и алгоритмы компьютерного зрения, быстро улучшалась за последние десятилетия. Одна из причин этого заключается в том, что наборы данных для обучения этих алгоритмов растут в геометрической прогрессии, собирая сотни тысяч изображений и текстов, часто собранных из Интернета.

С другой стороны, обучающих данных для алгоритмов управления и планирования роботов остается гораздо меньше, отчасти потому, что получить их не так просто. Некоторые ученые-компьютерщики пытаются создать более крупные наборы данных и платформы, которые можно было бы использовать для обучения вычислительных моделей для широкого спектра приложений робототехники.

В недавней статье, предварительно опубликованной на сервере arXiv и которая будет представлена ​​на конференции Robotics: Science and Systems 2024, исследователи Техасского университета в Остине и NVIDIA Research представили одну из этих платформ, названную RoboCasa.

RoboCasa — это крупномасштабная среда моделирования, которую можно использовать для обучения роботов широкого профиля выполнению различных задач в повседневных условиях.

«Недавний прогресс в области искусственного интеллекта во многом был обусловлен обучением больших моделей на массивных источниках данных», — рассказал Tech Xplore Юкэ Чжу, ведущий автор статьи.

«Вдохновленные этими достижениями, мы стремимся разработать базовые модели для универсальных роботов, которые могут выполнять различные повседневные задачи. RoboCasa предназначена для предоставления высококачественных данных моделирования, необходимых для обучения таких базовых моделей робототехники».







1 кредит

Основная цель недавней работы Чжу, Соруша Насириани, Абхирама Маддукури, Лэнса Чжана, Адита Париха, Аарона Ло, Абхишека Джоши и Аджая Мандлекара заключалась в разработке новой платформы моделирования с открытым исходным кодом, которая облегчила бы обучение алгоритмам робототехники.

Их усилия в конечном итоге привели к разработке RoboCasa, которая является расширением RoboSuite, среды моделирования, которую они представили несколько лет назад. RoboSuite служит инфраструктурой моделирования, которую команда использовала для создания моделируемой среды RoboCasa.

«Мы использовали генеративные инструменты искусственного интеллекта для создания разнообразных объектов, сцен и задач», — объяснил Чжу. «Эти инструменты искусственного интеллекта значительно улучшили разнообразие и реалистичность моделируемого мира. Кроме того, RoboCasa поддерживает различные аппаратные платформы роботов и предоставляет большие наборы данных с более чем 100 тысячами траекторий для обучения моделей».

Платформа RoboCasa включает в себя тысячи 3D-сцен, содержащих более 150 различных типов предметов быта и десятки предметов мебели и электроприборов. RoboCasa предлагает высокореалистичные симуляции, которые были улучшены с помощью инструментов генеративного искусственного интеллекта.

Чжу и его коллеги разработали 100 задач, которым можно обучить алгоритмы робототехники, и собрали высококачественные демонстрации этих задач на людях. Их платформа также включает в себя методы создания эффективных траекторий и движений, которые позволят роботам выполнять эти задачи.

Новая крупномасштабная платформа моделирования для обучения роботов выполнению повседневных задач.

RoboCasa использует модели большого языка, такие как GPT-4, для создания разнообразного спектра повседневных задач. Фото: Юке Чжу и Соруш Насириани.

«Два ключевых открытия взволновали меня больше всего», — сказал Чжу. «Во-первых, мы продемонстрировали тенденцию масштабирования: по мере увеличения размера (генерируемых машиной) наборов обучающих данных производительность модели неуклонно росла. Во-вторых, объединив данные моделирования с реальными данными, мы обнаружили, что расширенный набор данных улучшил производительность робота в реальных задачах».

В первоначальных экспериментах новая платформа моделирования оказалась ценным ресурсом для создания синтетических обучающих данных, которые затем можно использовать для обучения алгоритмов имитационного обучения. В целом, это исследование показывает, что данные моделирования могут быть очень эффективными при обучении моделей ИИ для приложений робототехники.

В будущем другие команды могут поэкспериментировать с RoboCasa, которая имеет открытый исходный код и поэтому легко доступна на GitHub. Тем временем Чжу и его коллеги планируют продолжать расширять и совершенствовать свою платформу, чтобы способствовать ее широкому использованию в сообществе робототехники.

«Во-первых, мы стремимся внедрить более продвинутые методы генеративного искусственного интеллекта для дальнейшего расширения наших симуляций, охватывая разнообразие и богатство антропоцентрической среды, от домов и фабрик до офисов», — добавил Чжу.

«Во-вторых, мы планируем разработать более совершенные алгоритмы для использования данных моделирования для создания робототехнических систем, которые будут более надежными и поддающимися обобщению в реальном мире».

Больше информации:
Соруш Насириани и др., RoboCasa: крупномасштабное моделирование повседневных задач для роботов широкого профиля, arXiv (2024). DOI: 10.48550/arxiv.2406.02523

Информация журнала:
arXiv

© 2024 Сеть Science X

Цитирование: Новая крупномасштабная платформа моделирования для обучения роботов выполнению повседневных задач (15 июня 2024 г.), получено 17 июня 2024 г. с https://techxplore.com/news/2024-06-large-scale-simulation-platform-robots.html.

Этот документ защищен авторским правом. За исключением любых добросовестных сделок в целях частного изучения или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Содержимое предоставлено исключительно в информационных целях.

Поделиться в соцсетях