Ученые МФТИ сокращают разрыв между виртуальным и реальным миром для робототехники. Новая система использует особый симулятор для точной настройки виртуальной модели робота. Такой «двойник», используя данные о его перемещении, в точности повторяет поведение робота и эффективно обучает алгоритмы для реального мира. Технология важна для создания маневренных и гибких agile-роботов: манипуляторов, курьеров, домашних помощников и других. Препринт исследования опубликован на arxiv org, доклад по теме работы представлен на конференции International Conference on Intelligent Robots and Systems (IROS 2025).

После обучения на уточненной модели робот стал точнее следовать заданной траектории. В эксперименте робот должен был пройти вперед как можно дольше. Робот обученный на уточненной модели идет прямо, в то время как робот обученный стандартным методом сворачивает. Источник: статья авторов
Чтобы антропоморфный робот двигался уверенно и не сбивался с пути, ученым необходимо четко знать его параметры: вес конечностей, демпфирование (подавление колебаний) или трение в суставах. Особенно это важно для обучения с подкреплением, где робот в виртуальной среде методом проб и ошибок учится выполнять задачи, получая «вознаграждение» за успешные действия.
На базе дифференцируемого симулятора MuJoCo-XLA, ученые МФТИ встроили этап «самонастройки» модели прямо в процесс обучения. Используя данные о положении, скорости и управляющих сигналах, симулятор сам вычисляет, как именно нужно изменить массу, трение и инерцию, чтобы поведение виртуального двойника совпало с поведением реального робота.
«Обычно чтобы точно определить параметры робота, на него приходится вешать множество дорогих и неудобных датчиков. Наша модель использует только данные о положении, скорости частей робота и управляющих командах, которые подаются на его моторы. На их основе симулятор оптимизирует параметры и настраивает виртуальную копию робота. Это позволяет уже реальному роботу идеально повторять его сценарии», — рассказал Вячеслав Ковалев, аспирант МФТИ, программист лаборатории интеллектуальных технологий робототехники МФТИ.
Эксперименты на двуногом роботе Mini π показали: новый подход на 75% уменьшает отклонение и на 46% увеличивает пройденное расстояние в заданном направлении.
Видео-презентация разработки.
Модель учитывает сложные нелинейные эффекты, такие как трение в редукторах, для оптимизации которых могут использоваться нейронные сети. Это не только повышает точность, но и позволяет роботу экономить энергию, которую он раньше тратил на коррекцию ошибок и неустойчивое движение.
Это открывает путь к созданию agile-роботов — маневренных и гибких роботов, способных плавно передвигаться и быстро адаптироваться к изменениям в окружающей среде.

 
	