Предложенный метод поможет «переводить» задания для нейросетевых алгоритмов с языка человеческого общения на язык машинного обучения. Это улучшит качество работы онлайн-помощников: интеллектуальных чат-ботов, поисковых систем, сервисов распознавания и т.п.
В последние годы все большую популярность приобретают большие языковые модели. Это алгоритмы ИИ, которые разработаны для понимания человеческого языка и создания текстов на нем. На основе этих систем построены «умные» онлайн-помощники, поисковые сервисы, алгоритмы обнаружения объектов и другие приложения
Однако, как отмечают специалисты, зачастую языковые модели некорректно «понимают» запросы пользователей. Это происходит в силу того, что разные модели ИИ предобучены на разных наборах данных.
Например, если спросить: «какую погоду считать хорошей?», — одна модель ответит, что солнечную, а вторая — дождливую. При этом обе будут правы, поскольку первая из них, к примеру, обучена на опыте северных народов, для которых Солнце — основа жизни, а вторая — на сведениях землепашцев, заинтересованных в осадках для полива.
Чтобы решить проблему разнородных датасетов разработчики создают алгоритмы-«переводчики», которые трансформируют запросы пользователей в промты — точные инструкции для нейросетей.
Развивая это направление, российские исследователи из Московского физико-технического института и Федерального исследовательского центра «Информатика и управление» предложили программное решение, которое помогает оптимизировать пользовательские запросы для конкретных моделей ИИ, используя дополнительную большую языковую модель.
Доклад, раскрывающий подробности метода, ученые представили на конференции Hybrid Artificial Intelligent Systems — одном из авторитетных международных форумов, посвященных вопросам гибридных систем ИИ. Статья с описанием нового подхода опубликована в итоговом сборнике конференции.
«Мы стремимся повысить эффективность языковых моделей за счет их быстрой донастройки. Суть подхода в том, чтобы использовать дополнительный программный модуль, который переписывает запрос человека, адаптируя его под специфику каждой конкретной модели, под ее характеристики. Метод получил название reframing, что можно перевести на русский как «переосмысление», — рассказала соавтор исследования, инженер лаборатории когнитивных динамических систем МФТИ Зоя Воловикова.
Как пояснили разработчики, в процессе обучения модульный алгоритм генерирует варианты ответов, а затем выбирает наилучший, получая за это «поощрение». Таким образом алгоритм понимает, какие ответы считать более точными, релевантными или полезными.
Свое исследование специалисты проводили на примере моделей, в задачи которых входит распознавание предметов на изображении. По словам ученых, предложенный подход помогает нейросети без знаний о том, на каких данных обучались языковые модели, улучшить качество распознавания.
Эксперименты продемонстрировали эффективность метода. В дальнейшем, по мнению ученых, его можно распространить и на решение других задач.
«Упрощенно говоря, алгоритм помогает переводить с одного языка на другой. То есть он ищет специфику, какие слова нужно подобрать, чтобы улучшить качество работы модели. Причем, это может быть не только модель детекции изображений, но и любая другая модель, которая работает с языковой модальностью», — отметила Зоя Воловикова.
Если пофантазировать, считают разработчики, алгоритм может помочь не только во взаимоотношениях между естественным и искусственным интеллектом, но также и в обычном общении между людьми. Ведь зачастую, даже разговаривая на одном языке, два человека не могут найти точки соприкосновения.