На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Сноб

77 подписчиков

Свежие комментарии

  • Александр Николаевич
    НЕ СМЕШИТЕ! ГДЕ вы видели, кроме Москвы, чтобы миллиардеры жили в г о р о д а х ! ?Москва заняла вто...
  • В С
    Какое , нахрен , здоровье может быть в Красноярске ??!! Пыль в глаза пускают.Все 16 крупнейших...
  • ММ
    Да пошли они... У нас будем всё выращивать!Глобальное потепл...

Исследование: языковые модели хуже понимают запросы без знаков препинания

Точность восприятия запросов языковыми моделями снижается на 20% при удалении знаков препинания, артиклей и стоп-слов. Чат-боты воспринимают текст как последовательность символов, выяснили ученые Института AIRI.

Удаление знаков препинания и артиклей в запросах точность языковых моделей почти на 20%. Это выяснили ученые Института AIRI — результатами исследования они поделились со «Снобом».

Чат-боты и виртуальные ассистенты воспринимают текст как последовательность символов и вычленяют из них ключевые токены. Исследователи провели ряд тестов. В первом эксперименте команда проверила, насколько хорошо специально разработанная языковая модель способна восстанавливать исходный текст.

Систему обучили анализировать последовательность символов и восстанавливать исходный текст с учетом знаков препинания, артиклей и стоп-слов, не несущих смысла. Выяснилось, что больше всего информации для языковой модели содержится в стоп-словах, и их удаление ведет к тому, что чат-бот перестает понимать контекст.

После ученые провели аналогичные тесты на наборах задач MMLU и BABILong, которые оценивают способности языковых моделей. Из текстов для эксперимента заранее удалили элементы, которые людям кажутся нелогичными и необязательными для повествования.

Затем специалисты поставили перед языковыми моделями, в том числе ChatGPT, задачу — решить, какие элементы текста, с точки зрения человека, можно удалить. В результате эксперимента выяснилось, что удаление «незначительных» элементов из технического задания снижает качество работы модели.

Руководитель группы «Интерпретируемый ИИ» лаборатории FusionBrain Института AIRI Антон Разжигаев рассказал, что научная группа уже два года изучает принципы действия языковых моделей. При понимании ключевых аспектов работы виртуальных ассистентов удастся повысить их эффективность и безопасность, а также ускорить и упростить обучение.

 

Ссылка на первоисточник
наверх