ИИ-модель Microsoft превзошла результат человека в тесте на понимание естественного языка SuperGLUE
Москва, 15 января 2021 г. – Алгоритм понимания естественного языка (Natural Language Understanding, NLU) Microsoft DeBERTa превзошел человеческие возможности в одном из самых сложных тестов для подобных алгоритмов SuperGLUE. На данный момент модель занимает первое место в рейтинге с показателем в 90,3, в то время как среднее значение человеческих возможностей составляет 89,8 баллов.
Рейтинг алгоритмов по прохождению теста SuperGLUE
Тест SuperGLUE включает в себя ряд задач, которые разработаны для оценки способности ИИ-моделей распознавать и понимать естественный язык, например, дать правильный ответ на вопрос на базе прочитанного абзаца, определить, правильно ли используется многозначное слово в определенном контексте и т.д. Тест был разработан группой исследователей в 2019 году. Когда был представлен SuperGLUE, разрыв между самой эффективной моделью и показателями человека в таблице лидеров составлял почти 20 баллов.
Для того чтобы добиться текущего результата в 90,3 балла, DeBERTa получила масштабное обновление архитектуры: теперь она состоит из 48 слоев и имеет 1,5 млрд параметров. Microsoft сделает публичной модель и ее исходный код.Кроме того, DeBERTa будет интегрирована в следующую версию Тьюринговой модели Microsoft Turing (Turing NLRv4). Тьюринговые модели используются в таких продуктах Microsoft, как Bing, Office, Dynamics и Azure Cognitive Services, чтобы совершенствовать, к примеру, взаимодействие с чат-ботами, предоставление рекомендаций и ответов на вопросы, поиск, автоматизацию поддержки клиентов, создание контента и решение многих других задач на пользу сотен миллионов пользователей.
Архитектура модели DeBERTa
В отличие от других моделей, DeBERTa учитывает не только значения слов, но и их позиции и роли. К примеру, в предложении «a new store opened beside the new mall» (англ. «новый магазин открылся рядом с торговым центром») она может понять, что близкие по контекстному значению «store» («магазин») и «mall» («торговый центр») играют разные синтаксические роли (подлежащим здесь является именно «store»). Более того, она способна определять зависимость слов друг от друга. Например, DeBERTa понимает, что зависимость между словами «deep» и «learning» гораздо сильнее, когда они стоят рядом (термин «глубокое обучение»), чем когда они встречаются в разных предложениях.
Несмотря на то, что модель DeBERTa превзошла человеческие показатели в тесте SuperGLUE, это не означает, что ИИ-модель достигла уровня человека в понимании естественного языка. В отличии от машин, люди хорошо умеют использовать знания, ранее полученные при выполнении различных задач, для решения новых – это называется композиционным обобщением (англ. compositional generalization). Поэтому, несмотря на многообещающие результаты DeBERTa в тесте, необходимо продолжить исследования, для того чтобы развить у модели этот навык.
Microsoft активно работает над усовершенствованием технологий искусственного интеллекта. Так, в октябре 2020 года был представлен прогрессивный ИИ-алгоритм для автоматической генерации подписей к изображениям, которые во многих случаях оказываются более точными, чем написанные людьми. Это позволит сделать продукты и сервисы Microsoft еще более инклюзивными и доступными для большего количества пользователей. В первую очередь, автоматическое описание помогает людям с нарушениями зрения при работе с документами или веб-страницами, а также в целом позволяет получить доступ к содержимому любого изображения, к примеру, при поиске или подготовке презентаций.
МойОфис объявляет о релизе Mailion 2.2. Одна из главных его особенностей — обновленный, интуитивно понятный пользовательский интерфейс, помогающий ускорить выполнение основных задач. Обновление содержит улучшения в работе с цепочками писем, календарем, планированием встреч в мобильном приложении и миграцией почтовых ящиков
Группа компаний «Солар» и «Группа Астра» подтвердили совместимость комплексного решения для безопасной разработки приложений Solar appScreener и платформы для разработки GitFlic (компания «РеСолют»). Интеграция двух решений позволяет выстроить цикл DevSecOps с соблюдением требований ФСТЭК России, Банка России и других регуляторов рынка к программным продуктам
«Киберпротект» сообщает об обновлении продукта Кибер Бэкап Облачный. Востребованный на рынке облачный сервис резервного копирования, доступный пользователям многих российских провайдеров, получил новые возможности по направлениям кроссплатформенности, информирования и безопасности. Расширена поддержка российских и свободно распространяемых ОС, спектра СУБД на основе PostgreSQL, представлена поддержка сервисов Почта и Диск платформы VK WorkSpace, реализована интеграция с системами SIEM. Кибер Бэкап Облачный теперь способен с большей эффективностью защищать ИТ-инфраструктуру пользователей из самых разных отраслей с минимальными затратами на внедрение и поддержку
Системный интегратор и вендор «Айди-Технологии управления» и разработчик ИИ-решений для интеллектуальной обработки информации Content AI подтвердили совместимость работы ECM-платформы Documino c IDP-платформой ContentCapture®
Мошенники могут использовать эти данные для создания более убедительных схем обмана. Большинство детей (76%) указывают возраст в своих профилях в социальных сетях. Такие данные получила «Лаборатория Касперского» в ходе ежегодного опроса семей по всей стране.
«Лаборатория Касперского» совместно с Почта Mail и Hi-Tech Mail выяснили, как люди относятся к беспарольным способам авторизации — одноразовым и QR-кодам, использованию отпечатков пальца или скана лица и другим способам для входа в аккаунты
Мы используем куки (cookies) с целью повышения удобства вашей работы с сайтом.
Ваши контактные данные не публикуются на сайте.