
Новый российский алгоритм обучает ИИ вчетверо быстрее и на 40% качественнее
Лаборатория исследований искусственного интеллекта Tinkoff Research (TR) — это один из немногих исследовательских коллективов в РФ, которые справляются собственными силами, в рамках компании. На днях группа специалистов представила новый алгоритм для обучения ИИ-агентов. Метод назвали ReBRAC — это сокращение от англоязычного словосочетания, которое означает «пересмотренный актор-критик с контролируемым поведением».
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
- Дмитрий Ладыгин
- pixabay.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Еще раз о ядерной войне на Марсе
Гипотетический конфликт на Красной планете не дает покоя некоторым ученым....

Выяснилось, что суша вокруг Аральского моря... стремительно поднимается
И ученые сумели разгадать эту удивительную загадку природы....

Причина необъяснимых нападений морских львов на людей наконец-то раскрыта
Все дело в редком токсине, который заполонил прибрежные воды Калифорнии....

Ужасное наводнение создало Средиземное море всего за несколько месяцев
Потоп мчался со скоростью 115 километров в час....

В каменных гробницах древней Ирландии похоронены вовсе не те, о ком думали ученые
Генетический анализ переписывает историю неолита....

Властелины огня: как древние люди поддерживали пламя в самые холодные времена
Основным топливом была древесина ели....

Термоядерный двигатель доставит людей до Марса всего за три месяца
Новая эра космических исследований вот-вот начнется?...

А фиолетовый-то, говорят… ненастоящий!
Ученые доказали, что этот цвет — иллюзия, существующая лишь у нас в голове....

Общий наркоз стирает уникальность головного мозга
Открытие поможет выводить пациентов из комы....

Стало известно, как Земля «выкачала» воду с обратной стороны Луны
Сенсацию принес аппарат китайской миссии «Чанъэ-6»....

Новое исследование показало: мягкие игрушки — самые опасные вещи в доме
Микробов в этих предметах оказалось вдвое больше, чем на сиденье унитаза....

Застукали: антарктического гигантского кальмара впервые запечатлели в естественной среде
Прошёл век после открытия вида....

Ещё одна бесценная находка: челюсть с берегов Тайваня принадлежала денисовцу
Загадка не давала покоя несколько лет....

Раскрыт секрет: почему самые древние метеориты не долетают до Земли
Против само Солнце, но это не единственная причина....

Зачем археологи измерили и сравнили размеры 50 000 древних домов
Общественное расслоение нельзя считать неизбежным....

Ученые заставили человеческий глаз видеть совершенно новый цвет
Он называется оло, и его практически не описать словами....