Новый российский алгоритм обучает ИИ вчетверо быстрее и на 40% качественнее
Лаборатория исследований искусственного интеллекта Tinkoff Research (TR) — это один из немногих исследовательских коллективов в РФ, которые справляются собственными силами, в рамках компании. На днях группа специалистов представила новый алгоритм для обучения ИИ-агентов. Метод назвали ReBRAC — это сокращение от англоязычного словосочетания, которое означает «пересмотренный актор-критик с контролируемым поведением».
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
- Дмитрий Ладыгин
- pixabay.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Загадочный взрыв над Москвой: зачем NASA срочно удалило все данные об объекте 2025 US6?
И почему эксперты говорят, что мы никогда не узнаем правды?...
В России обнаружена рыба, которая 70 лет считалась полностью вымершей
И не единственная такая сенсация в нашей стране за последние годы...
Российские ученые создали уникальный материал будущего: новый металл прочнее любой стали, но дешевле даже алюминия
Мир высоких технологий ждал этого открытия десятилетия. Наша страна получила реальный шанс стать лидером металлургии...
«Парящие» берлоги: Как треугольные дома помогут России удержать Арктику
Кто победит? Глобальное изменение климата или новые технологии?...
1300 лет назад неизвестные грабители вскрыли гробницу знатного воина, но вообще не тронули сокровищ. Почему?
Венгерские археологи уверены, что разгадали этот мистический детектив. Но так ли это на самом деле?...
Тающий лед Антарктиды прячет от нас глубинную «бомбу» замедленного действия
Неожиданный климатический парадокс: малая беда хранит человечество от большой. Но это ненадолго...
Россия снова первая: в космосе вырастили идеальные кристаллы!
Рассказываем, почему проект «Экран-М» может стать началом новой эры полупроводников, где Россия будет ведущей в мире...
Какие тайны скрывает 40 000-летний... карандаш, найденный в одной из пещер Крыма?
И почему ученые уверены, что эта находка заставляет в корне пересмотреть древнейшую историю человечества?...
«Инопланетный зонд», который преследует Землю, был сделан… в СССР?
Почему известный гарвардский астроном выдвинул именно эту версию?...
Тайна изумрудной мумии, не дававшей покоя ученым 38 лет, наконец-то разгадана!
Ученые признаются: они не ожидали, что им придется раскрыть самый настоящий химический детектив...
Эксперимент показал, что на самом деле творится под марсианскими дюнами каждую весну
Оказалось, что с наступлением тепла на Красной планете активизируются... ледяные «кроты»...
Ученые из Хьюстона рассказали, почему Земля и другие планеты умудрились не сгореть в недрах молодого Солнца
Как оказалось, Солнечную систему в буквальном смысле спас Юпитер, который решительно выступил против гравитационного диктата звезды...