
Новый российский алгоритм обучает ИИ вчетверо быстрее и на 40% качественнее
Лаборатория исследований искусственного интеллекта Tinkoff Research (TR) — это один из немногих исследовательских коллективов в РФ, которые справляются собственными силами, в рамках компании. На днях группа специалистов представила новый алгоритм для обучения ИИ-агентов. Метод назвали ReBRAC — это сокращение от англоязычного словосочетания, которое означает «пересмотренный актор-критик с контролируемым поведением».
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
- Дмитрий Ладыгин
- pixabay.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

NASA объявило: Найдены самые убедительные доказательства существования жизни на Марсе
Ученые тем временем выясняют, как могли выглядеть древние жители Красной планеты...

16-тонный саркофаг, заполненный сокровищами, может подтвердить одну из самых таинственных и кровавых легенд древнего Китая
Какой секрет хранила эта гробница, что оставалась единственной нетронутой два тысячелетия?...

Ученый утверждает: у него есть доказательства, что мы живем в матрице
По словам Мелвина Вопсона, подсказки он нашел в ДНК, расширении Вселенной и фундаментальных законах физики...

Новая операция по объединению людей и животных может подарить… вечную жизнь
Медики признаются: уже сейчас можно сделать новое тело человека. Но один орган пока не поддается науке...

Выяснилось, что полное восстановление озонового слоя закончится глобальной катастрофой
Как так вышло, что в борьбе за экологию человечество сделало себе еще хуже?...

Оказывается, решение проблемы выбоин на дорогах существует уже почти 100 лет
Почему технология, забытая полвека назад, возвращается и становится очень популярной?...

Разгадка феномена «копченых» мумий может переписать древнейшую историю человечества
Поразительно: этот погребальный обычай, возможно, используют уже 42 000 лет подряд!...

Не украли, а «присвоили»: историки выяснили, как и откуда семья Марко Поло раздобыла главный символ Венеции
Данные, полученные из «ДНК» льва святого Марка, помогли распутать детектив длиной в 700 лет...

К 2035 году сектор Газа должен стать… самым продвинутым регионом на планете под управлением ИИ
По словам экспертов, в дерзком эксперименте за 100 млрд долларов есть только один большой вопрос: Куда выселить местное население?...

Каждый год, как расписанию, на Марсе образуется странное облако
Долгое время ученые не могли разгадать эту аномалию, но теперь ответ наконец-то найден!...