
Новый российский алгоритм обучает ИИ вчетверо быстрее и на 40% качественнее
Лаборатория исследований искусственного интеллекта Tinkoff Research (TR) — это один из немногих исследовательских коллективов в РФ, которые справляются собственными силами, в рамках компании. На днях группа специалистов представила новый алгоритм для обучения ИИ-агентов. Метод назвали ReBRAC — это сокращение от англоязычного словосочетания, которое означает «пересмотренный актор-критик с контролируемым поведением».
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
- Дмитрий Ладыгин
- pixabay.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Специалисты предупреждают: ни в коем случае не ставьте MAX на личный телефон!
Рассказываем, почему навязываемый россиянам мессенджер удобен в первую очередь мошенникам...

26 ран и 750 лет молчания: Анализ ДНК раскрыл тайну очень жестокого убийства русского князя в Будапеште
Международная команда ученых сумела на 100% доказать личность погибшего...

Ученые наконец-то раскрыли тайну происхождения гигантских волн-убийц
Расследование продолжалось долгих 18 лет. Теперь о старых теориях можно навсегда забыть...

Ученые подтверждают: Человеческое сознание может перемещаться во времени
А интуиция — воспоминание о будущем. Это доказали секретные эксперименты в ЦРУ...

Астрофизики были поражены, обнаружив «тоннель», соединяющий Солнечную систему с другими звездами
Исследователи из Института Макса Планка уверены: гигантская «транспортная сеть» охватывает всю нашу Галактику...

Работу самой мощной АЭС в Европе полностью парализовали… обычные медузы
Эксперты говорят: это очередное подтверждение того, что энергетика ЕС — это колосс на глиняных ногах...

Полная расшифровка ДНК хатыстырского человека выявила древнюю колыбель человечества в России
Геном охотника, жившего 9 800 лет назад, полностью подтвердил теорию российских ученых, которую мир не принимал десятилетиями...

В воде замечена амеба, пожирающая мозг. Смертельная опасность — 97%!
Такое шокирующее предупреждение получили жители сразу двух австралийских городов...