Новый российский алгоритм обучает ИИ вчетверо быстрее и на 40% качественнее
Лаборатория исследований искусственного интеллекта Tinkoff Research (TR) — это один из немногих исследовательских коллективов в РФ, которые справляются собственными силами, в рамках компании. На днях группа специалистов представила новый алгоритм для обучения ИИ-агентов. Метод назвали ReBRAC — это сокращение от англоязычного словосочетания, которое означает «пересмотренный актор-критик с контролируемым поведением».
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
Как утверждают в компании, новый алгоритм «натаскивает» ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов. Тестировали схему обучения на виртуальных роботах.
В TR рассказали о работе над новой методикой, что после ревизии известных алгоритмов уделили в них внимание четырём компонентам, которых ранее оценивались как менее значительные. Речь о так называемых глубине нейронных сетей, регуляризации актора и критика, увеличении эффективного горизонта планирования и использовании нормализации слоев.
Если более простыми словами, то исследователи достигли успеха за счёт умножения слоёв нейросети, благодаря чему она эффективнее воспринимает закономерности в данных. А обучение активного компонента ИИ происходит таким образом, чтобы он не предпринимал нежелательных действий. Также была важна способность предоставлять более эффективную обратную связь. Что касается упомянутого планирования, то его горизонт позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи. А задействованная нормализация слоёв сделала процесс обучения нейросетей устойчивее.
Результаты российского исследования алгоритма презентовали на 37-й конференции NeurIPS–2023 в США, которая проходила с 10 по 16 декабря в Новом Орлеане. Из 13 тыс. научных статей рецензенты отобрали для форума по машинному обучению и нейровычислениям 3500 работ, в том числе четыре исследования TR.
Об авторитетности конференции NeurIPS говорит тот факт, что идея её возникла ещё в 1986-м. Проводимую теперь каждый декабрь NeurIPS создавали как дополнительное открытое междисциплинарное совещание для изучающих биологические и искусственные нейросети.
Кроме описанного выше метода ReBRAC, россияне из TR продемонстрировали на экспертном форуме две общедоступные библиотеки для офлайн-обучения в помощь специалистам по развитию ИИ.
- Дмитрий Ладыгин
- pixabay.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Битва под Каневом: почему на 350 лет замолчали сокрушительную победу России?
Неудобная победа, предательство и идеология. Мы бы могли вообще не узнать об этом триумфе русского оружия...
Бомбы с орбиты: почему советская технология, воскрешенная Китаем, встревожила США?
Американцы слишком долго считали свои системы раннего предупреждения лучшими на планете. Теперь......
С Ноева ковчега сняли запрет: что покажут радары на Арарате?
История, которую больше всего высмеивали ученые, неожиданно становится все более реальной...
Дикий народ чучуна: Кто наводил ужас на коренное население Сибири?
Йети? Люди-изгои? Древнее племя? Пока что вопросов больше, чем ответов...
Почему их ДНК не меняется уже 42 000 лет: определен самый древний народ на планете
Три раза предки жителей Океании встречались с исчезнувшими видами людей, и это в корне изменило их гены...
Тайна «косого глаза» Венеры раскрыта: что увидела нейросеть на картинах Боттичелли?
Художник нарисовал пять портретов прекрасной Симонетты Веспуччи. И каждое полотно еще больше подтверждает страшный диагноз...
Мрачный прогноз для США из 1995 года сбылся: в чем великий ученый Саган оказался прав?
Исследователь говорил: все плохо, но еще не все потеряно. Его советы могут реально помочь всему человечеству...
Новая вселенная внутри звезды: почему Эйнштейн мог ошибаться насчет черных дыр
Больше 20 лет эта гипотеза в буквальном смысле раздирает мир науки. Но, возможно, именно она выведет ученых из тупика сингулярности...
Прорыв в астрономии: найти жизнь в космосе будет гораздо проще
Ученых не пугает даже погрешность в 20%. Зато будут просканированы тысячи планет...
Снегопады в Антарктиде становятся все аномальнее: и ученые, наконец-то, знают почему?
Ученым придется пересмотреть все климатические модели Шестого континента. Кстати, снега там будет выпадать с каждым годом все больше...
Марс под вопросом: что может обнулить иммунитет у космонавтов?
И почему защита организма перестает видеть микробы, выжившие в космосе?...
Тайный Еще одна тайна майя: археологи секрет алтаря в заброшенном городе
Выяснилось, что индейцы долгие столетия продолжали исповедовать, казалось бы, давно забытый древний культ...
43 — проклятый возраст Рюриковичей: почему многие князья не переживали этот роковой рубеж?
Генетики говорят: русская династия слишком поздно поняла, что попала в ловушку «чистой» крови...
Доказана жизнь на спутнике Юпитера: как же бактериям удалось добраться с Земли на Европу?
За 3,5 миллиарда лет земные бактерии могли долететь до 105 звездных систем. Так что у Европы есть все шансы на «заражение»...
Сначала Стоунхендж был... не каменным: найден прототип легендарного святилища
Доисторическая религия оказалась старше на 500 лет, чем считали ученые. И она играла огромную роль в жизни древних людей...
Бельгийскую разведку снова взломали: хакеры целый год качали оттуда секретные данные
Эксперты говорят: проникновение было замечено совершенно случайно. И это пугает...