Нейросеть научилась имитировать рукописный текст
265

Нейросеть научилась имитировать рукописный текст

Благодаря бесплатному веб-приложению под названием calligrapher.ai любой может имитировать рукописный ввод с помощью нейронной сети, работающей в браузере с помощью jаvascript. После ввода требуемого к изображению текста сайт отображает его как почерк в девяти различных стилях, каждый из которых настраивается с помощью таких свойств, как скорость, разборчивость и ширина штриха. Это также позволяет загрузить полученный образец искусственного почерка в векторном файле SVG.


Демонстрация особенно интересна тем, что в ней не используется предопределенный шрифт. Шрифты, которые выглядят как почерк, существуют уже более 80 лет, но каждая буква получается дубликатом, независимо от того, сколько раз вы ее напечатаете.
За последнее десятилетие ученые-компьютерщики ослабили эти ограничения, открыв новые способы имитации динамического разнообразия человеческого почерка с помощью нейронных сетей.

Веб-сайт Calligrapher.ai, созданный исследователем машинного обучения Шоном Васкесом, основан на исследовании, опубликованном в 2013 году Алексом Грейвсом из DeepMind. Первоначально Васкес создал сайт Calligrapher несколько лет назад, но недавно он привлек к себе больше внимания благодаря публикации на Hacker News.

Calligrapher.ai отображает каждую букву так, как если бы она была написана рукой человека, руководствуясь статистическими весами. Эти веса исходят от рекуррентной нейронной сети (RNN), которая была обучена в онлайн-базе данных по почерку IAM. База содержит образцы почерка 221 человека, оцифрованные с доски с учетом времени необходимого для написания. В результате модель синтеза почерка Calligrapher.ai в значительной степени настроена на англоязычное письмо, и люди в Hacker News упоминали о проблемах с воспроизведением диакритических знаков, которые обычно встречаются в других языках.

Поскольку алгоритм создания почерка носит статистический характер, его свойства, такие как «разборчивость», можно динамически регулировать. Васкес описал, как работает ползунок удобочитаемости, в комментарии к посту Hacker News.

Форма линии выбирается на основе распределения вероятностей, и повышение удобочитаемости эффективно концентрирует плотность вероятностей вокруг более распространенных результатов. Так что вы правы, утверждая, что это просто изменение параметров вариации. Общий метод назван «регулировкой температуры выборочного распределения»

— Шоном Васкес.

Сейчас, когда нейронные сети работают с текстом, речью , изображениями, видео, а теперь и с рукописным вводом, кажется, что ни один уголок человеческого творческого продукта не остался вне досягаемости генеративного ИИ.

В 2018 году Васкес показал базовый код, лежащий в основе демонстрации веб-приложения, на GitHub, чтобы его можно было адаптировать к другим приложениям. В правильном контексте это может быть полезно для графических дизайнеров, которым нужно больше изящества, чем статический рукописный шрифт.
Наши новостные каналы

Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.

Рекомендуем для вас