Нейросеть научилась имитировать рукописный текст
Благодаря бесплатному веб-приложению под названием calligrapher.ai любой может имитировать рукописный ввод с помощью нейронной сети, работающей в браузере с помощью jаvascript. После ввода требуемого к изображению текста сайт отображает его как почерк в девяти различных стилях, каждый из которых настраивается с помощью таких свойств, как скорость, разборчивость и ширина штриха. Это также позволяет загрузить полученный образец искусственного почерка в векторном файле SVG.
Демонстрация особенно интересна тем, что в ней не используется предопределенный шрифт. Шрифты, которые выглядят как почерк, существуют уже более 80 лет, но каждая буква получается дубликатом, независимо от того, сколько раз вы ее напечатаете.
За последнее десятилетие ученые-компьютерщики ослабили эти ограничения, открыв новые способы имитации динамического разнообразия человеческого почерка с помощью нейронных сетей.
Веб-сайт Calligrapher.ai, созданный исследователем машинного обучения Шоном Васкесом, основан на исследовании, опубликованном в 2013 году Алексом Грейвсом из DeepMind. Первоначально Васкес создал сайт Calligrapher несколько лет назад, но недавно он привлек к себе больше внимания благодаря публикации на Hacker News.
Calligrapher.ai отображает каждую букву так, как если бы она была написана рукой человека, руководствуясь статистическими весами. Эти веса исходят от рекуррентной нейронной сети (RNN), которая была обучена в онлайн-базе данных по почерку IAM. База содержит образцы почерка 221 человека, оцифрованные с доски с учетом времени необходимого для написания. В результате модель синтеза почерка Calligrapher.ai в значительной степени настроена на англоязычное письмо, и люди в Hacker News упоминали о проблемах с воспроизведением диакритических знаков, которые обычно встречаются в других языках.
Поскольку алгоритм создания почерка носит статистический характер, его свойства, такие как «разборчивость», можно динамически регулировать. Васкес описал, как работает ползунок удобочитаемости, в комментарии к посту Hacker News.
— Шоном Васкес.
Сейчас, когда нейронные сети работают с текстом, речью , изображениями, видео, а теперь и с рукописным вводом, кажется, что ни один уголок человеческого творческого продукта не остался вне досягаемости генеративного ИИ.
В 2018 году Васкес показал базовый код, лежащий в основе демонстрации веб-приложения, на GitHub, чтобы его можно было адаптировать к другим приложениям. В правильном контексте это может быть полезно для графических дизайнеров, которым нужно больше изящества, чем статический рукописный шрифт.
Демонстрация особенно интересна тем, что в ней не используется предопределенный шрифт. Шрифты, которые выглядят как почерк, существуют уже более 80 лет, но каждая буква получается дубликатом, независимо от того, сколько раз вы ее напечатаете.
За последнее десятилетие ученые-компьютерщики ослабили эти ограничения, открыв новые способы имитации динамического разнообразия человеческого почерка с помощью нейронных сетей.
Веб-сайт Calligrapher.ai, созданный исследователем машинного обучения Шоном Васкесом, основан на исследовании, опубликованном в 2013 году Алексом Грейвсом из DeepMind. Первоначально Васкес создал сайт Calligrapher несколько лет назад, но недавно он привлек к себе больше внимания благодаря публикации на Hacker News.
Calligrapher.ai отображает каждую букву так, как если бы она была написана рукой человека, руководствуясь статистическими весами. Эти веса исходят от рекуррентной нейронной сети (RNN), которая была обучена в онлайн-базе данных по почерку IAM. База содержит образцы почерка 221 человека, оцифрованные с доски с учетом времени необходимого для написания. В результате модель синтеза почерка Calligrapher.ai в значительной степени настроена на англоязычное письмо, и люди в Hacker News упоминали о проблемах с воспроизведением диакритических знаков, которые обычно встречаются в других языках.
Поскольку алгоритм создания почерка носит статистический характер, его свойства, такие как «разборчивость», можно динамически регулировать. Васкес описал, как работает ползунок удобочитаемости, в комментарии к посту Hacker News.
Форма линии выбирается на основе распределения вероятностей, и повышение удобочитаемости эффективно концентрирует плотность вероятностей вокруг более распространенных результатов. Так что вы правы, утверждая, что это просто изменение параметров вариации. Общий метод назван «регулировкой температуры выборочного распределения»
— Шоном Васкес.
Сейчас, когда нейронные сети работают с текстом, речью , изображениями, видео, а теперь и с рукописным вводом, кажется, что ни один уголок человеческого творческого продукта не остался вне досягаемости генеративного ИИ.
В 2018 году Васкес показал базовый код, лежащий в основе демонстрации веб-приложения, на GitHub, чтобы его можно было адаптировать к другим приложениям. В правильном контексте это может быть полезно для графических дизайнеров, которым нужно больше изящества, чем статический рукописный шрифт.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Странное поведение Трампа с Ираном получило четкое научное объяснение
По словам математиков, конфликт в Ормузском проливе — это классическая война на истощение, в которой США точно не победить...
Ледяные глубины Антарктиды заговорили: как спустя 64 года сбылось предсказание советского физика
Наш ученый мог получить Нобелевскую премию, но его «обошел» американец...
Клад, за которым никто не пришел: давно в России не находили столько золота зараз
Кто же был владельцем сокровищ? Священник? Купец? Казначей? Бухгалтер? Расследование продолжается...
Сканирование мозга неандертальцев преподнесло сюрприз, который в корне рушит многие старые теории
Почему ученые пришли к выводу, что Homo neanderthalensis вовсе и не вымирали?...
Что делали американские летчики в 1942 году на секретной даче под Пензой?
Через 80 с лишним лет Госархив рассказал о неизвестном эпизоде Второй мировой войны...
Николай Некрасов: тайна последней болезни. Могли ли вылечить великого поэта?
Почему не помогли даже 45 миллионов рублей? Что думают современные врачи?...
Зачем москвичи массово глотали монеты? Археологи рассказали, почему этот уникален «ритуал» был характерен только для российской столицы
Разгадка оказалась настолько простой, что ученые далеко не сразу приняли ее...
В пирамиде Микерина обнаружены два тайных помещения: это показали сразу три разных прибора
Археологи из ScanPyramids ждут официального разрешения от египетских властей, чтобы обнародовать полную информацию...
Почему интернет в России скоро подорожает? А главное, кто за это заплатит?
Эксперты говорят: уже через пару-тройку лет мы будем с ностальгией вспоминать дешевые тарифы...
Александр Суворов — тайный… агент: зачем русский полководец проник в масонскую ложу?
Историки говорят: это была великолепная шпионская игра, и Суворов сыграл ее виртуозно...