ИИ научили распознавать, из чего сделаны тысячи предметов
Роботу, который, скажем, орудует на кухне, будет полезно понимать, какие предметы состоят из одних и тех же материалов. При верном выборе робот не ошибётся, если возьмёт небольшой кусочек масла из тёмного уголка или целую пачку из ярко освещённого холодильника.
Идентификация объектов с одинаковым составом, то есть выбор материала, — особенно сложная задача для машин, поскольку внешний вид предметов может сильно отличаться в зависимости от их формы или освещения. Учёные из Массачусетского технологического института (MIT) и компании Adobe Research сделали большой шаг к решению этой проблемы. Они разработали метод, который может идентифицировать все пиксели на изображении того или иного материала по маленькому участку, выбранному пользователем.
Модель обучали только на данных компьютера, который преобразовал объёмные интерьеры для получения различных изображений. В итоге система эффективно работает с реальностью внутри и снаружи помещений, которую она прежде не видела. Подход также годится для видеороликов: как только пользователь идентифицирует точку в первом кадре, модель может идентифицировать объекты из того же материала на протяжении остального видео. Кроме распознавания окружающей обстановки роботами, метод подойдёт также для редактирования изображений или в вычислительных системах, которым важны параметры материалов. Систему также можно использовать для рекомендаций клиентам: возможно, покупатель ищет одежду из определённого типа ткани.
Но как быть, если речь идёт, к примеру, о мебели из разных материалов? В таком случае машинное обучение оценивает все пиксели изображения, сверяя материал между выбранным пользователем участком и всеми другими областями изображения. Если на картинке стол и два стула, и ножки стула и столешница из одной и той же древесины, модель способна точно идентифицировать похожие участки.
Прежде чем исследователи смогли разработать метод ИИ, позволяющий научиться выбирать похожие материалы, пришлось преодолеть несколько препятствий. Так, не хватало точного набора образцов. Тогда разработчики отрисовали свой собственный набор данных об интерьерах, который включал 50 тысяч изображений и более 16 тыс. материалов, соотнесённых с каждым объектом.
— Прафул Шарма, аспирант кафедры электротехники и компьютерных наук и ведущий автор научной статьи.
Имея набор данных, учёные стали учить модель сличать похожие материалы на реальных примерах, но… безуспешно. Исследователи поняли, что виноват сдвиг распределения, то есть разница между виртуальным и реальностью из-за отличий от обучающего набора. Чтобы решить эту проблему, они настроили модель на предварительно подготовленной, которая видела миллионы реальных изображений.
Итоговая модель преобразует общие визуальные характеристики в специфичные для материала, и делает это вне зависимости от форм объектов или различным условиям освещения. Затем система может вычислить показатель сходства материалов для каждого фрагмента изображения. Когда пользователь выбирает точку, модель определяет, насколько близок к запросу каждый другой участок. Система создаёт карту, где каждый пиксель ранжирован по шкале от 0 до 1 для определения сходства.
Поскольку модель выдаёт оценку сходства для каждого пикселя, пользователь может точно настроить результаты, установив пороговое значение, например, о сходстве на 90%, и получить карту изображения с выделенными областями. Метод также работает для перекрёстного выбора изображений: можно выбрать пиксель на одном изображении и найти тот же материал на другом.
В ходе экспериментов выяснилось, что полученная модель может предсказывать области изображения, содержащие тот же материал, более точно, чем другие методы. Когда разработчики измерили, насколько хорошо предсказание соответствует действительности, то есть фактическим областям изображения из одного и того же материала, их модель сработала с точностью около 92%.
Уже есть планы усовершенствовать новинку, чтобы она могла лучше распознавать мелкие детали объектов. Участница научной работы Кавита Бала, декан колледжа вычислительной техники и информатики и профессор компьютерных наук, пояснила, что технология может очень пригодиться тем же дизайнерам. Например, владелец дома может представить, как могут выглядеть дорогостоящие варианты обивки дивана или коврового покрытия перед их покупкой.
Идентификация объектов с одинаковым составом, то есть выбор материала, — особенно сложная задача для машин, поскольку внешний вид предметов может сильно отличаться в зависимости от их формы или освещения. Учёные из Массачусетского технологического института (MIT) и компании Adobe Research сделали большой шаг к решению этой проблемы. Они разработали метод, который может идентифицировать все пиксели на изображении того или иного материала по маленькому участку, выбранному пользователем.
Модель обучали только на данных компьютера, который преобразовал объёмные интерьеры для получения различных изображений. В итоге система эффективно работает с реальностью внутри и снаружи помещений, которую она прежде не видела. Подход также годится для видеороликов: как только пользователь идентифицирует точку в первом кадре, модель может идентифицировать объекты из того же материала на протяжении остального видео. Кроме распознавания окружающей обстановки роботами, метод подойдёт также для редактирования изображений или в вычислительных системах, которым важны параметры материалов. Систему также можно использовать для рекомендаций клиентам: возможно, покупатель ищет одежду из определённого типа ткани.
Но как быть, если речь идёт, к примеру, о мебели из разных материалов? В таком случае машинное обучение оценивает все пиксели изображения, сверяя материал между выбранным пользователем участком и всеми другими областями изображения. Если на картинке стол и два стула, и ножки стула и столешница из одной и той же древесины, модель способна точно идентифицировать похожие участки.
Прежде чем исследователи смогли разработать метод ИИ, позволяющий научиться выбирать похожие материалы, пришлось преодолеть несколько препятствий. Так, не хватало точного набора образцов. Тогда разработчики отрисовали свой собственный набор данных об интерьерах, который включал 50 тысяч изображений и более 16 тыс. материалов, соотнесённых с каждым объектом.
Нам нужен был набор данных, в котором каждый тип материала был бы отмечен в отдельности
— Прафул Шарма, аспирант кафедры электротехники и компьютерных наук и ведущий автор научной статьи.
Имея набор данных, учёные стали учить модель сличать похожие материалы на реальных примерах, но… безуспешно. Исследователи поняли, что виноват сдвиг распределения, то есть разница между виртуальным и реальностью из-за отличий от обучающего набора. Чтобы решить эту проблему, они настроили модель на предварительно подготовленной, которая видела миллионы реальных изображений.
Итоговая модель преобразует общие визуальные характеристики в специфичные для материала, и делает это вне зависимости от форм объектов или различным условиям освещения. Затем система может вычислить показатель сходства материалов для каждого фрагмента изображения. Когда пользователь выбирает точку, модель определяет, насколько близок к запросу каждый другой участок. Система создаёт карту, где каждый пиксель ранжирован по шкале от 0 до 1 для определения сходства.
Поскольку модель выдаёт оценку сходства для каждого пикселя, пользователь может точно настроить результаты, установив пороговое значение, например, о сходстве на 90%, и получить карту изображения с выделенными областями. Метод также работает для перекрёстного выбора изображений: можно выбрать пиксель на одном изображении и найти тот же материал на другом.
В ходе экспериментов выяснилось, что полученная модель может предсказывать области изображения, содержащие тот же материал, более точно, чем другие методы. Когда разработчики измерили, насколько хорошо предсказание соответствует действительности, то есть фактическим областям изображения из одного и того же материала, их модель сработала с точностью около 92%.
Уже есть планы усовершенствовать новинку, чтобы она могла лучше распознавать мелкие детали объектов. Участница научной работы Кавита Бала, декан колледжа вычислительной техники и информатики и профессор компьютерных наук, пояснила, что технология может очень пригодиться тем же дизайнерам. Например, владелец дома может представить, как могут выглядеть дорогостоящие варианты обивки дивана или коврового покрытия перед их покупкой.
- Дмитрий Ладыгин
- prafullsharma.net
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Раскрыта главная тайна антарктического льда: ученые узнали, как и кем была взломана природная защита Шестого континента
Похоже, той Антарктиде, которую мы знаем, приходит конец. Впрочем, это не точно...
Древнеримский артефакт переписывает историю Америки: Колумб был не первым?
Почему находка из индейской могилы почти 100 лет вызывает ожесточенные споры среди археологов и историков?...
Тайна гибели сибирского «Титаника»: почему некоторые детали катастрофы 1921 года неизвестны даже сейчас?
Поразительно, но тогда судьи единогласно оправдали капитана парохода. Так кто же тогда был виновником этого страшного происшествия?...
Японец 26 лет ждал, пока раскроют убийство его жены. Часть 2. Расплата
Как наука отменила срок давности у преступления? И какая тайна осталась не раскрытой?...
Еще раз об убийстве Андрея Боголюбского: что рассказали кости погибшего князя?
Профессор судебной медицины поправил историков и выявил неточности древних летописей...
Японец 26 лет ждал, пока раскроют убийство его жены
Как новейшие технологии помогли сдвинуть с места нераскрываемое дело...
Главный секрет человеческого дыхания: ученые рассказали, почему мы дышим «вахтовым методом»
Эксперты предупреждают: из-за особенности организма многие люди не смогут попасть в космос. Но решение все-таки есть...
Жители Анд переписали свою ДНК: почему горные индейцы пьют ядовитую воду, но чувствуют себя при этом хорошо?
По словам ученых, эволюция сделала красивый и хитрый ход. И это не иммунитет к токсинам, а нечто другое, более интересное...
43 000 черепков открыли тысячелетние тайны Древнего Египта
Почему глиняная библиотека Атрибиса потрясла весь археологический мир?...
Ядерный взрыв на Луне: для чего советские ученые хотели провести такой грандиозный эксперимент?
Зачем России атомный реактор на Луне и как он поможет нам добраться до Венеры?...
Почему эти меры не спасут Антарктиду: пять проектов по спасению ледников оказались провалом
Эксперт жестко проанализировал самые популярные программы по сохранению льда на Шестом континенте. Увы, они оказались невыполнимой фантастикой, причем опасно...