Что такое
«Компьютерное зрение (Computer Vision)»?
Компьютерное зрение (Computer
Vision, CV) — это область искусственного интеллекта, связанная с анализом
изображений и видео. Она включает в себя набор методов, которые наделяют
компьютер способностью «видеть» и извлекать информацию из увиденного.
Системы состоят из фото- или видеокамеры и специализированного программного
обеспечения, которое идентифицирует и классифицирует объекты. Они способны
анализировать образы (фотографии, картинки, видео, штрих-коды), а также
лица и эмоции.
Чтобы научить компьютер «видеть», используются технологии машинного обучения.
Собирается множество данных, которые позволяют выделить признаки и комбинации
признаков для дальнейшей идентификации похожих объектов.
Основные направления компьютерного зрения (computer vision)
1) Системы распознавания
Распознавание лиц:
Технология, сопоставляющая лицо
человека с существующей базой данных с помощью алгоритмов компьютерного
зрения, включает в себя следующие этапы:
- Детектирование людей на фото и
видео;
- Верификация и идентификация
лиц;
- Определение дополнительных
характеристик.
Распознавание лиц может применяться на практике для:
- Распознавания сотрудника по
лицу (разблокировка компьютера и учет рабочего времени);
- Аутентификация по лицу в
банковских приложениях;
- Поиск преступников в метро по
лицу;
- Поиск страниц в соцсетях по
фотографии человека;
- Авторизация сотрудников;
- Борьба с мошенничеством.
Распознавание объектов и силуэтов
- Детектирование силуэтов на
видео
- Отслеживание перемещения
силуэтов
- Кросс-камерная идентификация
Распознавание автомобиля и номера
- Детектирование автомобилей и
распознавание номеров на видео
- Распознавание признаков
автомобиля
Распознавание активности
- Распознавание активности часто применяется на производстве, для предотвращения опасных ситуаций (реальная задача с хакатона – производная от отслеживания объектов на видео - распознавание активности поросят, если начинают быстро перемещаться, то нужно вызвать оператора)
2) Обнаружение и отслеживание объектов на
видео
Данная задача является производной
задачи детекции, и, возможно, сегментации (детекция + сегментация = instance
segmentation). Реальные задачи:
- Системы наведения;
- Система отслеживания движений
поросят (задача с хакатона).
Гепространственная аналитика
Обработка спутниковых снимков с
целью обнаружения на них искомых объектов.
Может применяться в военной отрастил
для автоматического поиска военной техники.
3) Оценка позы (pose estimation)
Примером применения могут служить
системы помощи тренеру (анализ правильности выполнения упражнений).
Задачи
компьютерного зрения (computer vision)
1) Классификация
Классификация - самая базовая задача компьютерного
зрения. Цель классификации – определить, что находится на картинке. Например,
нейронная сеть для задачи классификации позволяет определить кошка на
изображении или собака, по снимку гриба определить его название (было такое
приложение на мобильные устройства), по снимку ствола яблони (видел такую
задачу на хакатоне) определить больна ли она, по снимку человека определить в
маске он или нет.
2) Сегментация
Сегментация является по сути продвинутым видом классификации,
ее цель – определить класс каждого пикселя изображения. Сегментация часто
применяется для обработки медицинский снимков (позволяет обнаруживать опухоль).
Примером применения сегментации также может служить определение типов предметов
на сканере в метро, аэропорту, на вокзале. https://biganto.com эта компания использует нейронные сети для
подсветки выбранных элементов интерьера (навел на стул – он выделился, нашелся
в базе, всплыла информация). Также сегментация применяется для обработки
спутниковых снимков (реальная задача – по спутниковым снимкам сегментировать
айсберги и определять их классы).
3) Детекция
(обнаружение объектов)
Цель детекции определить координаты объекта на изображении
и его класс.
Сферы
применения компьютерного зрения (сomputer vision)
Многолетний опыт разработки систем искусственного
интеллекта гарантирует повышение эффективности, сокращение расходов и
автоматизацию рутинных задач при внедрении Computer vision в процессы
компаний различных сфер бизнеса:
- Заводы и фабрики;
- Розничные сети;
- Торговые центры;
- Гостиницы;
- Банки;
- Компании FMCG, Fashion;
- Девелоперы;
- Рестораны;
- Офисы;
- Транспортная логистика;
- Конференции;
- Диспетчерские службы.
Компьютерное зрение сейчас активно используют в
робототехнике, в беспилотных автомобилях, в диагностике и телемедицине, в
распознавании онкозаболеваний, при построении 3D-моделей производственных
площадок, с его помощью тестируют биометрические способы оплаты во многих
странах мира и много чего еще:
- Умный город (автоматическая система фиксации инцидентов на
дорогах и повышение скорости реагирования при их возникновении,
распознавание номеров автомобилей, обнаружение дефектов дорожного полотна
и дорожных знаков, мониторинг очистки снега и вывоза мусора);
- OCR (распознавание различных документов, таких как паспорт,
водительское удостоверение и других, с целью автоматизации обработки
информации о пользователях и сокращения количества сотрудников в штате);
- Ритейл (мониторинг состояние торговых залов и складских помещений для
автоматизации обнаружения событий, требующих вмешательства сотрудников, с
целью повышения качества обслуживания клиентов);
- Спортивные системы (системы мониторинга матчей для прогнозирования
результатов, системы помощи тренерам для контроля качества выполнения
упражнений, с целью повышения результативности тренировок);
- Военный сектор (автоматические системы дешифрирования спутниковых снимков, интеллектуальные системы захвата и ведения целей).
НПЦ «БизнесАвтоматика» представляет
собственную платформу для работу с технологиями Computer Vision - Visary
AI.
Платформа выступает технологической базой для
реализации крупномасштабных и комплексных проектов государственного и
коммерческого уровня.
Платформа для работы с искусственным интеллектом Visary
AI позволяет решать задачи Deep
learning в части компьютерного зрения (CV) и NLP с минимальным объемом данных,
а также обеспечивает оперативное развертывание моделей
нейросетей. Благодаря этому организации могут экономить время и
ресурсы на внедрение и дальнейшее развитие проектов по искусственному
интеллекту.
Самообучающаяся система искусственного интеллекта
позволяет бизнес-пользователям оперативно создавать,
импортировать/экспортировать, обучать и тестировать нейронные сети.