TRAINING DATA
TRAINING DATA JORNAL  
Авторские статьи
Инструменты

Supervisely

Сфера аннотирования изображений постоянно развивается. Появляются новые решения, уже знакомые становятся точнее и эффективнее. Мы отслеживаем все изменения и используем в работе только проверенные инструменты разметки и аннотирования для компьютерного зрения с большим набором функций и активной техподдержкой. Сегодня представляем вам один из любимых — Supervisely.

Supervisely — универсальная платформа подготовки данных для задач Computer Vision, научной области, разрабатывающей компьютерные аналоги зрительной системы человека. Инструмент позволяет перейти от аннотации изображения и видео — выделение и разметка отдельных объектов — к обучению сверточной нейтронной сети (CNN) в 10 раз быстрее, чем аналоги. А также гарантирует конфиденциальность данных, широкие возможности настройки и простую интеграцию в любой технологический стек.

Что такое Computer Vision? Это процесс обучения искусственного интеллекта анализировать и распознавать визуальные образы. Без исходного набора данных компьютер не отличит машину от собаки. Чтобы научить его правильно работать с изображениями, специалисты собирают большие базы данных, из которых формируют датасеты. После их загрузки ИИ начинает сам распознавать нужные типы закономерностей и продолжает обучаться на новых наборах данных.
Supervisely изначально — продукт компании Deep Systems, основанной в 2013 году в России. Это был внутренний инструмент для разработки искусственного интеллекта: создания прототипов самоуправляемых автомобилей, системы распознавания поз человека и т. д. Deep Systems сделала его общедоступным в 2017 году.

Области применения Computer Vision

  • Распознавание текста. Вы загружаете фотографию или отсканированную страницу, программа находит и считывает слова и предложения, при необходимости реконструирует и дополняет — если, например, часть текста утеряна или буквы нечеткие. В 2023 году эта технология уже активно внедряется в государственных службах для автоматизации ручного труда и ускорения процесса обработки поступающих заявок.
  • Поиск похожих изображений по фото. По такой технологии работает, например, Яндекс. Вы просто загружаете картинку, а система выдает аналогичные варианты. Чтобы это осуществить, специалисты использовали многослойные самообучающиеся нейронные сети и большие датасеты с изображениями. По такой же логике работает и ChatGPT — нейронная сеть обучается «видеть и понимать» изображения для выдачи ответов по запросам пользователей.
  • Биометрия. В 2023 году термин Computer Vision тесно связывают с задачами распознавания лиц, ре-идентификации (сравнение фото из документов с реальным человеком) и различными системами безопасности. К ним относятся технологии Face ID на смартфонах, в банковских приложениях и автоматическое прохождение паспортного контроля.
  • Модерация изображений в сети. Технология компьютерного зрения позволяет выявлять и блокировать нежелательный контент без участия человека. Сегодня автоматическая модерация контента является неотъемлемой частью процесса работы маркетплейсов, площадок по продаже недвижимости, социальных сетей и видеохостингов.
  • Исследования космоса. Искусственный интеллект позволяет видеть то, что недоступно человеческому глазу. Так, например, в 2017 году алгоритмы нашли ранее не замеченную планету, вращающуюся вокруг звезды Кеплер-90.
  • Иструкция разрушенных объектов. Для задач исторической информатики или визуализации архитектурных решений алгоритмы Computer Vision позволяют превратить расчеты или сохранившийся фундамент в достоверные строения.
Кроме этого, Computer Vision можно использовать во множестве других областей. Например, в сельском хозяйстве — компьютер с помощью системы датчиков мгновенно проанализирует состояние почвы, температуру и будет поддерживать идеальные условия для созревания урожая. Сюда же автомобильная промышленность — например, беспилотные автомобили Tesla, компьютерная диагностика заболеваний и многое другое.

Как с этим связана Supervisely?

С помощью платформы специалисты в machine learning и большие команды могут создавать необходимые датасеты для обучения нейросетей передовых систем компьютерного зрения.
Supervisely позволяет:
  • Делать разметку изображений, видео и лидарных облаков.
  • Управлять процессом аннотирования изображений.
  • Готовить датасеты для обучения нейронных сетей.

Как проходит обучение?

Специалисты по разметке данных (data architects, или датасаентологи) собирают большие базы данных, которые затем объединяются в датасеты. На их основе алгоритмы нейронной сети обучаются распознавать заданные закономерности. Если результат недостаточно точный, то происходит процесс аугментации – добавления новых наборов данных и повторения процесса дообучения. Цель — научить ИИ самостоятельно принимать решения, давать ответ на запросы и выполнять задачи.

Сильные стороны Supervisely

  • Входит в список 500 крупнейших компаний мира Fortune 500.
  • Работает с 2017 года — дольше, чем большинство других аналогичных платформ.
  • Более 65 тысяч пользователей используют ее каждый день.
  • Содержит более 1 млрд разметок и 220 млн изображений, созданных сообществом.
  • Supervisely, в отличие от большинства других продуктов, позволяет пользователям создать собственную платформу с интеграцией многочисленных инструментов с открытым исходным кодом в единую экосистему.
В Supervisely Apps уже есть сотни готовых виджетов — добавляют новые функции в любую часть платформы. У всех открытый исходный код, доступны на GitHub: можно изменить существующее приложение или разработать новое. В Enterprise Edition поддерживаются закрытые репозитории Git для авторских приложений.
Принцип работы:
  • Визуальная часть интерактивного интерфейса создается в VueJS.
  • Взаимодействие с приложениями по API.
  • Бэкенд веб-приложений написан на Python.

Что можно делать в Supervisely?

В первую очередь, Supervisely — инструмент для разметки данных (Data labeling) изображений, видео и лидарных облаков. Разметка — это процесс присваивания тегов или классов каждому элементу, чтобы модель машинного обучения могла обучаться на примерах и анализировать информацию.
Наша компания использует не только Supervisely: это всего лишь один из десятков инструментов, с помощью которых мы решаем задачи клиентов. Выбор зависит от технического задания, его сложности, бюджета заказчиков и сроков. При получении ТЗ его оценивают наши эксперты: определяют масштаб работы, собирают команду, подбирают наиболее подходящие инструменты для разметки. Благодаря такому подходу 90 % наших проектов готовы раньше срока.