Как Hasty использует автоматизацию и быструю обратную связь для обучения моделей ИИ

Компьютерное зрение становится всё важнее для различных промышленных сфер, от слежения за строительными работами до реализации умного сканирования штрих-кодов на складах. Однако обучение искусственного интеллекта точному распознаванию изображений может быть медленным и затратным трудом, не гарантирующим результаты. Молодой немецкий стартап Hasty стремится помочь в решении этой задачи, обещая предоставить инструменты нового поколения, способные ускорить весь процесс аннотирования изображений для обучаемой модели.

Основанный в 2019 году в Берлине Hasty заявляет сегодня, что ему удалось получить 3,7 миллиона долларов в первом раунде финансирования, проведённом Shasta Ventures. Эта венчурная фирма из Кремниевой долины провела уже множество значимых выводов: Nest (куплен Google), Eero (куплен Amazon) и Zuora (IPO). Другими участниками раунда стали iRobot Ventures и Coparion.

Всемирный рынок компьютерного зрения достиг в 2020 году уровня в 11,4 миллиарда долларов. Согласно прогнозам, это число вырастет к 2027 году до более чем 19 миллиардов. Подготовка и обработка данных — одна из самых затратных по времени задач в сфере ИИ, она занимает в связанных с ним проектах примерно 80% времени. В области компьютерного зрения под аннотированием, или разметкой, подразумевается техника, используемая для маркировки и категоризации изображений с целью предоставления машинам значения и контекста изображения, что позволяет им находить схожие объекты. Основную часть работы по аннотированию приходится выполнять людям.

Hasty стремится решить следующую проблему: подавляющее большинство проектов data science никогда не выходит в продакшен, а в процессе их подготовки тратятся значительные ресурсы.

«Современные подходы к разметке данных слишком медленны», — сообщил нам сооснователь и CEO Hasty Тристан Руиллар. «Инженеры машинного обучения часто вынуждены ждать первых результатов по три-шесть месяцев, чтобы проверить работоспособность их стратегии и методики аннотирования. Причиной этого является задержка между разметкой и обучением моделей».

Ускоряемся

Hasty имеет 10 встроенных автоматизированных ИИ-помощников, каждый из которых предназначен для снижения объёмов работы человека. Dextr, например, позволяет пользователям нажать всего на четыре крайних точки объекта, чтобы выделить его и предложить аннотации.

А ИИ-помощник Hasty «instance segmentation» ускоряет аннотирование, находя несколько экземпляров объекта на изображении.

Помощник наблюдает за тем, как выполняют аннотирование пользователи, и достигнув определённого показателя достоверности, может предлагать метки. А пользователь может корректировать эти предложения, чтобы улучшать модель, получая обратную связь об уровне эффективности стратегии аннотирования.

«Это даёт нейросети кривую обучения — в процессе разметки проекта людьми она учится», — рассказывает Руиллар.

Уже существует множество инструментов, предназначенных для упрощения этого процесса, в том числе Amazon SageMaker, поддерживаемый Google Labelbox, V7 и Dataloop, объявивший о новом раунде финансирования на 11 миллионов долларов.

Однако Hasty заявляет, что благодаря сочетанию автоматизации, обучения моделей и аннотирования может сделать весь процесс гораздо быстрее.

Как и другие похожие платформы, Hasty использует интерфейс, через который могут взаимодействовать люди и машины. Hasty может создавать рекомендации аннотаций, изучив всего несколько аннотированных людьми изображений, а пользователь (например, инженер по машинному обучению) при этом способен принимать, отклонять или редактировать это рекомендации. Такая обратная связь в реальном времени позволяет делать модели тем совершеннее, чем чаще они используются. Такую систему называют «маховиком данных» (data flywheel).

«Все стремятся создать самосовершенствующийся маховик данных. Проблема ИИ компьютерного зрения заключается в том, как вообще раскрутить этот маховик, поскольку он очень затратен и срабатывает лишь в 50% случаев. И на этом этапе в дело вступаем мы», — делится Руиллар.

Быстрая обратная связь

По сути, нейросети Hasty обучаются в процессе построения инженерами наборов данных, то есть этапы «сборка», «развёртывание» и «оценка» происходят приблизительно параллельно. При обычном линейном процессе для создания ИИ-модели, которую можно протестировать, могут потребоваться месяцы. При этом модель может оказаться некорректной из-за ошибок в данных или слепых допущений, сделанных в начале проекта. Hasty обещает обеспечить гибкость процесса.

Такой подход не совсем нов, однако Руиллар заявляет, что его компания проводит аналогию между автоматизированной разметкой и беспилотным вождением: сходство заключается в том, что разные технологии работают на различных уровнях. В отрасли беспилотных автомобилей некоторые машины могут только тормозить или перестраиваться, другие же обеспечивают почти полную автономность. Если перенести этот принцип в сферу аннотирования, то, по словам Руиллара, Hasty обеспечивает более глубокую автоматизацию, чем многие его конкуренты, с точки зрения минимизации количества кликов, требуемых для разметки изображения или групп изображений.

«Все восхваляют автоматизирование, но не совсем понятно, что же именно автоматизируется», — объясняет Руиллар. «Почти во всех инструментах есть качественные реализации автоматизации первого уровня, но только немногие из нас озаботились созданием второго и третьего уровней, обеспечивающих значимые результаты».

Так как данные, по сути, являются топливом для машинного обучения, передача большего количества точных данных ИИ остаётся ключевым требованием.

Hasty: уровни автоматизированной разметки

Кроме инструмента для поиска ошибок вручную Hasty предлагает обнаружитель ошибок с поддержкой ИИ, автоматически идентифицирующий вероятные проблемы в данных обучения проекта. Это функция контроля качества, позволяющая обойтись без кропотливого поиска ошибок в данных.

«Это позволяет пользователям заниматься устранением ошибок, а не тратить время на их поиск, а также быстро укрепляет уверенность в данных в процессе аннотирования», — заявляет Руиллар.

Hasty заявляет, что продуктом стартапа пользуется примерно четыре тысячи пользователей, среди них корпорации, университеты, стартапы и разработчики ПО, связанные со многими сферами производства. «Нашими клиентами являются три из десятка лучших немецких компаний в сфере логистики, сельского хозяйства и розничной торговли», — добавляет Руиллар.

Типичным примером использования в сельском хозяйстве является обучение ИИ-модели для распознавания растений, вредителей и заболеваний. В логистике модель можно использовать для обучения машин автоматической сортировке посылок по типу. Также, по словам Руиллара, Hasty используется в сфере спорта, обеспечивая анализ игры в реальном времени и статистику для футбольных трансляций.

Имея 3,7 миллиона долларов в банке, компания планирует ускорить разработку продукта и расширить свою клиентскую базу в Европе и Северной Америке.