TRAINING DATA
ДАТАСЕТ
1,200 фотографий рекламы и товаров с текстом на русском языке и подробной OCR-разметкой. Датасет решает задачи распознавания текста на русском языке

Текст с обложек и товаров

Разметка данных
OCR
Выделение объектов на фото для обучения системы их распознаванию и интерпретации
Оптическое распознавание символов - процесс преобразования изображения текста в машиночитаемый текстовый формат
Computer Vision
Bounding box
Способность распознавать и анализировать изображения и видео
Разметка данных с помощью прямоугольников. С ее помощью модель обучается обнаруживать объекты и оценивать их положение в кадре
1 200
пар фотографий и аннотаций
2
тип освещения
800
MB данных
Технические характеристики:
Реклама:
  • названия организаций, постеры, билборды, наклейки и баннеры (чаще всего сняты на улице)

Товары:
  • еда, косметика, предметы личной гигиены, обложки книг и видеоигр (сняты в помещении)
Два вида изображений с текстом:
Дневной свет:
  • снято в помещении или на улице в свете дня

Ночь:
  • снято в темноте на улице или в помещении
Два типа освещения:
Bounding Box:
  • разметка для каждой последовательности букв или чисел

OCR-разметка:
  • разметка для выделенной последовательности, включая пунктуацию
Типы разметки:
НАМ ДОВЕРЯЮТ
Пример изображений с ВИЗУАЛИЗАЦИЕЙ BOUNDING BOX
НА ИТОГОВУЮ СТОИМОСТЬ ПРОЕКТА ВЛИЯЮТ:
Объем работ
Сложность разметки
Сроки
Качество разметки
Гарантия качества наших данных 95%. При заказе разметки с качеством выше 95% мы предлагаем enterprise решения
Тимлиды проекта
Алексей Антюшеня
Сергей Разумный
TeamLead Crowd Solutions Architect
Operations manager
Мария Кузьмина
Project manager
Сотрудничество
с Training Data -
это
Команда экспертов:
Гибкий подход:
Ожидания и гарантии:
Безопасность:
Согласование инструментов и метрик под каждый проект
Оптимизация затрат и времени 
Контроль качества, согласно договору
Предоставление отчетности на каждом этапе
Подписание NDA
Полный пакет закрывающих документов
Работа на сервере заказчика по запросу
Передача данных через защищенные хранилища
35 топ-менеджеров проектов
100% постоплата
Персональный менеджер
24/7 поддержка проекта
Enterprise тарифы для поточных проектов
6 лет в разметке данных
40+ языков
100+ стран
250000+ ассесоров 
Смотреть другие датасеты