TRAINING DATA

Связаться с нами

Пройти опрос

Пройти опрос

ДАТАСЕТ

168 200 аудиозаписей с произношением российских городов и улиц. Датасет решает задачи распознавания и синтеза топонимов на русском языке

Speech to text распознавание речи

Заказать звонок

Использование технологий машинного обучения для эффективного управления городской средой

Smart City

Автоматическое распознавание речи

ASR

Синтез речи и автоматическое произношение текста

Text-to-speech

Возможность системы автоматически интерпретировать данные и прогнозировать результат

Machine Learning

168,200
аудиозаписей
8,400+
топонимов
1,200
человек

Особенности датасета

● Каждый объект озвучен в именительном падеже 20 различными людьми из СНГ

● Средний возраст озвучивающего человека - 38 ± 11 лет

● Распределение по полу среди озвучивающих - 30% мужчин и 70% женщин

● Формат данных в аудиодатасете: wav, 16 kHz

Метаданные в датасете

Транскрипция: название города или улицы на русском языке

Идентификатор человека, озвучивающего объект

Возраст озвучивающего человека в годах

Пол человека, озвучивающего объект

Каждая аудиозапись в датасете имеет следующие атрибуты:

Смотреть на Kaggle

Скачать PDF

НАМ ДОВЕРЯЮТ

НА ИТОГОВУЮ СТОИМОСТЬ ПРОЕКТА ВЛИЯЮТ:

Объем работ

Сложность разметки

Сроки

Качество разметки

Гарантия качества наших данных 95%. При заказе разметки с качеством выше 95% мы предлагаем enterprise решения

Заказать расчет стоимости

Тимлиды проекта

Вадим Болотов

Кристина Бугаёва

Сергей Разумный

Project manager

TeamLead Crowd Solutions
Architect

Operations manager

Сотрудничество

с Training Data -

это

Команда экспертов:

Гибкий подход:

Ожидания и гарантии:

Безопасность:

Согласование инструментов и метрик под каждый проект

Оптимизация затрат и времени

Контроль качества, согласно договору

Предоставление отчетности на каждом этапе

Подписание NDA

Полный пакет закрывающих документов

Работа на сервере заказчика по запросу

Передача данных через защищенные хранилища

35 опытных-менеджеров проектов

100% постоплата

Персональный менеджер

24/7 поддержка проекта

Enterprise тарифы для поточных проектов

6 лет в разметке данных

40+ языков

100+ стран

1500+ внутренних асессоров

Смотреть другие датасеты

Голоса детей

Перейти в датамаркет

Вам понравится

Аннотирование текста для машинного обучения

Сбор данных

Пять альтернатив Scale AI