TRAINING DATA

TRAINING DATA

ДАТАСЕТ

168 200 аудиозаписей с произношением российских городов и улиц. Датасет решает задачи распознавания и синтеза топонимов на русском языке

Speech to text распознавание речи

Использование технологий машинного обучения для эффективного управления городской средой
Smart City
Автоматическое распознавание речи
ASR
Синтез речи и автоматическое произношение текста
Text-to-speech
Возможность системы автоматически интерпретировать данные и прогнозировать результат
Machine Learning
168 200
аудиозаписей
8 411
топонимов
1 200
голосов записано
Особенности датасета
Каждый объект озвучен в именительном падеже 20 различными людьми из СНГ
Средний возраст озвучивающего человека - 38 лет ± 11 лет
Распределение по полу среди озвучивающих - 30% мужчин и 70% женщин
Формат данных в аудиодатасете: wav, 16 kHz
Метаданные в датасете
Каждая аудиозапись в датасете имеет следующие атрибуты:
Пол человека, озвучивающего объект
Возраст озвучивающего человека в годах
Идентификатор человека, озвучивающего объект
Транскрипция: название города или улицы на русском языке
Оставьте заявку, чтобы приобрести лицензию, заказать датасет или получить больше информации
Смотреть другие датасеты