TRAINING DATA
TRAINING DATA JORNAL  
Вебинары

Подкаст ЦМФ о разметке данных для машинного обучения


Тайминг:

0:08 Школа и выбор ВМК МГУ
0:46 "Программировать у меня отбили желание на первых курсах" 
0:59 Кафедра ИО 
1:13 Полезные курсы 
1:48 Научная специализация - оценка опционов 
2:13 Стажировки в Тинькофф банк и Prisma 
3:13 Как начал изучать машинное обучение 
4:07 "Сейчас изучаю активно английский язык" 
4:41 Как из финансов и data science оказался в разметке данных 
5:43 О разметке данных 
7:02 Краудсорсинг
7:56 Какие платформы по разметке данных использует 
8:14 Взаимодействие с толокерами 
9:22 О TrainingData.ru 
10:13 "Сейчас бум ML и как в позапрошлом веке была золотая лихорадка, когда искали золото и в основном зарабатывали те, кто продавал кирки, тут тоже самое: много ML компаний, которые разрабатывают нейронные сети, а мы для них продаём размеченные данные" 
11:28 Рабочий процесс по разметке 
12:40 Анонимность и конфиденциальность данных 
13:57 Dataset с обнажёнными девушками 
14:20 Кейс с антиспуфингом 
15:11 Медицинские кейсы 
15:47 Кейс с лидарами и беспилотными автомобилями 
16:27 Разметка данных для онлайн-торговли 
18:01 Кейсы по распознаванию аудио 
19:21 Почему не занимаются параллельно ML 
20:05 Хакатоны и Kaggle 
21:32 "Мы выкладываем данные на Kaggle в надежде, что какому-то учёному они пригодятся и он будет нам благодарен" 
23:09 О работе с университетами 
23:57 Планы развития компании 
24:27 "Написание статей и постов в телеграмм-канале - помогает мне структурировать информацию" 
25:34 Что читает и рекомендует 
26:21 Преподавание: "Промышленное машинное обучение" для НИУ ВШЭ и курс по краудсорсингу с Яндексом для ШАД, МФТИ и Сколково 
27:20 Собственная методика проведения занятий 
28:26 "Задачи становятся всё более сложные и объёмные" 
29:46 Три типа компаний на рынке разметки 
31:23 Насколько важны оборотные средства и долгосрочное финансирование 
33:23 О росте рынка по разметке данных 
34:34 О поиске заказчиков в США 
35:20 Цели на 10 лет 
36:01 Об учёбе на ЦМФ 
36:56 Об ассистировании на ЦМФ - съёмке видео-лекций 
38:32 "Когда я закончил ЦМФ, я запустил майнинг эфира на этой видеокарте, что мне принесло много-много денег" 
39:10 Советы студентам по построению карьеры 
40:03 "Лучше искать окружение, а работа из этого окружения к тебе придёт" 
40:55 "В моё время много парней изучили блокчейн и стали много зарабатывать, потому что они быстро разобрались в новой отрасли, которая была актуальна, но где не было специалистов"

Рассказ о моем пути в мире информатики начинается с выбора университета. Когда-то, на первых курсах, программирование казалось мне чем-то сложным и непонятным. Но моя история не остановилась на этом. Я решился выбрать кафедру информатики и обсудить с ней свои предпочтения.
На кафедре информатики меня ждало множество интересных курсов и возможность научиться чему-то новому. Однако мое настоящее вдохновение пришло, когда я начал изучать машинное обучение. Сегодня я активно развиваю свой английский язык, чтобы быть в курсе последних тенденций в этой области.
Из финансового мира и data science меня занесло в увлекательную область разметки данных. Этот процесс включает в себя работу с краудсорсинговыми платформами и взаимодействие с толокерами. Наша компания TrainingData.ru занимается предоставлением размеченных данных для множества ML-компаний, которые создают нейронные сети.
Рабочий процесс по разметке требует внимания к анонимности и конфиденциальности данных, ведь мы работаем с разнообразными кейсами, включая медицинские данные, антиспуфинг и даже информацию о беспилотных автомобилях.
Кроме того, мы поддерживаем сообщество, выкладывая данные на Kaggle, в надежде, что они пригодятся ученым и специалистам в машинном обучении.
Наша работа также включает в себя сотрудничество с университетами и преподавание курсов по промышленному машинному обучению. Наша собственная методика проведения занятий помогает студентам справляться с всё более сложными задачами.
На рынке разметки данных можно выделить три типа компаний, и для нас важно учитывать оборотные средства и долгосрочное финансирование.
Тем временем рынок разметки данных продолжает расти, и мы ищем заказчиков даже за пределами России, в США.
Мои планы на ближайшие 10 лет включают написание статей, преподавание и развитие собственной компании.
Учеба в Центре математической физики МГУ также оставила след в моей карьере. Я даже ассистировал на лекциях и снимал видеолекции.
И, конечно же, не могу не поделиться советами для студентов. Лучше всего искать окружение, в котором ты можешь расти и развиваться. Иногда успех приходит к тем, кто быстро осваивает новые области, как блокчейн, когда в них еще нет специалистов.

Computer Vision Сбор данных Разметка данных Краудсорсинг