TRAINING DATA

Интервью с Софьей Полехиной

Datamarket Junior Project Manager

О работе в Training Data


Расскажи о себе. Какой у тебя был опыт до Training Data?

Меня зовут Соня, сейчас я учусь на третьем курсе в НИУ ВШЭ на социологии и социальной информатике.
До Training Data у меня не было опыта работы в этой сфере, только небольшая стажировка от ВУЗа и подработки. Но моя специальность связана с анализом и базами данных, методами машинного обучения, то есть тем, чем я сейчас занимаюсь.


Почему ты решила устроиться разметчиком? И как выбрала Training Data?
На тот момент я искала источник заработка, мне захотелось попробовать себя в разметке. Когда я увидела вакансию и условия, мне стало интересно, и я отправила заявку.

Я прослушала презентацию и мне очень понравилось, как все было организовано, особенно Telegram канал, где появляется вся информация из тестового задания и Google Форм. Еще меня привлек гибкий график: я могла сама составить свое расписание с учетом учебы.

Условия мне тоже понравились. Когда я сравнивала Training Data и некоторые похожие крупные компании, то заметила, что оплата здесь выше, а еще всегда есть доступные проекты. На биржах же попадаются очень разные задачи, то есть каждый раз нужно заново вникать в ТЗ. Из-за этого не получается набить руку в одном типе разметки и ускорить работу.

Во время онбординга можно было попробовать себя в разметке разных типов данных: изображений и аудио. В итоге я начала работать над проектом с транскрибацией аудио

Как происходил процесс отбора? Как была организована работа?
Я устраивалась в конце марта 2023 года. Сначала я откликнулась на вакансию на HH.RU, потом выполнила тестовое задание. Для него мне отправили ссылку на Telegram канал, где было подробно расписано про каждый тип разметки. Так можно было понять, подходит ли тебе эта работа и задачи. В том же канале можно было найти все необходимые ресурсы.

После этого мы встретились с Training Data, чтобы обсудить все актуальные проекты: оплату, количество обязательных часов в день и само задание. Мне очень понравилось, как была выстроена коммуникация: до того, как добавить нас в общий чат, нам также создали небольшую беседу новичков и дали задание к нашему проекту. Это помогло попробовать себя и понять, что нас будет ждать во время работы.

В компании есть общий чат со всеми разметчиками. Там были разные разделы, от популярных вопросов до болталки. На многие вопросы, к примеру, насчет оплаты, нам отвечали опытные разметчики. Все отлично продумано для того, чтобы все нашли нужную информацию и интегрировались в компанию.

Еще у нас всегда была возможность коммуникации с руководителем проекта. К примеру, мой менеджер очень быстро отвечал на все вопросы. Он создал документ, где разметчики писали все, что их интересует, а он уточнял детали у заказчика и давал обратную связь.

В чем состояла твоя работа и сколько времени она занимала?
Во время работы в разметке мой день выглядел так: я вставала и полтора часа работала над проектом. Потом уделяла время учебе или личным делам, а вечером посвящала еще полтора или два часа разметке. Но важно понимать, что время работы зависит от проекта: на моем проекте по транскрибации минимум был три часа в день.

Сначала я открывала CVAT, а потом прослушивала и размечала записи. Причем первое время я заводила аудио очень медленно и часто переслушивала несколько раз , чтобы уловить все детали. Но когда я привыкла к работе, могла разметить все за один раз на скорости х1.  Чем больше опыта у тебя есть, тем быстрее ты выполняешь дневную норму.

Что тебе нравилось в работе, а что нет?
Мне нравилась возможность работать в любое время. Иногда мне удобнее выполнять все задачи утром, а иногда вечером.

Но меня утомляла монотонность работы. Я знаю, что многим людям проще выполнять однообразные задачи, но мне было сложно к ним привыкнуть. Три часа транскрибации ощущались намного длиннее, чем то же время на моей новой должности с более разнообразными задачами.
Какие сложности у тебя появлялись во время работы?
Сначала я совершала много ошибок, в основном из-за неоднозначных моментов в техническом задании. Тогда я работала над проектом, где нужно было делать транскрибацию для одного из крупных клиентов. Иногда я не совсем понимала, нужно ли ставить дефис, если он должен стоять по правилам русского языка. К примеру, в слове “подойди-ка”.
Но в остальном трудностей не было: все очень подробно объяснялось во время онбординга, а потом, когда попадаешь на конкретный проект, все детали можешь найти в техническом задании.


Что нужно знать тем, кто хочет заниматься разметкой?
Перед началом работы я бы посоветовала спросить себя, что конкретно в разметке тебе интересно, можешь ли ты выполнять такие однообразные задачи.

Также важно понимать, что это полностью автономная работа, ты сам должен организовать свой день. От тайм-менеджмента зависит и оплата: чем лучше ты планируешь свое время, тем больше ты успеваешь выполнить, тем выше будет твоя зарплата.

Еще важно быть сконцентрированным: качество в разметке играет огромную роль. В начале лучше не торопиться, изучать ТЗ и работать очень внимательно. Это может потребовать чуть больше времени, зато ты сразу будешь выполнять задачи хорошо. А с опытом ты все равно научишься размечать быстрее, сохраняя высокое качество.
Какие советы ты можешь дать начинающим разметчикам?

В работе мне помогала техника Pomodoro: я ставила таймер на 25 минут, потом делала перерыв на 5 минут. Через 4 такие цикла я давала себе отдых в 20 минут. Это очень помогало мне не отвлекаться и не прокрастинировать.

Еще я рекомендую планировать расписание заранее на всю неделю: это помогает лучше дисциплинировать себя и всегда успевать совмещать работу с учебой. Многим удобнее не растягивать рабочие часы, а выполнить все задачи сразу. К примеру, ты все сделал утром и потом не возвращаешься к работе.


Работа в Data Market

Как ты перешла в Data Market?

Когда я работала около 3 недель, увидела в нашем чате вакансию Junior Project Manager в Data Market, а я как раз хотела работать в этой сфере. Мне очень понравились и задачи, и гибкий график: я все-таки учусь в вузе, полный день работать я бы не смогла.

В вакансии были описаны все требования к кандидату. Среди прочего нужно было знать Python, уметь работать с разметкой, Kaggle и Notion. Я подходила почти по всем пунктам, кроме знания Power BI.

Сначала нужно было созвониться с HR, выполнить тестовое задание и провести встречу с командой. После этого мне отправили оффер.


Какие задачи ты сейчас выполняешь?
Теперь мой день выглядит совершенно по-другому: сейчас я отвечаю за развитие Hugging Face, выкладываю датасеты на платформы, создаю семплы и pdf карточки датасетов.
Также каждую неделю я выполняю новые задачи: постоянно появляются идеи, над которыми мы работаем.


Что изменилось в рабочих процессах с момента твоего повышения?
В разметке нет командной работы. Все свои задачи ты выполняешь самостоятельно и отвечаешь только за себя. А в Data Market мы с командой часто работаем вместе. Поэтому здесь не получается выстраивать свое расписание полностью самостоятельно, как в разметке: мне нужно координироваться с другими сотрудниками, чтобы вместе выполнять работу.

Еще эта работа совсем не монотонная: мне все время приходится делать что-то новое и чему-то учиться. Я чувствую, что очень быстро расту в профессиональном плане и постоянно улучшаю свои навыки.