TRAINING DATA
TRAINING DATA JORNAL  
Авторские статьи
Кейсы Краудсорсинг

«Хакни пайплайн»: подведены итоги первого крауд-хакатона

В рамках однодневного интенсива 16 команд искали самое эффективное решение для задачи разметки большого массива данных. В распоряжении участников была функциональность Яндекс. Толоки (построить процесс и получить датасет предстояло именно в Толоке) и реальные данные о товарных позициях маркетплейса OZON — 500 ссылок на карточки товаров.

На OZON есть функция подбора образа. Чтобы она работала, компания использует метод крауда. Задача стояла такая: к товару с OZON из категории «Одежда, обувь и аксессуары» командам нужно было выстроить процесс подбора других товаров с сайта, чтобы получился образ, который мог бы продаваться комплектом. Всё это делается для того, чтобы помочь пользователям найти понравившиеся товары, собрать интересный образ, быстрее сориентироваться в ассортименте, а компании — увеличить средний чек.

Роман Куцев — победитель хакатона — рассказал, как он со своей командой решал задачу:

«Проведя эксперименты, мы выяснили, что обычному человеку сложно подобрать полноценный образ, и профессиональный стилист справляется с ней лучше, чем толокер. На многих фотографиях товара на OZON присутствует не только продаваемая вещь, но и несколько атрибутов образа, которые с этой вещью сочетаются. Мы заменили задачу подбора образа на другую — определить, какие вещи на фотографиях присутствуют вместе с продаваемым товаром, и затем найти похожие вещи на OZON».

На хакатоне эксперты Яндекс. Толоки провели образовательный интенсив, на котором рассказали про основные компоненты краудсорсинга, прошлись по интерфейсу Толоки (для заказчика) и запустили несколько проектов, которые включали бинарную классификацию и выделение областей на фото.

Призовой фонд крауд-хакатона «Хакни пайплайн» составил 320 тысяч рублей и распределился так:

  • Первое место заняли Роман Куцев (Trainingdata) и Евгений Головенков (студент курса по краудсорсингу «Школы анализа данных» Яндекса) — они получили грант на 100 тысяч рублей на обучение в Нетологии и ваучер на 60 тысяч рублей от OZON.

  • На втором месте — Алексей Миронов (DomClick, выпускник профессии Data scientist в Нетологии), Виктор Пимшин (Ростелеком, выпускник профессии Data scientist в Нетологии) и Роман Малов (учится в УЦ «Профессионал»), им достался грант на 50 тысяч рублей на обучение в Нетологии и ваучер на 30 тысяч рублей от OZON.

  • Третье место заняла команда Физтеха: Анастасия Павловская, Даниил Поляков (оба учатся на курсе по краудсорсингу в «Школе анализа данных» Яндекса), Александр Рогозин, Иннокентий Шибаев. Команда получила грант на 50 тысяч рублей на обучение в Нетологии и ваучер на 20 тысяч рублей на OZON.

Призы зрительских симпатий и ваучеры по 5 тысяч рублей от OZON достались командам: Дима Браженко (Яндекс) и Андрей Браженко (Сбербанк), а также «Леруа Мерлен» — Татьяна Ковылина и Алиса Михайловская.

Андрей Ольховик, лид аналитики OZON, член жюри:

«Решая бизнес-задачи средствами крауда, нередко сталкиваешься со множеством альтернативных подходов к проблеме. К сожалению, далеко не всегда есть возможность проверить каждый из них, к тому же со временем появляются „любимые“ приемы, что может „замылить глаз“. Сегодняшний хакатон помог проверить ряд гипотез, в том числе и новых для нас, и увидеть конкретные примеры их реализации с итоговой разметкой. Сообщество крауда по сути только формируется, и такие мероприятия — отличная возможность поделиться опытом и привлечь новую аудиторию к работе с перспективным подходом к сбору и оценке данных».

Анастасия Павловская, студентка курса по краудсорсингу «Школы анализа данных» Яндекса, команда, занявшая 3 место:

«Для меня как участника хакатон был очень увлекателен: непростая и интересная задача, сжатые сроки, приятная атмосфера — компоненты отличного мероприятия. Мне очень понравилось, что нам дали боевую задачу, в решении которой заинтересована конкретная команда: это помогало быстрее учиться, концентрируясь только на самых важных вещах. Кроме того, очень вдохновили решения команд, которые получили призы. Получилась хорошая подпитка идеями от других участников».