Меня зовут Денис, и я ищу человека, который любит находить ответы на интересные вопросы в самых разных массивах данных. В студии мы стараемся записывать множество событий в наше хранилище данных, и нам нужен человек, который готов эти события исследовать самыми разными способами, делать выводы и делиться ими. Сколько человек сегодня пришло в студию? А сколько задач в таск-менеджере они завели? А какой средний срок жизни у задачи? А как эти сроки распределены? Мне нужен коллега, которому интересно искать ответы на такие вопросы.
Подходящий кандидат:
В архиве — несколько csv-файлов, в которых находятся данные, необходимые для выполнения задания, а также текст с описанием таблиц.
Нужно:
1. Почистить данные. Специалист не может быть запланирован более чем на 8 часов в день. Все, что более 8 часов, должно быть срезано. Срезать нужно по принципу: кто раньше успел запланировать специалиста, тот и прав. Время планирования указано в колонке dt.
2. Найти 20 наименее занятых специалистов (на уровне id) за март.
3. Построить распределение длительностей проектов.
4. Построить график занятости по специалистам от максимально возможного в течение года: