Эта вакансия уже завершена
«Медіа Партнерство Баінг» — медіа-агенція повного циклу, що входить до холдингу «Медіа Група Україна» — оголошує конкурс на позицію data scientist
Мета діяльності на посаді
Організація даних і аналіз великих обсягів даних та розробка предикативних моделей на мовах програмування Python / R, підготовка результатів аналізу в формі reproducible reports.
Функціональні обов'язки
- Побудова предикативних моделей з допомогою мов програмування Python / R, переважно застосовуючи методи регресійного аналізу, з метою оцінки ефективності маркетингових активностей брендів (сфери – finance, retail, mass media та інші).
- Feature engineering: підбір факторів для навчання предикативних моделей, перевірка даних на повноту, відсутність автокореляції та ін. За необхідності, парсинг даних з онлайн джерел для їх обробки і включення в датасет
- Перевірка моделей на точність, стабільність та надійність прогнозу з допомогою статистичних показників, що включають (але не обмежуються) R-squared, adjusted R-squared, F-statistic, Prob, LogLoss, Accuracy score, Durbin-Watson, Jaccard similarity score …)
- Надання аналітичних висновків по завершенню задачі на кожному етапі розробки моделі.
- Підготовка презентації з результатами аналізу та побудованою моделлю з інтерпретацією результатів моделювання та впливу факторів, що увійшли до моделі
- Регулярна робота з пошуку інсайтів/патернів в даних, що покращать ефективність вирішення задач бізнесу.
- Підготовка регулярних та adhoc аналітичних звітів в MS Excel, PowerPoint, PowerBI.
- Регулярна комунікація з бізнес-аналітиком щодо питань, пов’язаних з задачами моделювання та даними, що використовуються у моделюванні.
Вимоги до кандидатів
- Досвіт роботи від 1 року в реальних проектах або Кейси на Kaggle, портфоліо GitHub.
- Базова вища технічна освіта ВУЗів найвищого рівня акредитації, математичний профіль (мінімум 3 завершених курси).
- Розвинуте аналітичне мислення та навички системного аналізу (структурувати ситуацію, визначити фактори впливу на розвиток цільової змінної).
- Глибокі знання та розуміння теорії математичного аналізу, статистики.
- Знання основ статистичного аналізу та теорії ймовірності.
- Впевнені навички програмування на мовах Python, R.
- Знання та досвід роботи з бібліотеками Python: основних, для роботи з даними, для візуалізації (Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-learn).
- Досвід роботи з великими масивами інформації.
- Досвід побудови складних запитів та обробки даних з допомогою SQL.
- Знання методів обробки даних (Excel, Power Pivot, Power Query), візуалізації аналітичних звітів(Power BI, PowerPoint).
- Досвід побудови відтворюваних репортів дата аналізу (reproducible reports).
- Висока уважність до деталей.
- Високий рівень відповідальності.
- Навички самоорганізації.
- Високий рівень допитливості та жаги до самовдосконалення в галузі data science.
- Англійська – на рівні ефективного сприйняття професіональної інформації (більшість тренінгів, документація – на англійській).
Бажано:
- Навички написання алгоритмів автоматичного збору даних, в т.ч. з підключенням через API.
- Знання підходів застосування машинного навчання у сфері предикативної аналітики та/чи методів кластерного, лінгвістичного аналізу.
- Участь у Kaggle challenges та інші профільні академічні / бізнес проекти.
- Навички роботи згідно принципів Agile та Lean розробки.
Компенсаційний пакет
- Офіційне працевлаштування в стабільній компанії з повною відповідністю трудовому законодавству.
- Своєчасна заробітна плата, виплата 2 рази на місяць.
- Піклування про ваше здоров'я: медичне страхування та можливість застрахувати рідних.
- Графік роботи п'ятиденний (пн-пт) - 10:00-19:00 або 9:00-18:00.
- Прозорі налагоджені процеси.
- Корпоративний університет, можливості для навчання, доступ до корпоративної бібліотеки.
- Знижки та пільги на заняття в спортклубі, курси англійської.
- Можливість працювати віддалено.
- Цікаві проекти, можливості для самореалізації та професійного розвитку.
Ми в соціальних мережах