РЕ
Рекламные технологии
Machine Learning Engineer
Machine LearningкомбинированныйМосква
Навыки
machine learning
Задачи:
Разработка и развитие ETL-пайплайнов для antifraud-сценариев: сбор, агрегация и обогащение событий из онлайновых и офлайновых источников, обеспечение качества данных и воспроизводимости фич Построение и поддержка MLOps-контуров: автоматизация обучения, валидации, версионирования и деплоя моделей, мониторинг качества моделей и данных в продакшене Интеграция ML-моделей в высоконагруженные сервисы VK Рекламы: участие в проектировании online-инференса, работа с ограничениями по latency, отказоустойчивости и масштабированию Инженерная поддержка antifraud-моделей: развитие фичей на основе пользовательских, поведенческих данных, адаптация моделей под новые типы фрода и изменения бизнес-логики Совместная работа с продуктом и аналитиками: интерпретация результатов моделей, анализ влияния antifraud-решений на бизнес-метрики и пользовательский опыт
Требования:
Уверенное знание Python и опыт разработки продакшен кода: скрипты, библиотеки, сервисы, взаимодействие с ML-моделями и data-пайплайнами Навыки работы с данными: построение ETL-процессов, подготовка и валидация фич, работа с большими датасетами. Глубокое понимание классических ML-подходов, применимых в antifraud: линейные модели, деревья решений, ансамбли и бустинги, понимание их продакшен-ограничений. Опыт работы с backend-инфраструктурой: Docker, системы контроля версий, юнит-тестирование, понимание CI/CD. Опыт работы с распределёнными системами хранения и обработки данных: Hadoop, Spark, YT или аналогами. Понимание современных архитектур нейросетей: трансформеры, BERT, E5, ViT, CLIP Знание принципов работы высоконагруженных систем и готовность работать с потоками данных и большими объёмами событий
Мы предлагаем:
Гибкий график работы Бонусы и скидки от партнеров Офис в центре города ДМС Профессиональная команда Откликнуться Формат работы комбинированный Уровень middle senior График работы полный
Будет плюсом:
Практический опыт настройки и эксплуатации MLOps-инструментов: Airflow, Kubeflow, MLFlow, Triton или TorchServe Опыт построения стриминговых пайплайнов и работы с очередями сообщений (Kafka) Практика деплоя ML-сервисов и data-пайплайнов в Kubernetes. Опыт работы с antifraud-, anomaly detection- или risk-scoring-системами, либо понимание их архитектурных паттернов