Middle+/Senior Data Scientist в Защитник [Big Data, МТС Веб Сервисы]
Описание
О проекте: МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform. Big Data – один из ключевых юнитов МТС. Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде. Мы – data-команда продукта МТС Защитник, который защищает миллионы пользователей от телефонного спама и мошенников. Это живая и постоянно меняющаяся задача: спамеры адаптируются под фильтры, меняют поведение и тексты, а мошенники регулярно придумывают новые схемы, используя социальную инженерию и давление на эмоции. Мы работаем с большими объёмами данных и моделями, которые должны не просто хорошо считать метрики, но и стабильно работать в продакшене с жёсткими требованиями к latency и качеству - и реально влиять на безопасность людей. Поэтому мы ищем Middle+/Senior ML Engineer, который поможет нам в развитии инструментов борьбы со спамом и мошенниками. Используемый стек ML: Python, CatBoost, PyTorch, Transformers, ONNX, Triton Inference Server, MLflow; Data: PySpark, ClickHouse, Pandas, NumPy Обязанности: Поддерживать и развивать ML-модели для выявления телефонного спама и мошенничества (табличные модели и NLP: классификация текстов, анализ расшифровок звонков); Заниматься feature engineering, у нас много витрин и источников данных, важно извлекать из них полезные сигналы; Участвовать в построении pipeline от данных до production-инференса (обучение, оптимизация, мониторинг); Участвовать в постановке задач разметки и работе с качеством данных; Общаться с бизнес-заказчиками: помогать формализовать задачи, согласовывать метрики, объяснять ограничения и результаты моделей; Предлагать и проверять новые подходы к детектированию спама и мошеннических сценариев Требования: Опыт работы в Data Science / ML от 3 лет; Хорошее понимание классического ML и практический опыт feature engineering; Опыт продуктивизации ML-моделей и их сопровождения; Опыт в дообучении NLP-моделей под конкретные задачи: классификация, NER; Умение переводить бизнес-задачи в ML-формулировки и внятно объяснять результаты; Уверенные навыки Python и SQL; Будет плюсом: PySpark, Hadoop, MLOps Условия: Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах; Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше; Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации; Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch; Полезные курсы и вебинары в корпоративном университете и электронную библиотеку; ДМС с первого месяца работы, включая стоматологию; Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях; Отпуск 28 календарных дней (+3 дополнительных дня за ненормированный рабочий день); Гибридный формат работы; Прием врачей общей практики и массаж в офисе; Мобильная связь за счет компании и льготные тарифы для близких; Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.