Middle Devops Engineer [MLOps Platform, МТС Веб Сервисы]
По договоренности
Удаленно•Занятость: Не указана•Требуемый опыт: От 1 года до 3 лет
Москва

Размер компании
-
Описание компании не указано
Описание вакансии
МТС — это цифровая экосистема. Мы создаём и развиваем сервисы в сфере мобильной связи, больших данных, искусственного интеллекта, облачного хранения, медиа и финансов — все они делают жизнь людей проще и интереснее.Big Data – один из ключевых юнитов МТС. Наши технологии применяются практически во всех направлениях компании - финансы, маркетинг, обслуживание, планирование сети, HR, розница.MLOps Platform – платформа для организации и автоматизации процессов, связанных с разработкой, обучением, тестированием и развертыванием моделей машинного обучения, а также управлением их жизненным циклом.Сейчас мы находимся в поиске Middle Devops Engineer в MLOps Platform.
Дополнительно
Обязанности
— Сопровождать и развивать инфраструктуру MLOps-платформы: заниматься поиском и оптимизацией узких мест, рассматривать инциденты, устранять аварии, консультировать пользователей.
— Проводить RnD с целью внедрения нового функционала, совершенствования MLOps-платформы.
— Разворачивать новые инструменты и сервисы MLOps-платформы.
— Поддерживать/участвовать в реализации практик DevSecOps (внедрение практик безопасности на всех этапах разработки и применения моделей машинного обучения).
— Проводить мониторинг использования ресурсов и планировать масштабирование инфраструктуры.
— Участвовать в процессах миграции инфраструктуры платформы, подключении новых ресурсов в kubernetes-кластер.
— Внедрять систему мониторинга производительности моделей и сервисов.
— Настраивать алертинг и логирование для быстрого выявления сбоев или деградации производительности.
Требования
— Навыки администрирования Linux, Kubernetes, понимание и опыт работы с Docker и CI/CD инструментами, сетевое администрирование.
— Умение автоматизировать процессы развертывания и масштабирования.
— Анализ производительности инфраструктуры и внесение улучшений для оптимизации скорости работы платформы. Контроль за эффективным использованием ресурсов и затратами.
— Понимание концепции observability. Знакомство с инструментами мониторинга и централизованного логирования. Навыки построения дэшбордов и настройки алертов в Grafana.
— Умение диагностировать проблемы по логам и метрикам и принимать меры по стабилизации системы.
— Владение инструментами экосистемы MLOps: Jupyter Notebooks, VSCode, Kserve, ArgoCD, MLFlow, Airflow.
— Понимание предметной обрасти ML и MLOps. Понимание специфики задач и процессов Data Science.
— Практический опыт участия во внедрении и поддержке решений для автоматизации ML-процессов (CI/CD для моделей, деплоймент, мониторинг) приветствуется.
— Умение формулировать и доносить технические решения до коллег и пользователей платформы.
— Опыт взаимодействия с разработчиками ML/DS-направления.
Условия
— Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах.
— Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше.
— Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации.
— Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch.
— Полезные курсы и вебинары в корпоративном университете и электронную библиотеку.
— А еще:
ДМС с первого месяца работы, включая стоматологию.
— Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях.
— Отпуск 28 календарных дней.
— Прием врачей общей практики и массаж в офисе
— Мобильная связь за счет компании и льготные тарифы для близких.
— Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.