МТС

Senior ML Engineer [CICADA8]

От 3 до 6 летГибкийМосква

Навыки

PythonPyTorchTensorFlowscikit-learnXGBoostCatBoostTransformersNLPSFTLoRAQLoRAPEFTvLLMHugging FaceLangChainLangGraphLlamaIndexAgnoRAGQdrantpgvectorONNXTensorRTFastAPINATSMLflowMLOpsLLMOpsElasticsearchKafkaClickHouseDockerLinuxGit

Обязанности

  • 01Дообучать и адаптировать LLM под задачи информационной безопасности (SFT, LoRA / QLoRA, PEFT), готовить данные для обучения и оценивать качество результата
  • 02Разворачивать, оптимизировать и сопровождать on-prem модели в закрытом контуре компании
  • 03Проектировать и разрабатывать агентские системы на архитектурном уровне: создавать мультиагентные пайплайны, организовывать память и оркестрацию, настраивать взаимодействие агентов и обрабатывать сложные сценарии
  • 04Строить и развивать RAG-пайплайны для внутренних продуктов (чат-боты по продуктам, генерация презентаций и документов)
  • 05Быстро проверять гипотезы: прототипировать, собирать PoC и MVP, оценивать метрики и качество моделей
  • 06Собирать и обрабатывать датасеты по тематике ИБ (пентест, выявление уязвимостей, детект фишинга)
  • 07Выстраивать масштабируемые MLOps / LLMOps-процессы: выбирать инструменты и обеспечивать стабильную работу моделей в продакшене
  • 08Вести эксперименты и A/B-тесты, мониторить и постоянно улучшать качество моделей и агентов

Требования

  • 01Уверенный опыт в NLP и дообучении LLM: SFT, LoRA / QLoRA, PEFT
  • 02Практический опыт разворачивания и оптимизации on-prem моделей
  • 03Сильный опыт разработки агентских систем с пониманием их архитектуры: проектирование мультиагентных пайплайнов, организация памяти, оркестрации и взаимодействия агентов
  • 04Уверенное владение LangChain, LangGraph, LlamaIndex, Agno и аналогами
  • 05Опыт построения RAG-пайплайнов
  • 06Опыт построения MLOps / LLMOps-процессов: выбор инструментов, деплой, мониторинг и поддержка моделей в продакшене
  • 07Уверенное владение ML-фреймворками: PyTorch, TensorFlow, scikit-learn, XGBoost, CatBoost, Transformers
  • 08Опыт работы с большими объёмами данных: сбор, логирование, нормализация, хранение и парсинг с использованием современных инструментов (Elasticsearch, Kafka, ClickHouse)
  • 09Практический опыт коммерческой разработки: ONNX, TensorRT, FastAPI, NATS, Docker
  • 10Умение эффективно формировать и обрабатывать датасеты (подготовка, аугментация, балансировка) и анализировать метрики качества моделей (mAP, F1-score и др.)
  • 11Опыт в RnD будет плюсом

Условия

  • 01ДМС с первого месяца работы — 100% покрытие всех медицинских расходов, включая стоматологию
  • 02Выгодные скидки и специальные предложения от партнеров на фитнес, курсы английского и другие полезные активности
  • 03Возможность участвовать во внешних конференциях и повышать квалификацию за счёт компании через внешнее обучение
  • 04Работа в команде профессионалов, готовых делиться знаниями
  • 05Открытая и дружелюбная корпоративная культура, где каждый чувствует себя частью единой команды, общается на равных и всегда на «ты»