Sumo Logic18.04.2026

Senior Site Reliability Engineer I

San Jose

Обязанности

  • 01Постоянно улучшать жизненный цикл микросервисов и архитектурных компонентов с момента проектирования, развертывания и эксплуатации до оптимизации
  • 02Участвовать в определении, развитии и управлении SLO (уровнями надежности сервиса)
  • 03Писать код и автоматизацию для снижения операционной нагрузки, повышения эффективности, улучшения безопасности и устранения рутинных задач
  • 04Масштабировать системы с помощью автоматизации и внедрять изменения для повышения надежности и скорости разработки
  • 05Организовывать безобвинительные анализы инцидентов для выявления причин и улучшений
  • 06Участвовать в глобальной координации реагирования на инциденты (IRC) для всех продуктов
  • 07Определять корневые причины и решать проблемы с помощью различных команд
  • 08Работать в динамичной итеративной среде

Требования

  • 01Опыт разработки облачных приложений с использованием лучших практик и шаблонов проектирования
  • 02Навыки отладки и поиска неисправностей по всему технологическому стеку
  • 03Глубокое понимание AWS: сетей, вычислений, хранения и управляемых сервисов
  • 04Опыт работы с современными CI/CD инструментами: Kubernetes, Terraform, Ansible, Jenkins
  • 05Опыт полного жизненного цикла поддержки сервисов от создания до эксплуатации
  • 06Знание практик Infrastructure as Code (Terraform, AWS CloudFormation)
  • 07Умение писать продакшен-код на одном из языков: Java, Scala или Go
  • 08Опыт работы с Linux и командной строкой
  • 09Понимание современных подходов к безопасности облачных приложений
  • 10Опыт работы в Agile-командах (Scrum, Kanban) и умение оперативно доставлять ценность
  • 11Готовность учиться и брать на себя новые роли
  • 12Степень бакалавра или магистра в области Computer Science, электротехники или смежных технических дисциплин
  • 136+ лет опыта работы в индустрии

Условия

  • 01Локация: Сан-Хосе, Коста-Рика (удаленная работа)
  • 02Работа в глобальной команде SRE
  • 03Возможность участвовать в развитии платформенных решений для надежности и безопасности