DevOps-инженер в команду Server Infrastructure

Any

По договоренности

ГибридЗанятость: ПолнаяТребуемый опыт: Более 5 лет

Go

Откликнуться
company logo
Яндекс
Перейти на сайт

Размер компании

-

Описание компании не указано

Описание вакансии

Команда Server Infrastructure занимается эксплуатацией быстро растущей инфраструктуры Yandex Cloud в рамках подразделения Cloud Foundation Services. Мы строим надёжную и масштабируемую инфраструктуру, поверх которой запускаются виртуальные машины пользователей и внутренние сервисы. В сервисах реализуем различные сценарии работы с железом: от процессов ввода, вывода, починки до бесшовного обновления ОС на всём кластере. Наши сервисы работают с большим количеством облачных и общих яндексовых систем, собирают данные о хостах, метрики состояния железа и кластера в целом, чтобы планировать обслуживание серверов и распределять ресурсы. Мы предоставляем сервисы и инструменты, которые упрощают и автоматизируют внутренние процессы, делают инфраструктуру прозрачнее и стабильнее, снимают с инженеров рутинную работу. Под нашим управлением уже более 16 тыс. серверов в трёх дата-центрах Яндекса, и их количество непрерывно растёт. Мы разрабатываем и постоянно совершенствуем способы мониторинга наших серверов и подходы к нему так, чтобы заранее и автоматически диагностировать неполадки и выполнять обслуживание, не дожидаясь выхода серверов из строя. В работе мы используем: Проектирование и автоматизацияПредстоит участвовать в проектировании архитектурных решений для Yandex Cloud и автоматизации инфраструктурных сценариев и процессов. Помогать разработчикам проектировать производительные отказоустойчивые сервисы. Улучшать архитектуру систем управления и автоматизации работы кластера. Observability и CI/CDНужно будет улучшать наши инструменты диагностики, мониторинга. Разрабатывать новые мониторинги и улучшать имеющиеся. Настраивать графики и алерты, уменьшать количество ложных срабатываний, повышать скорость реакции на критические события. Разрабатывать и совершенствовать процессы деплоя инфраструктурных сервисов и пайплайны CI (Kotlin DSL), переводить существующие механизмы на K8s. Разработка и поддержка сервисовВы будете разрабатывать и поддерживать сервисы на Python и Go. Создавать инструменты автоматизации управления инфраструктурой и ускоряющие рутинные задачи. Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев. Мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные20%. В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей. Также мы оплачиваем участие в профильных конференциях — как в качестве спикера, так и в качестве участника. Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов. Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей. Можете заниматься самостоятельно, а можете с корпоративным тренером. В Яндексе есть спортивный клуб и много спортивных команд. У них есть свои лидеры, чаты, программы тренировок. А ещё они регулярно участвуют в забегах, триатлонах, «Гонке героев», футбольных и других соревнованиях.

Дополнительно

Golang и Python для разработки сервисов и автоматики SaltStack и Terraform для описания инфраструктуры TeamCity и Spinnaker для процессов CI/CD Писали код на Python и/или Go Работали с Unix-системами и сетевыми технологиями Имели дело с SRE-подходами или DevOps-практиками Любите улучшать процессы и автоматизировать задачи: писали сервисы и утилиты для автоматизации Умеете не только решать проблемы, но и находить причины их возникновения Знаете, как сделать отказоустойчивый масштабируемый сервис Способны учиться и готовы делиться опытом