Senior Go Infrastructure Engineer в группу эксплуатации облачной платформы в VK

Any

По договоренности

Удаленно•Занятость: Полная•Требуемый опыт: Не указан

Откликнуться

Перейти на сайт

Размер компании

Описание компании не указано

Перейти к текущей вакансии Все вакансии (0)

Описание вакансии

Мы — команда эксплуатации высоконагруженной социальной платформы, обслуживающей миллионы пользователей. В основе нашей технологической экосистемы — полностью собственная, разработанная с нуля система контейнерной оркестрации и платформенные сервисы, обеспечивающие предсказуемую производительность, высокую доступность и короткий цикл поставки изменений в масштабах всей компании. Сейчас мы находимся в активной фазе эволюции архитектуры: поэтапно разделяем исторический монолит на микросервисную модель с чёткими контрактами, независимыми жизненными циклами и строгими SLO/SLI. Переход включает проектирование доменных границ, внедрение устойчивых паттернов коммуникации и работы с данными, а также создание единых SDK, платформенных компонентов и шаблонов доставки изменений с целью установления единообразных требований к отказоустойчивости, надёжности и наблюдаемости на уровне всей платформы и снижения эксплуатационных издержек для продуктовых команд. VK — это более 200 технологичных проектов, больше 15 000 сотрудников и безграничные возможности проявить себя. Мы делаем современные и быстрые интернет-сервисы, доступные каждому. Задачи: Разрабатывать и поддерживать инфраструктурные сервисы и платформенные компоненты на Go; Проектировать и реализовывать инфраструктурные компоненты распределённых систем: API gateway, service discovery, service mesh, traffic ingestion and balancing, message queue, asynchronous processing, state coordination (consensus and leader-election); Автоматизировать эксплуатацию: CI/CD, GitOps, IaC; развёртывание и миграции; ввод новых сервисов в production; масштабирование под нагрузку; квотирование, лимиты и планирование ресурсов; безопасный self‑service для продуктовых команд по управлению конфигурациями с валидацией и аудитом; Обеспечивать наблюдаемость: сбор метрик, трейсов, логов, определять политики алертинга по сервисам; проектировать SLO/SLI; участвовать в постинцидентных разборах и устранять первопричины; Совместно с продуктовыми командами обеспечивать производительность и надёжность: профилировать сервисы, тюнить использование ресурсов и устранять узкие места; Участвовать в архитектурных ревью, представляя требования по высокодоступности и надёжности; поддерживать в актуальном состоянии техническую документацию, внутренние гайды и эксплуатационные ранбуки Требования: Опыт 3+ года коммерческой разработки на Go, уверенное владение стандартной библиотекой, контекстом, конкурентностью (goroutines, channels, sync), профилированием (pprof), unit-тестированием; Сильные знания Linux и администрирования: сетевые утилиты (tcpdump/tshark; ss/netstat), systemd, namespaces/cgroups базово, shell-скриптинг, диагностика производительности (strace, perf, eBPF — как плюс); Понимание принципов распределённых систем: CAP, консенсус/координация (raft/etcd/ZooKeeper), партиционирование/шардинг, согласованность данных, очереди/стриминг, паттерны устойчивости (rate limiting, timeout with jitter and backoff, circuit breaking, etc.); Контейнеризация и оркестрация: Docker/Podman; опыт с одним из оркестраторов — Kubernetes, Nomad, (Apache) Aurora; CI/CD: опыт с одним или несколькими — GitLab CI, Jenkins, TeamCity, GitHub Actions; практический опыт с канареечными (canary), поэтапными (staged) и blue‑green релизами

Дополнительно

Секреты цифровой доступности Как попасть в команду Разрабатывать и поддерживать инфраструктурные сервисы и платформенные компоненты на Go Проектировать и реализовывать инфраструктурные компоненты распределённых систем: API gateway, service discovery, service mesh, traffic ingestion and balancing, message queue, asynchronous processing, state coordination (consensus and leader-election) Автоматизировать эксплуатацию: CI/CD, GitOps, IaC; развёртывание и миграции; ввод новых сервисов в production; масштабирование под нагрузку; квотирование, лимиты и планирование ресурсов; безопасный self‑service для продуктовых команд по управлению конфигурациями с валидацией и аудитом Бонусы: Гибкий график работы; Бонусы и скидки от партнеров; Офис в центре города; ДМС; Профессиональная команда; Интересные задачи Дополнительные плюсы: Опыт эксплуатации и разработки под Kubernetes в production (операторы, Helm/Kustomize), опыт с service mesh (Istio/Linkerd) или участия в разработке компонентов in‑house оркестраторов/планировщиков, service mesh- или RPC‑стеков; Хранилища и кеши: опыт эксплуатации MySQL/PostgreSQL, Redis/Memcached; аналитические и поисковые СУБД — ClickHouse, Elasticsearch; Очереди и стриминг: Kafka, NATS, RabbitMQ; понимание гарантий доставки и семантики обработки; Наблюдаемость: опыт развёртывания, настройки или эксплуатации Prometheus/Grafana, логирование (Loki/ELK), трейсинг (OpenTelemetry/Jaeger) под высокой нагрузкой; Сети и балансировка: практический опыт с сетевыми протоколами и стратегиями балансировки трафика (например, consistent hashing, weighted round-robin, latency‑aware, etc.)