Бизнес-приложения VK Tech

Performance Engineer

DevOpsгибкийМосква

Навыки

LinuxperfstracetcpdumpiostatvmstatPrometheusGrafanaOpenTelemetryJaegerBashPythonAnsibleCI/CDTCP/IPHTTPDNSload balancing

Обязанности

  • 01Проводить низкоуровневую диагностику производительности систем
  • 02Выполнять системную диагностику Linux на уровне kernel, memory, networking и system calls
  • 03Анализировать деградации CPU, IO и latency с использованием инструментов perf, strace, tcpdump, iostat
  • 04Выявлять и локализовывать узкие места на уровне application, database, storage и network
  • 05Строить профили производительности по latency, throughput и saturation
  • 06Проводить root cause analysis инцидентов и деградаций
  • 07Работать с метриками, логами и трассировками распределённых систем
  • 08Коррелировать события и выявлять деградации с использованием Prometheus, Grafana, OpenTelemetry, Jaeger
  • 09Оптимизировать производительность и масштабируемость систем
  • 10Настраивать параметры системы и проводить сравнительные тесты конфигураций
  • 11Участвовать в настройке и развитии горизонтального масштабирования, балансировки нагрузки, кэширования и отказоустойчивости
  • 12Реагировать на инциденты в продакшене и проводить анализ причин и последствий
  • 13Подготавливать постмортемы и внедрять меры предотвращения повторов

Требования

  • 01Глубокое понимание архитектуры Linux: kernel, scheduler, memory management, networking stack
  • 02Практический опыт диагностики и оптимизации производительности систем под нагрузкой
  • 03Уверенный опыт работы с инструментами низкоуровневой диагностики: perf, strace, tcpdump, vmstat
  • 04Понимание методологий анализа производительности: USE, RED, Golden Signals, capacity planning
  • 05Опыт работы с системами мониторинга и трассировки: Prometheus, Grafana, OpenTelemetry, ELK
  • 06Навыки анализа метрик, логов и трассировок распределённых систем
  • 07Понимание архитектуры и поведения систем под нагрузкой: horizontal scaling, load balancing, replication, fault tolerance
  • 08Глубокое знание сетевых протоколов: TCP/IP, HTTP, DNS, load balancing
  • 09Практический опыт диагностики сетевых задержек и проблем производительности
  • 10Навыки автоматизации диагностики и управления инфраструктурой: Bash, Python, Ansible, CI/CD

Условия

  • 01Гибкий график работы
  • 02Бонусы и скидки от партнеров
  • 03Офис в центре города
  • 04ДМС
  • 05Профессиональная команда
  • 06Формат работы Дистанционный Комбинированный
  • 07Уровень senior
  • 08График работы полный