Бизнес-приложения VK Tech
Performance Engineer
DevOpsгибкийМосква
Навыки
LinuxperfstracetcpdumpiostatvmstatPrometheusGrafanaOpenTelemetryJaegerBashPythonAnsibleCI/CDTCP/IPHTTPDNSload balancing
Обязанности
- 01Проводить низкоуровневую диагностику производительности систем
- 02Выполнять системную диагностику Linux на уровне kernel, memory, networking и system calls
- 03Анализировать деградации CPU, IO и latency с использованием инструментов perf, strace, tcpdump, iostat
- 04Выявлять и локализовывать узкие места на уровне application, database, storage и network
- 05Строить профили производительности по latency, throughput и saturation
- 06Проводить root cause analysis инцидентов и деградаций
- 07Работать с метриками, логами и трассировками распределённых систем
- 08Коррелировать события и выявлять деградации с использованием Prometheus, Grafana, OpenTelemetry, Jaeger
- 09Оптимизировать производительность и масштабируемость систем
- 10Настраивать параметры системы и проводить сравнительные тесты конфигураций
- 11Участвовать в настройке и развитии горизонтального масштабирования, балансировки нагрузки, кэширования и отказоустойчивости
- 12Реагировать на инциденты в продакшене и проводить анализ причин и последствий
- 13Подготавливать постмортемы и внедрять меры предотвращения повторов
Требования
- 01Глубокое понимание архитектуры Linux: kernel, scheduler, memory management, networking stack
- 02Практический опыт диагностики и оптимизации производительности систем под нагрузкой
- 03Уверенный опыт работы с инструментами низкоуровневой диагностики: perf, strace, tcpdump, vmstat
- 04Понимание методологий анализа производительности: USE, RED, Golden Signals, capacity planning
- 05Опыт работы с системами мониторинга и трассировки: Prometheus, Grafana, OpenTelemetry, ELK
- 06Навыки анализа метрик, логов и трассировок распределённых систем
- 07Понимание архитектуры и поведения систем под нагрузкой: horizontal scaling, load balancing, replication, fault tolerance
- 08Глубокое знание сетевых протоколов: TCP/IP, HTTP, DNS, load balancing
- 09Практический опыт диагностики сетевых задержек и проблем производительности
- 10Навыки автоматизации диагностики и управления инфраструктурой: Bash, Python, Ansible, CI/CD
Условия
- 01Гибкий график работы
- 02Бонусы и скидки от партнеров
- 03Офис в центре города
- 04ДМС
- 05Профессиональная команда
- 06Формат работы Дистанционный Комбинированный
- 07Уровень senior
- 08График работы полный