Site Reliability Engineer (SRE) в команду YTsaurus в VK
По договоренности
Hybrid, remote•Занятость: Полная•Требуемый опыт: Не указан
Москва

Размер компании
-
Описание компании не указано
Описание вакансии
YTsaurus— опенсорс-платформа для хранения и обработки данных, которую в VK активно развивают и используют как основу единого дата-лейка. Система обрабатывает миллионы событий в секунду на динамических таблицах, работает с сотнями петабайт данных и обслуживает тысячи пользователей. У нас большие кластеры, сложная инфраструктура и высокие требования к надёжности. И мы ищемSRE, который поможет поддерживать и развивать всё это. VK — это более 200 технологичных проектов, больше 15 000 сотрудников и безграничные возможности проявить себя. Мы делаем современные и быстрые интернет-сервисы, доступные каждому. Задачи: Автоматизировать эксплуатацию YTsaurus;; интегрировать платформу с внутренними системами VK;; следить за стабильностью и производительностью;; разбираться с проблемами на уровне кода (в основном C++);; решать задачи, которые не гуглятся;; разбираться с инцидентами в рамках дежурств (дежурства нерабочее время оплачиваются дополнительно);; масштабировать кластер YTsaurus до 500ПБ;; заниматься оптимизацией использования железа (CPU, диски). Требования: Опыт работы с распределёнными системами;; знания в области сетей (TCP/IP, DNS, балансировка, ACL) и ОС Linux;; способность работать самостоятельно: формулировать цели, предлагать решения.
Дополнительно
Секреты цифровой доступности Как попасть в команду Участие в развитии ключевой технологической платформы VK; влияние на архитектуру и инфраструктуру дата-лейка масштабов сотен петабайт; сильная команда инженеров, готовых делиться знаниями; Бонусы: Гибкий график работы; Бонусы и скидки от партнеров; Офис в центре города; ДМС; Профессиональная команда Дополнительные плюсы: Опыт работы с высоконагруженными системами или большими объёмами данных;; владение C++ на уровне чтения и отладки сложного кода.