Разработчик в ML Infra

Any

По договоренности

ОфисЗанятость: ПолнаяТребуемый опыт: От 3 до 5 лет

Москва

Откликнуться
company logo
Яндекс
Перейти на сайт

Размер компании

-

Описание компании не указано

Описание вакансии

В Яндексе больше тысячи ML-разработчиков запускают на десятках тысяч GPU очень много очень разных обучений. Один запускает state-of-the-art-модели на суперкластере из тысяч видеокарт, опережающих по эффективности использования GPU лучшие опенсорс-решения. Другой по ошибке 95% времени сохраняет checkpoint, зарезервировав за собой десятки видеокарт. А большинство обучений — где-то посередине. У утилизации GPU большой потенциал роста. При этом видеокарты стоят громадных денег и всё больше и больше требуются всем ML-командам. Осознав это, мы решили, что будем оптимизировать утилизацию GPU во всей компании. Эту задачу пытаются решить во всём мире, и до сих пор нет единого решения, покрывающего все случаи. Поэтому мы двигаемся очень быстро и хотим стать одними из лучших. Для этого мы: Улучшать эффективность обученийМы активно погружаемся в крупные процессы обучения ML-моделей, разбираемся, почему утилизация GPU в процессах низкая и как её можно увеличить. Оптимизируем процессы вместе с их разработчиками и приносим им лучшие практики компании. Разрабатывать сервисы, чтобы лучше утилизировать GPUВам предстоит поучаствовать в разработке множества наших сервисов. Вот что они делают: Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев. Мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные20%. В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей. Также мы оплачиваем участие в профильных конференциях — как в качестве спикера, так и в качестве участника. Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов. Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей. Можете заниматься самостоятельно, а можете с корпоративным тренером. В Яндексе есть спортивный клуб и много спортивных команд. У них есть свои лидеры, чаты, программы тренировок. А ещё они регулярно участвуют в забегах, триатлонах, «Гонке героев», футбольных и других соревнованиях. Вы сможете присоединиться к существующим командам или собрать свою. У нас нет фиксированного времени начала и конца рабочего дня — работайте так, как удобно вам и вашей команде. Льготная ставка на покупку жилья и улучшение жилищных условий — в зависимости от стажа, позиции и результатов ревью. Действует для сотрудников, работающих в российских офисах Яндекса.

Дополнительно

Вырабатываем и распространяем лучшие практики эффективного обучения и инференса Помогаем крупным потребителям улучшить утилизацию любыми способами: уговорами, советами, дебагом, написанием кода для их обучения Собираем всевозможную аналитику об утилизации GPU Разрабатываем инструменты, чтобы растить эффективность и разбираться в причинах неэффективного использования Улучшаем общую инфраструктуру вместе с её разработчиками Следят за всеми обучениями в компании и сообщают о плохих запусках Снимают GPU-профили со всех обучений Анализируют логи обучения и выводят на график его стадии, значительно упрощая и ускоряя дебаг низкой утилизации GPU Хорошо умеете писать код на Python Разбираетесь в том, как устроены обучение и инференс моделей