WI
Wildberries
Data Quality Engineer/Analyst в Портал продавцов
От 1 годаГибридМосква
Обязанности:
участвовать в проектировании ETL-процессов (Airflow, Spark) с учетом best practices data quality;
выработать методологию мониторинга качества данных (DQ metrics, дашборды, алерты);
улучшать Data Quality фреймворк;
вести каталога данных и поддерживать актуальность метаданных;
автоматизировать проверки данных, в том числе их интеграции в пайплайны;
проводить анализ инцидентов с данными и координировать их исправления;
взаимодействовать с заказчиками: команды аналитиков, инженеров и ML.
Требования:
опыт в Data Quality / Data Observability от 2+ лет;
продвинутый SQL (оптимизация, оконные функции);
продвинутый Python (Pandas, PySpark), в т.ч. проектирование новых сервисов;
опыт с оркестраторами;
знание подходов к тестированию данных (unit, integration, regression tests);
понимание DWH, Data Lakes и их особенностей;
опыт с Sodа (или с Great Expectations, Deequ/PyDeequ, dbt testing);
знание Data Governance (метаданные, lineage, stewardship);
аналитические навыки и проактивность.
Условия:
Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.