Data Science (LLM/NLP)
По договоренности
Полный день•Занятость: Полная•Требуемый опыт: От 1 года до 3 лет
Рязань

Размер компании
-
Описание компании не указано
Описание вакансии
Работа в Т1 сочетает в себе преимущества инновационной ИТ-компании и крупного холдинга — стабильность и финансовую надежность, социальные гарантии и возможность развиваться в открытом ИТ-сообществе, масштабные задачи и гибридный формат работы
Дополнительно
Большим идеям нужна большая командаВ рамках направления Искусственного интеллекта мы занимаемся большими данными, разработкой платформ хранения информации, а также построением аналитических и рекомендательных систем для крупного бизнеса. Продукты и услуги направлены на реализацию задач цифровой трансформации в компаниях и организациях
с целью автоматизации внутренних и внешних бизнес-процессов, улучшения взаимодействия между подразделениями, повышения эффективности сервисов для клиентов и увеличения прибыли компаний.Чем предстоит заниматься:Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей;Построение решений на базе LLM моделей \ разработка промптов;Суммаризация информации для генерации кода и тестов;Генерация кода и тестов с помощью LLM;Определение роли пользователя \ выделение навыков с помощью LLM;Генерация рекомендаций по улучшению кода пользователя с помощью LLM;Построение RAG сервиса базы знаний по коду и тестам;Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатовЗдорово, если у тебя есть:Опыт работы в области NLP/LLM/ML от 2х лет;Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей;Детальное понимание моделей машинного обучения и алгоритмов;Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code;Знания Linux, bash, Docker (более глубокие знания DevOps будут плюсом, но не обязательны);Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, gradio, nltk, spacy, pymorphy, natasha, regex и др.);Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch;Опыт/знание хотя бы 1 фреймворка деплоя/квантизации: vLLM, CTranslate2, OpenLLM, DeepSpeed-MII, Text generation inference;Вывод ML/NLP моделей через интерфейс (gradio/streamlit, fastapi/flask, FastChat).