other

Data Scientist (NLP)

30 мая 2024

З/П не указана

Город: Москва

СБЕР

Тип занятости: Полная занятость

Требуемый опыт: Опыт от 1 года

Кластер моделирования и исследования данных Блока «Стратегия и развитие» Сбера занимается разработкой AI-решений для различных бизнес-доменов подразделения: целеполагание и эффективность деятельности, управление численностью Группы, Data-driven инсайты для стратегии, анализ процессов и клиентских путей банка. Обязанности · консультирование / участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data Engineer; · end2end-разработка ML-моделей, доведение моделей из стадии MVP до целевого решения (все этапы ЖЦ моделей по CRISP-DM от Data Understanding до Deployment с использованием тех. стека банка); · NLP-задачи: Preprocessing, Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering и др.; · Domain Adaptation и дообучение (Lora SFT / SFT) большой языковой модели Сбера (GigaChat) с использованием внутренних / синтетических данных; · LLM Plugins (multi-hop reasoning, поиск, генерация fuse blocks для вызова внешних API); · разработка Python back-end сервисов для обслуживания моделей в ПРОМ-среде. Сопутствующие обязательные стримы: · взаимодействие с бизнес-заказчиком для выявления требований к AI-компоненте продукта; · участие в разработке архитектуры решения в части AI-компоненты (тех. стек для развертывания моделей в средах исполнения); участие в стримах по валидации моделей и постановке их на автомониторинг Требования · опыт в разработке NLP-моделей (обязательно) и рекомендательных систем (желательно); · умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов; · высокий уровень владения ядром Python и SQL; · свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn; · знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, XGBoost, CatBoost, TensorFlow, transformers; · опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp; · знание NN-архитектур: LSTM, трансформеры (GPT, BERT, BART, T5); · контейнеризация: Docker; · виртуализация: OpenShift; · брокеры сообщений: Kafka; · инструменты DevOps (MLOps): Git, Bitbucket, Nexus, Jenkins; · индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества; · технический английский (статьи, документация); преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком. Условия ипотека выгоднее для каждого сотрудника и льготные условия кредитования фитнес залы в офисах; бесплатная подписка СберПрайм+; скидки на продукты компаний-партнеров: Okko, Сбер Маркет, Delivery Club, Самокат, Сбер Еаптека и другие; ДМС с первого дня и льготное страхование для близких;корпоративная пенсионная программа; курсы для будущих родителей, материальная поддержка и тематическое сообщество для молодых мам; детский отдых и подарки за счет Компании; обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, тренинги, митапы и возможность получить новую квалификацию; реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей

Имя не указано

Откликнуться
Разместить Резюме
Пожаловаться ID: 115913425

Похожие вакансии

Data Scientist NLP

Договорная

Москва

СБЕР

Data Scientist (NLP)

Договорная

Москва

МегаФон

Data Scientist NLP

Договорная

Москва

СБЕР

Data Scientist (NLP)

Договорная

Москва

Samokat.tech

Data scientist NLP

Договорная

Москва

Ростелеком

Data Scientist (NLP)

Договорная

Москва

СБЕР