Middle+/Senior ML Engineer

Уровень дохода не указан

Требуемый опыт работы: 1–3 года

Полная занятость, полный день

Возможно временное оформление: договор услуг, подряда, ГПХ, самозанятые, ИП

MIL Team

Москва

Напишите телефон, чтобы работодатель мог связаться с вами

Чтобы подтвердить, что вы не робот, введите текст с картинки:
captcha

Мы делаем крутые исследовательские проекты командой mil-team.ru, публикуем научные статьи и развиваем продукт compressa.ai по оптимизации инференса LLM моделей. Делаем так, чтобы LLM-ки (и не только они) работали в контуре, дешевле, быстрее. Ищем крутого и инициативного спеца в ключевую команду.

Обязанности:

  • Развивать движок инференса LLM моделей (делаем его быстрее, чем vllm);
  • Предлагать и доводить до прода улучшения методов компрессии LLM;
  • Внедрять SotA технологии инференса и сжатия моделей в платформу.

Твой опыт:

  • Использовал и модифицировал фреймворки запуска сеток (ONNX, TensorRT-LLM, llama.cpp, Vllm) + писал кастомные CUDA-ядра;
  • Применял и модифицировал методы программной оптимизации LLM, знаешь SotA: спарсификация, квантизация, дистилляция;
  • Обучал LoRA-адаптеры или файнтюнил LLM модели.

Условия:

  • full-time или part-time (20 часов/неделю), удаленка

Ключевые навыки

  • Python
  • Английский — B2 — Средне-продвинутый

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Где располагается место работы?Какой график работы?Вакансия открыта?Какая оплата труда?Как с вами связаться?Другой вопрос

Вакансия опубликована 14 июня 2024 в Москве

Похожие вакансии

MIL Team

Москва