Open Data Science
Senior Computer Use AI Agents Engineer (remote)
Open Data Science, Berkeley, California, United States, 94709
В AI стартап на удаленку ищем Senior Computer Use AI Agents Engineer
Обязанности
Разработка и улучшение Computer Use (CUA) агентов: perception, reasoning, planning, action execution.
Проектирование и обучение LLM/VLM моделей: от дообучения до обучения с нуля (если требуется).
Построение и поддержка бенчмарков, автотестов и метрик качества для CUI-агентов.
Разработка пайплайнов, datasets, симуляторов и инструментов для безопасного обучения агентов.
Оптимизация inference, настройка LoRA/QLoRA, distillation, адаптации под on-premise и ограниченные GPU.
Работа с RAG, memory, tool-use, multi-agent pipelines.
Участие в R&D экспериментах, fast-iteration режиме по запуску новых фич.
Требования
Сильный инженерный/исследовательский бэкграунд, идеальный вариант — выпускник топ-университета (Stanford, MIT, Berkeley, ETH, CMU или MIPT).
Опыт работы в командах крупных AI-игроков (FAANG, OpenAI, Anthropic, DeepMind, xAI, NVIDIA, HuggingFace — или аналогичные масштабные проекты).
Глубокий опыт в обучении и дообучении LLM и VLM моделей (PyTorch, JAX).
Практический опыт разработки COMPUTER USE агентов.
Опыт в построении бенчмарков, метрик и системной оценки моделей.
Плюсы
Опыт применения Reinforcement Learning (RLHF/RLAIF, PPO, DPO, curriculum learning).
Знание LoRA/QLoRA, quantization, SFT, distillation.
Публикации по ML/AI (NeurIPS, ICML, ICLR, CVPR, ACL и др).
Опыт работы с большими датасетами, synthetic data pipelines.
Фултайм, удаленка Контракт с зарубежным юр. лицом
#J-18808-Ljbffr
Обязанности
Разработка и улучшение Computer Use (CUA) агентов: perception, reasoning, planning, action execution.
Проектирование и обучение LLM/VLM моделей: от дообучения до обучения с нуля (если требуется).
Построение и поддержка бенчмарков, автотестов и метрик качества для CUI-агентов.
Разработка пайплайнов, datasets, симуляторов и инструментов для безопасного обучения агентов.
Оптимизация inference, настройка LoRA/QLoRA, distillation, адаптации под on-premise и ограниченные GPU.
Работа с RAG, memory, tool-use, multi-agent pipelines.
Участие в R&D экспериментах, fast-iteration режиме по запуску новых фич.
Требования
Сильный инженерный/исследовательский бэкграунд, идеальный вариант — выпускник топ-университета (Stanford, MIT, Berkeley, ETH, CMU или MIPT).
Опыт работы в командах крупных AI-игроков (FAANG, OpenAI, Anthropic, DeepMind, xAI, NVIDIA, HuggingFace — или аналогичные масштабные проекты).
Глубокий опыт в обучении и дообучении LLM и VLM моделей (PyTorch, JAX).
Практический опыт разработки COMPUTER USE агентов.
Опыт в построении бенчмарков, метрик и системной оценки моделей.
Плюсы
Опыт применения Reinforcement Learning (RLHF/RLAIF, PPO, DPO, curriculum learning).
Знание LoRA/QLoRA, quantization, SFT, distillation.
Публикации по ML/AI (NeurIPS, ICML, ICLR, CVPR, ACL и др).
Опыт работы с большими датасетами, synthetic data pipelines.
Фултайм, удаленка Контракт с зарубежным юр. лицом
#J-18808-Ljbffr