Илья Гусев: Ключевой разработчик русскоязычных ИИ-моделей#
Илья Гусев (IlyaGusev на Hugging Face) — российский специалист в области машинного обучения, известный своими вкладами в развитие русскоязычных LLM. Он является создателем серии моделей Saiga, которые представляют собой русские fine-tune популярных базовых LLM. Гусев имеет опыт работы с машинным переводом, семантическим поиском и чатботами на базе LLM, используя языки программирования Python и Java. Его проекты включают AI Trip Planner и Smart filters.
На Hugging Face на момент написания статьи пользователем загружено 12 моделей и 9 датасетов. Его работы фокусируются на адаптации глобальных моделей для русского языка.
Его Telegram-канал: Senior Augur
Ключевые модели Ильи Гусева#
Гусев специализируется на серии Saiga — это русскоязычные fine-tune различных базовых LLM для задач генерации текста. Модели доступны в оригинальном формате и в GGUF для совместимости с llama.cpp, что позволяет запускать их локально с оптимизацией.
Основные модели Saiga:#
- saiga_llama3_8b: Русская fine-tune Llama-3 (8B параметров). Предназначена для генерации текста. Скачано: 372k раз. Ссылка на модель.
- saiga_yandexgpt_8b: Русская версия YandexGPT (8B). Для русскоязычных задач. Скачано: 1.15k раз. Ссылка.
- saiga_nemo_12b: На базе NVIDIA Nemotron (12B). Для продвинутой генерации. Скачано: 326 раз. Ссылка.
- saiga_gemma3_12b: Русская fine-tune Gemma-3 (12B). Скачано: 382 раза. Ссылка.
GGUF-версии для эффективного инференса:#
- saiga_llama3_8b_gguf: GGUF-вариант saiga_llama3_8b. Скачано: 2.35k раз.
- saiga_nemo_12b_gguf: GGUF saiga_nemo_12b. Скачано: 4.42k раз (самая популярная).
- saiga_yandexgpt_8b_gguf: Скачано: 1.49k раз.
- saiga_gemma3_12b_gguf: Скачано: 1.48k раз.
Эти модели оптимизированы для локального использования с llama.cpp, что делает их удобными для тестирования и деплоя на CPU/GPU.
Другие модели:#
Гусев также разрабатывает модели для шахмат, такие как aicrowd_qwen3_4b_chess_d3_phase3_v3 и aicrowd_qwen3_8b_chess_sft_phase2 на базе Qwen3. Они предназначены для анализа шахматных партий и стратегий.
Датасеты и демо#
- Датасеты: 29 наборов данных, включая saiga_scored, saiga_preferences и gazeta — используются для обучения русских LLM.
- Демо-спейсы:
- Saiga 13b Q4_1 llama.cpp Retrieval QA: Загрузка файлов и QA на основе содержимого.
- Saiga Nemo 12B GPTQ 8-bit: Чат-бот на русском.
Общий вклад#
Илья Гусев активно продвигает открытые русскоязычные ИИ, делая глобальные модели доступными для русскоязычной аудитории. Его работы популярны в сообществе, с тысячами скачиваний. Он участвует в обсуждениях на Hugging Face и имеет публикации, связанные с AI.
Для подробностей посетите его профиль на Hugging Face.
