Перейти к основному содержимому
  1. Русскоязычные AI модели/
  2. Indi модели/

Илья Гусев (Ilya Gusev)

·349 слов·2 минут
Оглавление

Илья Гусев: Ключевой разработчик русскоязычных ИИ-моделей
#

Илья Гусев (IlyaGusev на Hugging Face) — российский специалист в области машинного обучения, известный своими вкладами в развитие русскоязычных LLM. Он является создателем серии моделей Saiga, которые представляют собой русские fine-tune популярных базовых LLM. Гусев имеет опыт работы с машинным переводом, семантическим поиском и чатботами на базе LLM, используя языки программирования Python и Java. Его проекты включают AI Trip Planner и Smart filters.

На Hugging Face на момент написания статьи пользователем загружено 12 моделей и 9 датасетов. Его работы фокусируются на адаптации глобальных моделей для русского языка.

Его Telegram-канал: Senior Augur

Ключевые модели Ильи Гусева
#

Гусев специализируется на серии Saiga — это русскоязычные fine-tune различных базовых LLM для задач генерации текста. Модели доступны в оригинальном формате и в GGUF для совместимости с llama.cpp, что позволяет запускать их локально с оптимизацией.

Основные модели Saiga:
#

  • saiga_llama3_8b: Русская fine-tune Llama-3 (8B параметров). Предназначена для генерации текста. Скачано: 372k раз. Ссылка на модель.
  • saiga_yandexgpt_8b: Русская версия YandexGPT (8B). Для русскоязычных задач. Скачано: 1.15k раз. Ссылка.
  • saiga_nemo_12b: На базе NVIDIA Nemotron (12B). Для продвинутой генерации. Скачано: 326 раз. Ссылка.
  • saiga_gemma3_12b: Русская fine-tune Gemma-3 (12B). Скачано: 382 раза. Ссылка.

GGUF-версии для эффективного инференса:
#

  • saiga_llama3_8b_gguf: GGUF-вариант saiga_llama3_8b. Скачано: 2.35k раз.
  • saiga_nemo_12b_gguf: GGUF saiga_nemo_12b. Скачано: 4.42k раз (самая популярная).
  • saiga_yandexgpt_8b_gguf: Скачано: 1.49k раз.
  • saiga_gemma3_12b_gguf: Скачано: 1.48k раз.

Эти модели оптимизированы для локального использования с llama.cpp, что делает их удобными для тестирования и деплоя на CPU/GPU.

Другие модели:
#

Гусев также разрабатывает модели для шахмат, такие как aicrowd_qwen3_4b_chess_d3_phase3_v3 и aicrowd_qwen3_8b_chess_sft_phase2 на базе Qwen3. Они предназначены для анализа шахматных партий и стратегий.

Датасеты и демо
#

  • Датасеты: 29 наборов данных, включая saiga_scored, saiga_preferences и gazeta — используются для обучения русских LLM.
  • Демо-спейсы:
    • Saiga 13b Q4_1 llama.cpp Retrieval QA: Загрузка файлов и QA на основе содержимого.
    • Saiga Nemo 12B GPTQ 8-bit: Чат-бот на русском.

Общий вклад
#

Илья Гусев активно продвигает открытые русскоязычные ИИ, делая глобальные модели доступными для русскоязычной аудитории. Его работы популярны в сообществе, с тысячами скачиваний. Он участвует в обсуждениях на Hugging Face и имеет публикации, связанные с AI.

Для подробностей посетите его профиль на Hugging Face.