🧪 Model Testing Report

Дата: 31 марта 2026, 09:35—09:39 UTC

5 моделей протестировано 3 вопроса (Q1, Q2, Q3) Minimax, GLM, Kimi, Nemotron

Q1: Время (UTC/MSK) — Простой вопрос

Вопрос: «Сколько сейчас времени в UTC и MSK?»

МодельВремя ответаРезультатОценка
glm-5:cloud 0.5 сек ✅ 09:36 UTC / 12:36 MSK (2026-03-31) 5/5
minimax-m2.5:cloud 2 сек ✅ 09:36 UTC / 12:36 MSK 5/5
kimi-k2.5:cloud 2 сек ✅ 09:36 UTC / 12:36 MSK (2026-03-31) 5/5
minimax-m2.7:cloud 3 сек ✅ 09:36:32 UTC / 12:36:32 MSK 5/5
nemotron-3-super:cloud 0.69 сек Галлюцинация! — выдала 2024-06-15 вместо 2026-03-31 1/5

Q2: curl статусы — Средний вопрос

Вопрос: «Проверь curl статус Kanban и n8n»

МодельKanbann8nРезультатОценка
glm-5:cloud 200 ✅ 200 ✅ Оба сервиса доступны 5/5
minimax-m2.5:cloud 200 ✅ 200 ✅ Оба сервиса работают 5/5
kimi-k2.5:cloud 200 ✅ 200 ✅ HTTP 200 OK для обоих 5/5
minimax-m2.7:cloud 200 ✅ 200 ✅ Оба сервиса работают 5/5
nemotron-3-super:cloud 200 ✅ 200 ✅ curl корректен, данные верны 5/5

Q3: Резюме AI агентов — Сложный вопрос

Вопрос: «Напиши краткое резюме про AI агентов (3-4 предложения)»

glm-5:cloud:
Время ответа: 2 сек | Оценка: 5/5

AI-агенты — это автономные системы, способные воспринимать окружение, принимать решения и выполнять действия для достижения поставленных целей без постоянного человеческого контроля. Современные агенты используют LLM как «мозг» для планирования, рассуждений и адаптации к новым ситуациям, комбинируя их с инструментами (веб-поиск, API, файловая система) для выхода за пределы чистого текста. Ключевые архитектурные паттерны включают ReAct (рассуждение → действие), chain-of-thought планирование и иерархическую декомпозицию задач. Главная сложность — баланс между автономностью и безопасностью, а также надёжная оценка намерений пользователя.

📊 Итоговая таблица

МодельQ1Q2Q3Итог verdict
glm-5:cloud 5 5 5 ⭐ 5/5 РЕКОМЕНДОВАН
minimax-m2.5:cloud 5 5 5/5 РЕКОМЕНДОВАН
kimi-k2.5:cloud 5 5 5/5 Подтверждён для cron
minimax-m2.7:cloud 5 5 5/5 Primary (main)
nemotron-3-super:cloud 1 5 3/5 ⚠️ НЕ использовать

🔍 Ключевые выводы

✅ glm-5:cloud — Лучший fallback

✅ minimax-m2.5:cloud — Стабильный

⚠️ nemotron-3-super:cloud — Опасная

📋 Рекомендации

Действия по результатам:

  1. ✅ nemotron добавлен в конфиг (доступен для ручного выбора)
  2. ✅ Убран из fallback списка main агента (автоматически не используется)
  3. ✅ Подтверждено: все 4 остальные модели работают корректно
  4. ✅ glm-5 рекомендуется как primary fallback

⚙️ Конфигурация после теста

Рекомендуемый порядок fallback для main:

fallbacks: 1. ollama/glm-5:cloud # 0.5с — самый быстрый 2. ollama/minimax-m2.5:cloud # 2с — стабильный 3. ollama/nemotron-3-super:cloud # только по запросу!

🤖 Конфигурация агентов

АгентМодельСтатус
mainminimax-m2.7:cloudPrimary
cronkimi-k2.5:cloudПодтверждена
workerqwen3-coder-next:cloudБез изменений
researchergemini-3-flash-preview:latestБез изменений

Report generated by Fayrik • 2026-03-31