Использование малых моделей
AnyLLM CLI поддерживает два типа моделей, которые можно настроить в anyllm.json. Это обеспечивает большую гибкость в выборе правильного инструмента для вашей задачи.
Типы моделей
-
Большие модели (по умолчанию): Это мощные модели общего назначения, которые поддерживают "Function Calling" или "Tools". Они могут понимать сложные инструкции и взаимодействовать с файловой системой через структурированный API. Это режим по умолчанию.
-
Малые модели (
type: "small"): Это более легкие модели, которые могут не поддерживать вызов функций. Вместо этого они работают, генерируя специальные текстовые команды для редактирования кода. Этот подход вдохновлен инструментом Aider и позволяетanyllm-cliработать с более широким спектром open-source моделей.
Конфигурация
Чтобы использовать малую модель, добавьте параметр "type": "small" в ее конфигурацию в вашем файле anyllm.json:
{
"provider": {
"ollama_local": {
"name": "Ollama (Локальный)",
"type": "openai_compatible",
"options": {
"baseURL": "http://localhost:11434/v1/",
"headers": {
"Authorization": "Bearer ollama"
}
},
"models": {
"phi3": {
"name": "phi3:mini",
"type": "small"
},
"deepseek": {
"name": "deepseek-coder"
}
}
}
}
}
В этом примере phi3 настроена как малая модель, в то время как deepseek будет использоваться как большая модель по умолчанию.
Важные замечания по малым моделям
Используйте с осторожностью Малые модели предлагают гибкость, но имеют свои компромиссы.
- Они не гарантируют высокое качество кода или идеальное понимание инструкций.
- Для достижения желаемого результата может потребоваться несколько попыток или уточнений промпта. Будьте терпеливы и точны в своих запросах.
- В отличие от больших LLM, малые модели часто узкоспециализированы. Модель, обученная для написания кода, может плохо справляться с общими разговорами, и наоборот.
Крайне важно выбирать специализированную модель, соответствующую вашей задаче.
Рекомендуемые модели
Вот несколько примеров специализированных моделей, которые хорошо зарекомендовали себя в определенных областях:
-
Для анализа кода:
hf.co/unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF:Q4_K_M -
Для программирования на PHP:
hf.co/phpcorer/opo:latest -
Для общих задач ИИ-ассистента:
hf.co/microsoft/Phi-3-mini-4k-instruct-gguf:latest