VS Code + NaN Builders
Guía completa para utilizar los modelos del cluster de NaN dentro de VS Code Agent Mode.
¿Qué es NaN?
NaN es una comunidad de builders que comparte GPUs dedicadas para ejecutar modelos abiertos a gran escala.
En lugar de pagar por APIs cerradas con límites artificiales de uso, los miembros comparten el coste real de la infraestructura y acceden a modelos abiertos con uso intensivo.
Características
- GPUs compartidas entre miembros
- Tokens prácticamente ilimitados para uso normal dentro del cluster
- Sin entrenamiento con tus datos
- Sin almacenamiento de prompts
- Infraestructura alojada en la Unión Europea
- API key personal por miembro
- API OpenAI-compatible
- Comunidad privada orientada a builders
Más información:
Modelos disponibles
Todos los modelos utilizan:
Base URL:
https://api.nan.builders/v1
Compatible con:
- OpenAI SDK
- VS Code Copilot Custom Models
- Cursor
- Cline
- Roo Code
- OpenCode
- Continue
- Open WebUI
- LangChain
- LlamaIndex
- Agentes personalizados
Resumen rápido
| Modelo |
Tipo |
Vision |
Audio |
Tool Calling |
Reasoning |
Contexto |
TPM |
| Qwen 3.6 |
LLM Principal |
✅ |
❌ |
✅ XML |
✅ |
256K |
1.5M |
| DeepSeek V4 Flash |
LLM |
❌ |
❌ |
✅ Function Calling |
✅ |
1M |
1.5M |
| MiMo V2.5 |
Omnimodal |
✅ |
✅ |
✅ Function Calling |
✅ |
1M |
1.5M |
| Gemma4 |
LLM |
✅ |
❌ |
✅ XML |
✅ |
256K |
1.5M |
| Qwen3 Embedding |
Embeddings |
N/A |
N/A |
N/A |
N/A |
N/A |
60 RPM |
| Whisper |
STT |
N/A |
Audio → Texto |
N/A |
N/A |
N/A |
10 RPM |
| Kokoro |
TTS |
N/A |
Texto → Audio |
N/A |
N/A |
N/A |
15 RPM |
Fuente:
https://nan.builders/docs/models
Ranking recomendado
🥇 Qwen 3.6
El modelo principal del cluster.
Ideal para:
- Uso diario
- Agent Mode
- Programación
- Refactors
- Chat técnico
- Vision ligera
- Automatizaciones
Ventajas:
- Muy rápido
- Excelente relación calidad/velocidad
- Vision integrada
- Tool Calling
- Reasoning
🥈 DeepSeek V4 Flash
Ideal para:
- Repositorios enormes
- Contextos gigantes
- Refactors complejos
- Arquitectura de software
- Agentes avanzados
Ventajas:
- 1M de contexto
- Muy buen rendimiento en coding
- Function Calling nativo
🥉 MiMo V2.5
El modelo más completo del cluster.
Ideal para:
- Capturas de pantalla
- Diseño UI
- Diagramas
- Imágenes
- Audio
- Aplicaciones multimodales
Ventajas:
- Vision
- Audio
- Tool Calling
- Reasoning
- Contexto de 1M
Gemma4
Ideal para:
- Vision ligera
- OCR
- Documentación
- Chat técnico rápido
Ventajas:
- Muy eficiente
- Vision integrada
- Buen razonamiento
DeepSeek V4 Flash
Especificaciones
| Propiedad |
Valor |
| Tipo |
MoE |
| Parámetros |
284B |
| Activos por token |
21B |
| Cuantización |
FP8 |
| Contexto |
1M |
| Tool Calling |
Sí |
| Reasoning |
Sí |
| Vision |
No |
| Audio |
No |
| TPM |
1.5M |
| Cuota |
500M tokens/mes |
Capacidades
- Tool Calling
- Reasoning Mode
- Streaming SSE
- Contexto de 1 millón de tokens
Casos de uso
- Repositorios monolíticos
- Refactors masivos
- Arquitectura software
- Análisis de código a gran escala
- Generación de documentación
Referencias:
MiMo V2.5
Especificaciones
| Propiedad |
Valor |
| Tipo |
Omnimodal |
| Parámetros |
310B |
| Activos por token |
15B |
| Cuantización |
FP8 |
| Contexto |
1M |
| Vision |
Sí |
| Audio |
Sí |
| Tool Calling |
Function Calling |
| Reasoning |
Sí |
| TPM |
1.5M |
| Cuota |
500M tokens/mes |
| Licencia |
MIT |
Modalidades
Input
Output
Capacidades
- Tool Calling
- Reasoning
- Vision
- Audio
- Streaming SSE
- Contexto de 1 millón de tokens
Casos de uso
- UI Reviews
- Diseño
- Capturas de pantalla
- Audio
- Agentes multimodales
- Documentación visual
Referencias:
Gemma4
Especificaciones
| Propiedad |
Valor |
| Tipo |
MoE |
| Parámetros |
26B |
| Activos por token |
4B |
| Cuantización |
FP8 |
| Contexto |
256K |
| Vision |
Sí |
| Tool Calling |
XML |
| Reasoning |
Sí |
| TPM |
1.5M |
Capacidades
- Vision
- Tool Calling XML
- Reasoning
- Streaming SSE
Casos de uso
- OCR
- Capturas
- PDFs
- Chat técnico
- Análisis visual
Referencias:
Qwen 3.6
Especificaciones
| Propiedad |
Valor |
| Tipo |
MoE |
| Parámetros |
35B |
| Activos por token |
3B |
| Cuantización |
FP8 |
| Contexto |
256K |
| Vision |
Sí |
| Tool Calling |
XML |
| Reasoning |
Sí |
| TPM |
1.5M |
| Speculative Decoding |
MTP (~2x throughput) |
Capacidades
- Vision
- Tool Calling XML
- Reasoning
- Streaming SSE
- Multimodal
Casos de uso
- Modelo principal
- Agent Mode
- Coding diario
- Refactors
- Vision
- Pair Programming
- Automatizaciones
¿Por qué es el modelo principal?
Según la documentación de NaN:
El modelo principal. MoE de 35B parámetros, multimodal, con tool calling y reasoning.
Combina:
- Muy buena velocidad
- Vision
- Tool Calling
- Contexto amplio
- Bajo coste computacional por token
Referencias:
Modelos auxiliares
Qwen3 Embedding
Especificaciones
| Propiedad |
Valor |
| Parámetros |
8B |
| Dimensiones |
4096 |
| Idiomas |
100+ |
| MMTEB |
70.58 |
| RPM |
60 |
Casos de uso
- RAG
- Semantic Search
- Retrieval
- Clasificación
- Similitud semántica
Ejemplo
- Español ↔ Inglés
- Búsqueda documental
- Bases vectoriales
Referencias:
Whisper Large-v3
Speech To Text.
Características
| Propiedad |
Valor |
| Modelo |
large-v3 |
| Idiomas |
99+ |
| WER Español |
~3.2% |
| RPM |
10 |
| Tamaño |
~3 GB |
Capacidades
- Transcripción
- Detección automática de idioma
- OpenAI Compatible
Limitaciones
Tamaño máximo
Recomendado
Evitar
Timeout
Audios superiores a:
pueden producir timeout.
Dividir audios largos en fragmentos.
Referencias:
Kokoro
Text To Speech.
Características
| Propiedad |
Valor |
| Parámetros |
82M |
| Voces |
67 |
| Latencia |
<1s |
| RPM |
15 |
Voces destacadas
| Voz |
Idioma |
| ef_dora |
Español |
| em_alex |
Español |
| af_heart |
Inglés |
Casos de uso
- Voice Assistants
- Lectura de documentos
- Narración
- Accesibilidad
Referencias:
Configuración en VS Code
Requisitos
Instalar:
- GitHub Copilot
- GitHub Copilot Chat
Versión recomendada:
Documentación:
Dónde colocar la configuración
Windows
%APPDATA%\Code\User\chatLanguageModels.json`
Linux
~/.config/Code/User/chatLanguageModels.json
macOS
~/Library/Application Support/Code/User/chatLanguageModels.json
Configuración completa para VS Code
[
{
"name": "NaN",
"vendor": "customendpoint",
"apiKey": "${input:chat.lm.secret.nan}",
"apiType": "chat-completions",
"models": [
{
"id": "qwen3.6",
"name": "Qwen 3.6 (35B-A3B) (Primary Model)",
"url": "https://api.nan.builders/v1",
"toolCalling": true,
"thinking": true,
"vision": true,
"supportsReasoningEffort": [
"low",
"medium",
"high"
],
"maxInputTokens": 262144,
"maxOutputTokens": 65536,
"editTools": [
"apply-patch",
"multi-find-replace"
]
},
{
"id": "deepseek-v4-flash",
"name": "DeepSeek V4 Flash",
"url": "https://api.nan.builders/v1",
"toolCalling": true,
"thinking": true,
"vision": false,
"supportsReasoningEffort": [
"low",
"medium",
"high"
],
"maxInputTokens": 1048576,
"maxOutputTokens": 65536,
"editTools": [
"apply-patch",
"multi-find-replace"
]
},
{
"id": "mimo-v2.5",
"name": "MiMo V2.5",
"url": "https://api.nan.builders/v1",
"toolCalling": true,
"thinking": true,
"vision": true,
"audio": true,
"supportsReasoningEffort": [
"low",
"medium",
"high"
],
"maxInputTokens": 1048576,
"maxOutputTokens": 65536,
"editTools": [
"apply-patch",
"multi-find-replace"
]
},
{
"id": "gemma4",
"name": "Gemma4",
"url": "https://api.nan.builders/v1",
"toolCalling": true,
"thinking": true,
"vision": true,
"supportsReasoningEffort": [
"low",
"medium",
"high"
],
"maxInputTokens": 262144,
"maxOutputTokens": 32768,
"editTools": [
"apply-patch",
"multi-find-replace"
]
}
]
}
]
Qué significa cada opción
Fuente oficial:
https://code.visualstudio.com/docs/agent-customization/language-models
toolCalling
Permite utilizar herramientas.
Necesario para Agent Mode.
thinking
Indica soporte para razonamiento avanzado.
supportsReasoningEffort
Permite elegir:
vision
Permite enviar imágenes.
audio
Permite enviar audio.
editTools
Permite edición avanzada de archivos.
maxInputTokens
Contexto máximo soportado.
maxOutputTokens
Respuesta máxima generada.
Privacidad
Todos los modelos del cluster NaN comparten:
- Sin logs de prompts
- Sin entrenamiento con tus datos
- Infraestructura en la UE
- API key individual
- Acceso mediante comunidad privada
Tu código no se utiliza para entrenar modelos.
Referencias
NaN
VS Code
Modelos
DeepSeek
Qwen
Gemma
Whisper
Kokoro
VS Code + NaN Builders
Guía completa para utilizar los modelos del cluster de NaN dentro de VS Code Agent Mode.
¿Qué es NaN?
NaN es una comunidad de builders que comparte GPUs dedicadas para ejecutar modelos abiertos a gran escala.
En lugar de pagar por APIs cerradas con límites artificiales de uso, los miembros comparten el coste real de la infraestructura y acceden a modelos abiertos con uso intensivo.
Características
Más información:
Modelos disponibles
Todos los modelos utilizan:
Compatible con:
Resumen rápido
Fuente:
https://nan.builders/docs/models
Ranking recomendado
🥇 Qwen 3.6
El modelo principal del cluster.
Ideal para:
Ventajas:
🥈 DeepSeek V4 Flash
Ideal para:
Ventajas:
🥉 MiMo V2.5
El modelo más completo del cluster.
Ideal para:
Ventajas:
Gemma4
Ideal para:
Ventajas:
DeepSeek V4 Flash
Especificaciones
Capacidades
Casos de uso
Referencias:
MiMo V2.5
Especificaciones
Modalidades
Input
Output
Capacidades
Casos de uso
Referencias:
Gemma4
Especificaciones
Capacidades
Casos de uso
Referencias:
Qwen 3.6
Especificaciones
Capacidades
Casos de uso
¿Por qué es el modelo principal?
Según la documentación de NaN:
Combina:
Referencias:
Modelos auxiliares
Qwen3 Embedding
Especificaciones
Casos de uso
Ejemplo
Referencias:
Whisper Large-v3
Speech To Text.
Características
Capacidades
Limitaciones
Tamaño máximo
Recomendado
Evitar
Timeout
Audios superiores a:
pueden producir timeout.
Dividir audios largos en fragmentos.
Referencias:
Kokoro
Text To Speech.
Características
Voces destacadas
Casos de uso
Referencias:
Configuración en VS Code
Requisitos
Instalar:
Versión recomendada:
Documentación:
Dónde colocar la configuración
Windows
Linux
macOS
Configuración completa para VS Code
[ { "name": "NaN", "vendor": "customendpoint", "apiKey": "${input:chat.lm.secret.nan}", "apiType": "chat-completions", "models": [ { "id": "qwen3.6", "name": "Qwen 3.6 (35B-A3B) (Primary Model)", "url": "https://api.nan.builders/v1", "toolCalling": true, "thinking": true, "vision": true, "supportsReasoningEffort": [ "low", "medium", "high" ], "maxInputTokens": 262144, "maxOutputTokens": 65536, "editTools": [ "apply-patch", "multi-find-replace" ] }, { "id": "deepseek-v4-flash", "name": "DeepSeek V4 Flash", "url": "https://api.nan.builders/v1", "toolCalling": true, "thinking": true, "vision": false, "supportsReasoningEffort": [ "low", "medium", "high" ], "maxInputTokens": 1048576, "maxOutputTokens": 65536, "editTools": [ "apply-patch", "multi-find-replace" ] }, { "id": "mimo-v2.5", "name": "MiMo V2.5", "url": "https://api.nan.builders/v1", "toolCalling": true, "thinking": true, "vision": true, "audio": true, "supportsReasoningEffort": [ "low", "medium", "high" ], "maxInputTokens": 1048576, "maxOutputTokens": 65536, "editTools": [ "apply-patch", "multi-find-replace" ] }, { "id": "gemma4", "name": "Gemma4", "url": "https://api.nan.builders/v1", "toolCalling": true, "thinking": true, "vision": true, "supportsReasoningEffort": [ "low", "medium", "high" ], "maxInputTokens": 262144, "maxOutputTokens": 32768, "editTools": [ "apply-patch", "multi-find-replace" ] } ] } ]Qué significa cada opción
Fuente oficial:
https://code.visualstudio.com/docs/agent-customization/language-models
toolCalling
Permite utilizar herramientas.
Necesario para Agent Mode.
thinking
Indica soporte para razonamiento avanzado.
supportsReasoningEffort
Permite elegir:
vision
Permite enviar imágenes.
audio
Permite enviar audio.
editTools
Permite edición avanzada de archivos.
maxInputTokens
Contexto máximo soportado.
maxOutputTokens
Respuesta máxima generada.
Privacidad
Todos los modelos del cluster NaN comparten:
Tu código no se utiliza para entrenar modelos.
Referencias
NaN
VS Code
Modelos
DeepSeek
Qwen
Gemma
Whisper
Kokoro