config para VS Code

# VS Code + NaN Builders

Guía completa para utilizar los modelos del cluster de NaN dentro de VS Code Agent Mode.

---

# ¿Qué es NaN?

NaN es una comunidad de builders que comparte GPUs dedicadas para ejecutar modelos abiertos a gran escala.

En lugar de pagar por APIs cerradas con límites artificiales de uso, los miembros comparten el coste real de la infraestructura y acceden a modelos abiertos con uso intensivo.

## Características

* GPUs compartidas entre miembros
* Tokens prácticamente ilimitados para uso normal dentro del cluster
* Sin entrenamiento con tus datos
* Sin almacenamiento de prompts
* Infraestructura alojada en la Unión Europea
* API key personal por miembro
* API OpenAI-compatible
* Comunidad privada orientada a builders

Más información:

* https://nan.builders/

---

# Modelos disponibles

Todos los modelos utilizan:

```text
Base URL:
https://api.nan.builders/v1
```

Compatible con:

* OpenAI SDK
* VS Code Copilot Custom Models
* Cursor
* Cline
* Roo Code
* OpenCode
* Continue
* Open WebUI
* LangChain
* LlamaIndex
* Agentes personalizados

---

# Resumen rápido

| Modelo            | Tipo          | Vision | Audio         | Tool Calling       | Reasoning | Contexto | TPM    |
| ----------------- | ------------- | ------ | ------------- | ------------------ | --------- | -------- | ------ |
| Qwen 3.6          | LLM Principal | ✅      | ❌             | ✅ XML              | ✅         | 256K     | 1.5M   |
| DeepSeek V4 Flash | LLM           | ❌      | ❌             | ✅ Function Calling | ✅         | 1M       | 1.5M   |
| MiMo V2.5         | Omnimodal     | ✅      | ✅             | ✅ Function Calling | ✅         | 1M       | 1.5M   |
| Gemma4            | LLM           | ✅      | ❌             | ✅ XML              | ✅         | 256K     | 1.5M   |
| Qwen3 Embedding   | Embeddings    | N/A    | N/A           | N/A                | N/A       | N/A      | 60 RPM |
| Whisper           | STT           | N/A    | Audio → Texto | N/A                | N/A       | N/A      | 10 RPM |
| Kokoro            | TTS           | N/A    | Texto → Audio | N/A                | N/A       | N/A      | 15 RPM |

Fuente:

https://nan.builders/docs/models

---

# Ranking recomendado

## 🥇 Qwen 3.6

El modelo principal del cluster.

Ideal para:

* Uso diario
* Agent Mode
* Programación
* Refactors
* Chat técnico
* Vision ligera
* Automatizaciones

Ventajas:

* Muy rápido
* Excelente relación calidad/velocidad
* Vision integrada
* Tool Calling
* Reasoning

---

## 🥈 DeepSeek V4 Flash

Ideal para:

* Repositorios enormes
* Contextos gigantes
* Refactors complejos
* Arquitectura de software
* Agentes avanzados

Ventajas:

* 1M de contexto
* Muy buen rendimiento en coding
* Function Calling nativo

---

## 🥉 MiMo V2.5

El modelo más completo del cluster.

Ideal para:

* Capturas de pantalla
* Diseño UI
* Diagramas
* Imágenes
* Audio
* Aplicaciones multimodales

Ventajas:

* Vision
* Audio
* Tool Calling
* Reasoning
* Contexto de 1M

---

## Gemma4

Ideal para:

* Vision ligera
* OCR
* Documentación
* Chat técnico rápido

Ventajas:

* Muy eficiente
* Vision integrada
* Buen razonamiento

---

# DeepSeek V4 Flash

## Especificaciones

| Propiedad         | Valor           |
| ----------------- | --------------- |
| Tipo              | MoE             |
| Parámetros        | 284B            |
| Activos por token | 21B             |
| Cuantización      | FP8             |
| Contexto          | 1M              |
| Tool Calling      | Sí              |
| Reasoning         | Sí              |
| Vision            | No              |
| Audio             | No              |
| TPM               | 1.5M            |
| Cuota             | 500M tokens/mes |

## Capacidades

* Tool Calling
* Reasoning Mode
* Streaming SSE
* Contexto de 1 millón de tokens

## Casos de uso

* Repositorios monolíticos
* Refactors masivos
* Arquitectura software
* Análisis de código a gran escala
* Generación de documentación

Referencias:

* https://nan.builders/docs/models
* https://www.deepseek.com/

---

# MiMo V2.5

## Especificaciones

| Propiedad         | Valor            |
| ----------------- | ---------------- |
| Tipo              | Omnimodal        |
| Parámetros        | 310B             |
| Activos por token | 15B              |
| Cuantización      | FP8              |
| Contexto          | 1M               |
| Vision            | Sí               |
| Audio             | Sí               |
| Tool Calling      | Function Calling |
| Reasoning         | Sí               |
| TPM               | 1.5M             |
| Cuota             | 500M tokens/mes  |
| Licencia          | MIT              |

## Modalidades

### Input

* Texto
* Imagen
* Audio

### Output

* Texto

## Capacidades

* Tool Calling
* Reasoning
* Vision
* Audio
* Streaming SSE
* Contexto de 1 millón de tokens

## Casos de uso

* UI Reviews
* Diseño
* Capturas de pantalla
* Audio
* Agentes multimodales
* Documentación visual

Referencias:

* https://nan.builders/docs/models

---

# Gemma4

## Especificaciones

| Propiedad         | Valor |
| ----------------- | ----- |
| Tipo              | MoE   |
| Parámetros        | 26B   |
| Activos por token | 4B    |
| Cuantización      | FP8   |
| Contexto          | 256K  |
| Vision            | Sí    |
| Tool Calling      | XML   |
| Reasoning         | Sí    |
| TPM               | 1.5M  |

## Capacidades

* Vision
* Tool Calling XML
* Reasoning
* Streaming SSE

## Casos de uso

* OCR
* Capturas
* PDFs
* Chat técnico
* Análisis visual

Referencias:

* https://nan.builders/docs/models
* https://ai.google.dev/gemma

---

# Qwen 3.6

## Especificaciones

| Propiedad            | Valor                |
| -------------------- | -------------------- |
| Tipo                 | MoE                  |
| Parámetros           | 35B                  |
| Activos por token    | 3B                   |
| Cuantización         | FP8                  |
| Contexto             | 256K                 |
| Vision               | Sí                   |
| Tool Calling         | XML                  |
| Reasoning            | Sí                   |
| TPM                  | 1.5M                 |
| Speculative Decoding | MTP (~2x throughput) |

## Capacidades

* Vision
* Tool Calling XML
* Reasoning
* Streaming SSE
* Multimodal

## Casos de uso

* Modelo principal
* Agent Mode
* Coding diario
* Refactors
* Vision
* Pair Programming
* Automatizaciones

## ¿Por qué es el modelo principal?

Según la documentación de NaN:

> El modelo principal. MoE de 35B parámetros, multimodal, con tool calling y reasoning.

Combina:

* Muy buena velocidad
* Vision
* Tool Calling
* Contexto amplio
* Bajo coste computacional por token

Referencias:

* https://nan.builders/docs/models
* https://qwenlm.github.io/

---

# Modelos auxiliares

## Qwen3 Embedding

### Especificaciones

| Propiedad   | Valor |
| ----------- | ----- |
| Parámetros  | 8B    |
| Dimensiones | 4096  |
| Idiomas     | 100+  |
| MMTEB       | 70.58 |
| RPM         | 60    |

### Casos de uso

* RAG
* Semantic Search
* Retrieval
* Clasificación
* Similitud semántica

### Ejemplo

* Español ↔ Inglés
* Búsqueda documental
* Bases vectoriales

Referencias:

* https://nan.builders/docs/models
* https://qwenlm.github.io/blog/qwen3-embedding/

---

## Whisper Large-v3

Speech To Text.

### Características

| Propiedad   | Valor    |
| ----------- | -------- |
| Modelo      | large-v3 |
| Idiomas     | 99+      |
| WER Español | ~3.2%    |
| RPM         | 10       |
| Tamaño      | ~3 GB    |

### Capacidades

* Transcripción
* Detección automática de idioma
* OpenAI Compatible

### Limitaciones

#### Tamaño máximo

```text
25 MB
```

#### Recomendado

* OGG
* Opus
* MP3

#### Evitar

* WAV muy grandes

#### Timeout

Audios superiores a:

```text
~2 minutos
```

pueden producir timeout.

Dividir audios largos en fragmentos.

Referencias:

* https://nan.builders/docs/models
* https://github.com/openai/whisper

---

## Kokoro

Text To Speech.

### Características

| Propiedad  | Valor |
| ---------- | ----- |
| Parámetros | 82M   |
| Voces      | 67    |
| Latencia   | <1s   |
| RPM        | 15    |

### Voces destacadas

| Voz      | Idioma  |
| -------- | ------- |
| ef_dora  | Español |
| em_alex  | Español |
| af_heart | Inglés  |

### Casos de uso

* Voice Assistants
* Lectura de documentos
* Narración
* Accesibilidad

Referencias:

* https://nan.builders/docs/models
* https://github.com/hexgrad/kokoro

---

# Configuración en VS Code

## Requisitos

Instalar:

* GitHub Copilot
* GitHub Copilot Chat

Versión recomendada:

```text
VS Code 1.102+
```

Documentación:

* https://code.visualstudio.com/docs/agent-customization/language-models
* https://code.visualstudio.com/docs/copilot/chat/chat-agent-mode

---

# Dónde colocar la configuración

### Windows

```text
%APPDATA%\Code\User\chatLanguageModels.json`
```

### Linux

```text
~/.config/Code/User/chatLanguageModels.json
```

### macOS

```text
~/Library/Application Support/Code/User/chatLanguageModels.json
```

---

# Configuración completa para VS Code

```json
[
  {
    "name": "NaN",
    "vendor": "customendpoint",
    "apiKey": "${input:chat.lm.secret.nan}",
    "apiType": "chat-completions",
    "models": [
      {
        "id": "qwen3.6",
        "name": "Qwen 3.6 (35B-A3B) (Primary Model)",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": true,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 262144,
        "maxOutputTokens": 65536,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      },
      {
        "id": "deepseek-v4-flash",
        "name": "DeepSeek V4 Flash",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": false,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 1048576,
        "maxOutputTokens": 65536,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      },
      {
        "id": "mimo-v2.5",
        "name": "MiMo V2.5",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": true,
        "audio": true,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 1048576,
        "maxOutputTokens": 65536,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      },
      {
        "id": "gemma4",
        "name": "Gemma4",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": true,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 262144,
        "maxOutputTokens": 32768,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      }
    ]
  }
]
```

---

# Qué significa cada opción

Fuente oficial:

https://code.visualstudio.com/docs/agent-customization/language-models

## toolCalling

Permite utilizar herramientas.

Necesario para Agent Mode.

## thinking

Indica soporte para razonamiento avanzado.

## supportsReasoningEffort

Permite elegir:

* low
* medium
* high

## vision

Permite enviar imágenes.

## audio

Permite enviar audio.

## editTools

Permite edición avanzada de archivos.

## maxInputTokens

Contexto máximo soportado.

## maxOutputTokens

Respuesta máxima generada.

---

# Privacidad

Todos los modelos del cluster NaN comparten:

* Sin logs de prompts
* Sin entrenamiento con tus datos
* Infraestructura en la UE
* API key individual
* Acceso mediante comunidad privada

Tu código no se utiliza para entrenar modelos.

---

# Referencias

## NaN

* https://nan.builders/
* https://nan.builders/docs/models
* https://nan.builders/docs/api
* https://nan.builders/docs/examples

## VS Code

* https://code.visualstudio.com/docs/agent-customization/language-models
* https://code.visualstudio.com/docs/copilot/chat/chat-agent-mode
* https://code.visualstudio.com/docs/copilot/overview

## Modelos

### DeepSeek

* https://www.deepseek.com/

### Qwen

* https://qwenlm.github.io/
* https://qwenlm.github.io/blog/qwen3-embedding/

### Gemma

* https://ai.google.dev/gemma

### Whisper

* https://github.com/openai/whisper

### Kokoro

* https://github.com/hexgrad/kokoro


Modelo	Tipo	Vision	Audio	Tool Calling	Reasoning	Contexto	TPM
Qwen 3.6	LLM Principal	✅	❌	✅ XML	✅	256K	1.5M
DeepSeek V4 Flash	LLM	❌	❌	✅ Function Calling	✅	1M	1.5M
MiMo V2.5	Omnimodal	✅	✅	✅ Function Calling	✅	1M	1.5M
Gemma4	LLM	✅	❌	✅ XML	✅	256K	1.5M
Qwen3 Embedding	Embeddings	N/A	N/A	N/A	N/A	N/A	60 RPM
Whisper	STT	N/A	Audio → Texto	N/A	N/A	N/A	10 RPM
Kokoro	TTS	N/A	Texto → Audio	N/A	N/A	N/A	15 RPM

Propiedad	Valor
Tipo	MoE
Parámetros	284B
Activos por token	21B
Cuantización	FP8
Contexto	1M
Tool Calling	Sí
Reasoning	Sí
Vision	No
Audio	No
TPM	1.5M
Cuota	500M tokens/mes

config para VS Code #9

Description

VS Code + NaN Builders

¿Qué es NaN?

Características

Modelos disponibles

Resumen rápido

Ranking recomendado

🥇 Qwen 3.6

🥈 DeepSeek V4 Flash

🥉 MiMo V2.5

Gemma4

DeepSeek V4 Flash

Especificaciones

Capacidades

Casos de uso

MiMo V2.5

Especificaciones

Modalidades

Input

Output

Capacidades

Casos de uso

Gemma4

Especificaciones

Capacidades

Casos de uso

Qwen 3.6

Especificaciones

Capacidades

Casos de uso

¿Por qué es el modelo principal?

Modelos auxiliares

Qwen3 Embedding

Especificaciones

Casos de uso

Ejemplo

Whisper Large-v3

Características

Capacidades

Limitaciones

Tamaño máximo

Recomendado

Evitar

Timeout

Kokoro

Características

Voces destacadas

Casos de uso

Configuración en VS Code

Requisitos

Dónde colocar la configuración

Windows

Linux

macOS

Configuración completa para VS Code

Qué significa cada opción

toolCalling

thinking

supportsReasoningEffort

vision

audio

editTools

maxInputTokens

maxOutputTokens

Privacidad

Referencias

NaN

VS Code

Modelos

DeepSeek

Qwen

Gemma

Whisper

Kokoro

Metadata

Metadata

Assignees

Labels

Type