Skip to content

config para VS Code #9

@svg153

Description

@svg153

VS Code + NaN Builders

Guía completa para utilizar los modelos del cluster de NaN dentro de VS Code Agent Mode.


¿Qué es NaN?

NaN es una comunidad de builders que comparte GPUs dedicadas para ejecutar modelos abiertos a gran escala.

En lugar de pagar por APIs cerradas con límites artificiales de uso, los miembros comparten el coste real de la infraestructura y acceden a modelos abiertos con uso intensivo.

Características

  • GPUs compartidas entre miembros
  • Tokens prácticamente ilimitados para uso normal dentro del cluster
  • Sin entrenamiento con tus datos
  • Sin almacenamiento de prompts
  • Infraestructura alojada en la Unión Europea
  • API key personal por miembro
  • API OpenAI-compatible
  • Comunidad privada orientada a builders

Más información:


Modelos disponibles

Todos los modelos utilizan:

Base URL:
https://api.nan.builders/v1

Compatible con:

  • OpenAI SDK
  • VS Code Copilot Custom Models
  • Cursor
  • Cline
  • Roo Code
  • OpenCode
  • Continue
  • Open WebUI
  • LangChain
  • LlamaIndex
  • Agentes personalizados

Resumen rápido

Modelo Tipo Vision Audio Tool Calling Reasoning Contexto TPM
Qwen 3.6 LLM Principal ✅ XML 256K 1.5M
DeepSeek V4 Flash LLM ✅ Function Calling 1M 1.5M
MiMo V2.5 Omnimodal ✅ Function Calling 1M 1.5M
Gemma4 LLM ✅ XML 256K 1.5M
Qwen3 Embedding Embeddings N/A N/A N/A N/A N/A 60 RPM
Whisper STT N/A Audio → Texto N/A N/A N/A 10 RPM
Kokoro TTS N/A Texto → Audio N/A N/A N/A 15 RPM

Fuente:

https://nan.builders/docs/models


Ranking recomendado

🥇 Qwen 3.6

El modelo principal del cluster.

Ideal para:

  • Uso diario
  • Agent Mode
  • Programación
  • Refactors
  • Chat técnico
  • Vision ligera
  • Automatizaciones

Ventajas:

  • Muy rápido
  • Excelente relación calidad/velocidad
  • Vision integrada
  • Tool Calling
  • Reasoning

🥈 DeepSeek V4 Flash

Ideal para:

  • Repositorios enormes
  • Contextos gigantes
  • Refactors complejos
  • Arquitectura de software
  • Agentes avanzados

Ventajas:

  • 1M de contexto
  • Muy buen rendimiento en coding
  • Function Calling nativo

🥉 MiMo V2.5

El modelo más completo del cluster.

Ideal para:

  • Capturas de pantalla
  • Diseño UI
  • Diagramas
  • Imágenes
  • Audio
  • Aplicaciones multimodales

Ventajas:

  • Vision
  • Audio
  • Tool Calling
  • Reasoning
  • Contexto de 1M

Gemma4

Ideal para:

  • Vision ligera
  • OCR
  • Documentación
  • Chat técnico rápido

Ventajas:

  • Muy eficiente
  • Vision integrada
  • Buen razonamiento

DeepSeek V4 Flash

Especificaciones

Propiedad Valor
Tipo MoE
Parámetros 284B
Activos por token 21B
Cuantización FP8
Contexto 1M
Tool Calling
Reasoning
Vision No
Audio No
TPM 1.5M
Cuota 500M tokens/mes

Capacidades

  • Tool Calling
  • Reasoning Mode
  • Streaming SSE
  • Contexto de 1 millón de tokens

Casos de uso

  • Repositorios monolíticos
  • Refactors masivos
  • Arquitectura software
  • Análisis de código a gran escala
  • Generación de documentación

Referencias:


MiMo V2.5

Especificaciones

Propiedad Valor
Tipo Omnimodal
Parámetros 310B
Activos por token 15B
Cuantización FP8
Contexto 1M
Vision
Audio
Tool Calling Function Calling
Reasoning
TPM 1.5M
Cuota 500M tokens/mes
Licencia MIT

Modalidades

Input

  • Texto
  • Imagen
  • Audio

Output

  • Texto

Capacidades

  • Tool Calling
  • Reasoning
  • Vision
  • Audio
  • Streaming SSE
  • Contexto de 1 millón de tokens

Casos de uso

  • UI Reviews
  • Diseño
  • Capturas de pantalla
  • Audio
  • Agentes multimodales
  • Documentación visual

Referencias:


Gemma4

Especificaciones

Propiedad Valor
Tipo MoE
Parámetros 26B
Activos por token 4B
Cuantización FP8
Contexto 256K
Vision
Tool Calling XML
Reasoning
TPM 1.5M

Capacidades

  • Vision
  • Tool Calling XML
  • Reasoning
  • Streaming SSE

Casos de uso

  • OCR
  • Capturas
  • PDFs
  • Chat técnico
  • Análisis visual

Referencias:


Qwen 3.6

Especificaciones

Propiedad Valor
Tipo MoE
Parámetros 35B
Activos por token 3B
Cuantización FP8
Contexto 256K
Vision
Tool Calling XML
Reasoning
TPM 1.5M
Speculative Decoding MTP (~2x throughput)

Capacidades

  • Vision
  • Tool Calling XML
  • Reasoning
  • Streaming SSE
  • Multimodal

Casos de uso

  • Modelo principal
  • Agent Mode
  • Coding diario
  • Refactors
  • Vision
  • Pair Programming
  • Automatizaciones

¿Por qué es el modelo principal?

Según la documentación de NaN:

El modelo principal. MoE de 35B parámetros, multimodal, con tool calling y reasoning.

Combina:

  • Muy buena velocidad
  • Vision
  • Tool Calling
  • Contexto amplio
  • Bajo coste computacional por token

Referencias:


Modelos auxiliares

Qwen3 Embedding

Especificaciones

Propiedad Valor
Parámetros 8B
Dimensiones 4096
Idiomas 100+
MMTEB 70.58
RPM 60

Casos de uso

  • RAG
  • Semantic Search
  • Retrieval
  • Clasificación
  • Similitud semántica

Ejemplo

  • Español ↔ Inglés
  • Búsqueda documental
  • Bases vectoriales

Referencias:


Whisper Large-v3

Speech To Text.

Características

Propiedad Valor
Modelo large-v3
Idiomas 99+
WER Español ~3.2%
RPM 10
Tamaño ~3 GB

Capacidades

  • Transcripción
  • Detección automática de idioma
  • OpenAI Compatible

Limitaciones

Tamaño máximo

25 MB

Recomendado

  • OGG
  • Opus
  • MP3

Evitar

  • WAV muy grandes

Timeout

Audios superiores a:

~2 minutos

pueden producir timeout.

Dividir audios largos en fragmentos.

Referencias:


Kokoro

Text To Speech.

Características

Propiedad Valor
Parámetros 82M
Voces 67
Latencia <1s
RPM 15

Voces destacadas

Voz Idioma
ef_dora Español
em_alex Español
af_heart Inglés

Casos de uso

  • Voice Assistants
  • Lectura de documentos
  • Narración
  • Accesibilidad

Referencias:


Configuración en VS Code

Requisitos

Instalar:

  • GitHub Copilot
  • GitHub Copilot Chat

Versión recomendada:

VS Code 1.102+

Documentación:


Dónde colocar la configuración

Windows

%APPDATA%\Code\User\chatLanguageModels.json`

Linux

~/.config/Code/User/chatLanguageModels.json

macOS

~/Library/Application Support/Code/User/chatLanguageModels.json

Configuración completa para VS Code

[
  {
    "name": "NaN",
    "vendor": "customendpoint",
    "apiKey": "${input:chat.lm.secret.nan}",
    "apiType": "chat-completions",
    "models": [
      {
        "id": "qwen3.6",
        "name": "Qwen 3.6 (35B-A3B) (Primary Model)",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": true,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 262144,
        "maxOutputTokens": 65536,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      },
      {
        "id": "deepseek-v4-flash",
        "name": "DeepSeek V4 Flash",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": false,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 1048576,
        "maxOutputTokens": 65536,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      },
      {
        "id": "mimo-v2.5",
        "name": "MiMo V2.5",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": true,
        "audio": true,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 1048576,
        "maxOutputTokens": 65536,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      },
      {
        "id": "gemma4",
        "name": "Gemma4",
        "url": "https://api.nan.builders/v1",
        "toolCalling": true,
        "thinking": true,
        "vision": true,
        "supportsReasoningEffort": [
          "low",
          "medium",
          "high"
        ],
        "maxInputTokens": 262144,
        "maxOutputTokens": 32768,
        "editTools": [
          "apply-patch",
          "multi-find-replace"
        ]
      }
    ]
  }
]

Qué significa cada opción

Fuente oficial:

https://code.visualstudio.com/docs/agent-customization/language-models

toolCalling

Permite utilizar herramientas.

Necesario para Agent Mode.

thinking

Indica soporte para razonamiento avanzado.

supportsReasoningEffort

Permite elegir:

  • low
  • medium
  • high

vision

Permite enviar imágenes.

audio

Permite enviar audio.

editTools

Permite edición avanzada de archivos.

maxInputTokens

Contexto máximo soportado.

maxOutputTokens

Respuesta máxima generada.


Privacidad

Todos los modelos del cluster NaN comparten:

  • Sin logs de prompts
  • Sin entrenamiento con tus datos
  • Infraestructura en la UE
  • API key individual
  • Acceso mediante comunidad privada

Tu código no se utiliza para entrenar modelos.


Referencias

NaN

VS Code

Modelos

DeepSeek

Qwen

Gemma

Whisper

Kokoro

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions