Modelos y precios - Documentación de Entity Enricher

Modelos y precios

Gestione proveedores y modelos de LLM, sincronice modelos desde registros externos, ejecute comprobaciones de estado y configure claves de API por organización para una facturación independiente.

Gestión de proveedores

Entity Enricher admite una amplia gama de proveedores de LLM. Cada proveedor puede tener varios modelos con precios, capacidades y configuración individuales.

Proveedores admitidos

AnthropicOpenAIGoogleMistralDeepSeekGroqTogether AIFireworks AICoherexAINVIDIA NIMOllamaAzure OpenAI

Tipos de proveedor

EstándarLa mayoría de los proveedores (Anthropic, OpenAI, Mistral, etc.) usan endpoints de API estándar con autenticación mediante bearer token. Un proveedor Standard también puede apuntar a un endpoint personalizado compatible con OpenAI; consulte «Endpoints personalizados y corporativos» más abajo.
AzureAzure OpenAI utiliza endpoints de despliegue personalizados con configuración de versión de API.
OllamaInstancias de Ollama autoalojadas con URLs de endpoint personalizadas y descubrimiento automático de modelos.

Endpoints personalizados y corporativos

Muchos equipos enrutan el tráfico de LLM a través de una pasarela de IA corporativa, un endpoint regional o un provider que no está integrado; por ejemplo, un proxy LiteLLM empresarial, Cloudflare AI Gateway o Alibaba DashScope (para modelos Qwen). Estos se añaden como su propio provider Standard (compatible con OpenAI) con una URL base personalizada.

Añadir un proveedor de gateway

  1. Cree un proveedor con un nombre que no sea uno de los integrados (p. ej. acme-openai-gw). Los nombres integrados como openai o anthropic están reservados.
  2. Elija el tipo Estándar (compatible con OpenAI) y complete Endpoint de API personalizado (URL base) — p. ej. https://gateway.example.com/v1. Este campo es obligatorio para cualquier proveedor para el que Entity Enricher no tenga un cliente integrado.
  3. Añada la clave del gateway como clave de organización para ese proveedor (Claves API → Claves de proveedor de IA), para que se facture y rote por organización.
  4. Añada los modelos que ofrece el gateway. El identificador del modelo se envía literalmente, por lo que debe coincidir exactamente con lo que el gateway espera.

Información útil

  • Los proveedores integrados ocultan el campo de endpoint. Anthropic, OpenAI, Mistral y los demás proveedores reconocidos ya conocen su endpoint, por lo que no hay nada que configurar. Si un proveedor personalizado pasa más tarde a ser integrado, su endpoint almacenado permanece visible para que pueda borrarlo.
  • Solo HTTPS público. Los endpoints deben ser URL https:// públicas. Los rangos de loopback y privados (localhost, 10.x, 192.168.x) se rechazan para evitar el SSRF: un servidor autoalojado debe ser accesible por internet. Para un Ollama local, utilice en su lugar el túnel dedicado de Ollama.
  • Formato de transmisión compatible con OpenAI. Las llamadas a un proveedor personalizado se enrutan a través de la API compatible con OpenAI, por lo que el endpoint debe hablar el protocolo /v1 de OpenAI (chat completions, /models).
  • Probar conexión sondea {endpoint}/models para verificar la clave y la URL base antes de ejecutar un enriquecimiento.

Límites de concurrencia (por clave)

Cada proveedor tiene un ajuste de Máximo de llamadas concurrentes por clave (su anulación del límite de tasa). Limita cuántas llamadas al LLM ejecuta en paralelo una sola clave de API, abarcando todos los flujos que usan la clave: el reparto del enriquecimiento multiespecialización, la clasificación, el arbitraje y la generación de esquemas/muestras.

  • Limitado por clave, no por proveedor. Cada clave de organización y la clave global compartida obtiene su propio presupuesto independiente, de modo que las llamadas paralelas de una clave nunca desplazan a las de otra.
  • Recurre a un valor predeterminado razonable cuando se deja sin definir (valores predeterminados por proveedor, normalmente de 3 a 5 llamadas simultáneas).
  • Se aplica en el siguiente trabajo — no es necesario reiniciar.

Esto es independiente del límite de trabajos concurrentes máximos de su plan, que limita cuántos trabajos de enriquecimiento ejecuta toda su organización a la vez en todos los proveedores.

Capacidades del modelo

Cada modelo registra sus capacidades, que se muestran como iconos en el selector de modelos:

CapacidadDescripción
VisiónPuede procesar imágenes y entradas visuales
Llamadas a herramientasAdmite llamadas a funciones / uso de herramientas
Entrada de audioPuede procesar entradas de audio
Entrada de PDFPuede procesar documentos PDF
Almacenamiento en caché de promptsAdmite almacenamiento en caché de prompts para reducir costes
RazonamientoCapacidades de pensamiento extendido / cadena de razonamiento

Sincronización automática de precios

Mantenga actualizados los precios de los modelos sincronizándolos desde registros externos. El proceso de sincronización detecta automáticamente los modelos nuevos, los cambios de precio y los modelos eliminados.

Registro de LiteLLM

La fuente de precios predeterminada. Obtiene los datos del registro comunitario de LiteLLM en GitHub, con nombres reales de modelos de API, precios, longitudes de contexto y capacidades.

Cubre ~30 proveedores. No incluye nombres para mostrar, benchmarks ni velocidad de generación.

PricePerToken

Una fuente alternativa de pricepertoken.com. Incluye nombres visibles, benchmarks (puntuaciones de programación y matemáticas) y velocidad de generación (tokens por segundo).

Cubre ~20 proveedores. Proporciona metadatos más completos que LiteLLM.

Proceso de sincronización

  1. Vista previa de simulación — Vea qué cambiará antes de aplicar. Consulte los nuevos modelos, las actualizaciones de precios y las desactivaciones.
  2. Coincidencia por fuente — Cada fuente solo afecta a los modelos de esa fuente. Los modelos manuales nunca se modifican.
  3. Claves de sincronización estables — Los modelos se emparejan por un identificador estable, no por nombre. Puede renombrar modelos sin romper la sincronización.
  4. Aplicación transaccional — Todos los cambios se aplican en una única transacción de base de datos para garantizar la coherencia.
  5. Creación automática de proveedores: si un modelo sincronizado pertenece a un proveedor desconocido, el proveedor se crea automáticamente.

Comprobaciones de estado del modelo

Valide de forma proactiva si los modelos son accesibles ejecutando un prompt mínimo de comprobación de estado. Esto detecta los modelos defectuosos antes de que los usuarios encuentren errores durante el enriquecimiento.

AprobarEl modelo responde correctamente. Si se había desactivado automáticamente, se reactiva.
No encontradoEl modelo devuelve un error de tipo «no encontrado». Se desactiva automáticamente para evitar fallos futuros.
Otro errorLos errores de autenticación, los tiempos de espera o los límites de frecuencia se notifican, pero no activan la desactivación.

Las comprobaciones de estado pueden ejecutarse en todos los models, en los models de un provider específico o en un solo model. Los resultados se transmiten en tiempo real mediante SSE con una barra de progreso que muestra el recuento de aciertos y fallos.

Desactivación automática

Cuando una llamada de enriquecimiento falla con un error de «modelo no encontrado», el modelo se desactiva automáticamente para evitar fallos repetidos. Esto sucede en tiempo real durante las operaciones normales de enriquecimiento.

Motivo de desactivaciónEstablecido por¿Reactivado automáticamente?
Modelo no encontradoErrores de enriquecimiento o comprobaciones de estadoSí (mediante sincronización de precios o validación)
Sincronización eliminadaSincronización de precios (el modelo desapareció)Sí (si el modelo reaparece en el registro)
ManualConmutador de administrador en la interfazNo (solo reactivación manual)

Use su propia clave (BYOK)

Las organizaciones pueden configurar sus propias claves de API de proveedores de LLM para facturación y seguimiento de uso independientes. El sistema utiliza una resolución de claves de dos niveles con selección LRU:

1.º
Grupo de claves de la organización

Claves por organización configuradas en la página de Claves de API. Admite varias claves por proveedor con rotación LRU. Cifradas con Fernet.

2.º
Grupo de claves globales

Claves para todo el sistema gestionadas por los administradores. Compartidas entre todas las organizaciones. También admite varias claves por proveedor con rotación LRU.

Cada enriquecimiento registra qué clave se utilizó, de modo que puede hacer un seguimiento de los costes por clave. Las claves incluyen soporte para comprobaciones de estado, contadores de uso y se desactivan automáticamente ante fallos permanentes (clave no válida, pago requerido). Las claves con límite de tasa se pausan temporalmente mientras se utilizan otras claves del grupo. Aprenda a gestionar las claves en la guía de API Keys.

Importar y exportar

Exporte toda la configuración de proveedores y modelos como JSON para hacer una copia de seguridad o transferirla a otra instancia. La importación siempre es una operación de upsert: los proveedores y modelos existentes se identifican por nombre y se actualizan en su lugar, mientras que los nuevos se agregan; no se elimina nada.

La exportación incluye los ajustes del proveedor, las configuraciones de modelos, los precios, las capacidades y las especificaciones canónicas de los modelos, pero nunca las claves de API, que se almacenan por separado. Tras importar, configure las claves de API por separado. Los administradores del sistema respaldan el catálogo global completo; los propietarios de la organización exportan e importan únicamente los proveedores y modelos de su propia organización: el catálogo global compartido no se puede crear ni editar mediante importación.

Próximos pasos