Modelos e preços - Documentação do Entity Enricher

Modelos e preços

Faça a gestão dos fornecedores e modelos de LLM, sincronize modelos a partir de registos externos, execute verificações de estado e configure API keys por organização para faturação independente.

Gestão de Fornecedores

O Entity Enricher suporta uma ampla variedade de fornecedores de LLM. Cada fornecedor pode ter múltiplos modelos com preços, capacidades e configuração individuais.

Fornecedores suportados

AnthropicOpenAIGoogleMistralDeepSeekGroqTogether AIFireworks AICoherexAINVIDIA NIMOllamaAzure OpenAI

Tipos de Fornecedor

PadrãoA maioria dos fornecedores (Anthropic, OpenAI, Mistral, etc.) usa endpoints de API padrão com autenticação por bearer token. Um fornecedor Standard também pode apontar para um endpoint personalizado compatível com OpenAI — consulte Endpoints Personalizados e Corporativos abaixo.
AzureO Azure OpenAI utiliza endpoints de implementação personalizados com configuração de versão da API.
OllamaInstâncias Ollama autoalojadas com URLs de endpoint personalizados e deteção automática de modelos.

Endpoints Personalizados e Empresariais

Muitas equipas encaminham o tráfego de LLM através de um gateway de IA empresarial, um endpoint regional ou um fornecedor que não está integrado — por exemplo, um proxy LiteLLM empresarial, o Cloudflare AI Gateway ou o Alibaba DashScope (para modelos Qwen). Adiciona-os como o seu próprio fornecedor Standard (compatível com OpenAI) com um URL base personalizado.

Adicionar um fornecedor de gateway

  1. Crie um provider com um nome que não seja um dos integrados (por exemplo, acme-openai-gw). Nomes integrados como openai ou anthropic estão reservados.
  2. Escolha o tipo Standard (compatível com OpenAI) e preencha Endpoint da API personalizado (URL base) — por exemplo, https://gateway.example.com/v1. Este campo é obrigatório para qualquer provider para o qual o Entity Enricher não tenha um cliente incorporado.
  3. Adicione a chave do gateway como uma chave de organização para esse fornecedor (API Keys → AI Provider Keys), para que a faturação e a rotação sejam feitas por organização.
  4. Adicione os modelos que o gateway disponibiliza. O identificador do modelo é enviado tal e qual, por isso deve corresponder exatamente ao que o gateway espera.

Bom saber

  • Os fornecedores integrados ocultam o campo de endpoint. A Anthropic, a OpenAI, a Mistral e os outros fornecedores reconhecidos já conhecem o seu endpoint, por isso não há nada para configurar. Se um fornecedor personalizado passar mais tarde a integrado, o endpoint guardado permanece visível para que o possa limpar.
  • Apenas HTTPS público. Os endpoints têm de ser URLs públicos https://. Loopback e intervalos privados (localhost, 10.x, 192.168.x) são rejeitados para evitar SSRF — um servidor auto-hospedado tem de ser acessível pela internet. Para um Ollama local, utilize antes o túnel Ollama dedicado.
  • Formato de comunicação compatível com OpenAI. As chamadas a um fornecedor personalizado são encaminhadas através da API compatível com OpenAI, pelo que o endpoint tem de falar o protocolo OpenAI /v1 (chat completions, /models).
  • Testar ligação sonda {endpoint}/models para verificar a chave e o URL base antes de executar um enriquecimento.

Limites de concorrência (por chave)

Cada fornecedor tem uma definição Máximo de chamadas concorrentes por chave (a sua substituição do limite de taxa). Limita quantas chamadas LLM uma única chave de API executa em paralelo — abrangendo todos os fluxos que utilizam a chave: a distribuição do enriquecimento multi-especialização, a classificação, a arbitragem e a geração de schema / amostras.

  • Limitado por chave, não por provider. Cada chave de organização e a chave global partilhada tem o seu próprio orçamento independente, por isso as chamadas paralelas de uma chave nunca sufocam as de outra.
  • Recorre a um valor predefinido sensato quando deixado sem definir (predefinições por fornecedor, normalmente 3–5 chamadas simultâneas).
  • Entra em vigor na próxima tarefa — sem necessidade de reiniciar.

Isto é distinto do limite de trabalhos concorrentes máximos do seu plano, que restringe quantos trabalhos de enriquecimento a sua organização executa em simultâneo em todos os fornecedores.

Capacidades do Model

Cada modelo regista as suas capacidades, que são apresentadas como ícones no seletor de modelos:

CapacidadeDescrição
VisãoPode processar entradas de imagem e visuais
Chamadas de ferramentaSuporta chamada de funções / uso de ferramentas
Entrada de ÁudioPode processar entradas de áudio
Entrada de PDFPode processar documentos PDF
Caching de PromptsSuporta cache de prompts para redução de custos
RaciocínioCapacidades de raciocínio alargado / cadeia de pensamento

Sincronização automática de preços

Mantenha os preços dos modelos atualizados sincronizando a partir de registos externos. O processo de sincronização deteta automaticamente novos modelos, alterações de preços e modelos removidos.

Registo LiteLLM

A fonte de preços predefinida. Obtém dados do registo mantido pela comunidade da LiteLLM no GitHub, com nomes reais de modelos da API, preços, comprimentos de contexto e capacidades.

Cobre ~30 providers. Não inclui nomes de apresentação, benchmarks nem velocidade de geração.

PricePerToken

Uma fonte alternativa de pricepertoken.com. Inclui nomes de apresentação, benchmarks (pontuações de programação e matemática) e velocidade de geração (tokens por segundo).

Cobre ~20 providers. Fornece metadados mais ricos do que o LiteLLM.

Processo de sincronização

  1. Pré-visualização de simulação — Veja o que vai mudar antes de aplicar. Consulte novos modelos, atualizações de preços e desativações.
  2. Correspondência ao nível da fonte — Cada fonte afeta apenas os modelos dessa fonte. Os modelos manuais nunca são alterados.
  3. Chaves de sincronização estáveis — Os modelos são associados por um identificador estável, não pelo nome. Pode renomear modelos sem quebrar a sincronização.
  4. Aplicação transacional — Todas as alterações são aplicadas numa única transação de base de dados para garantir a consistência.
  5. Criação automática de provider — Se um modelo sincronizado pertencer a um provider desconhecido, o provider é criado automaticamente.

Verificações de Saúde do Model

Valide proativamente se os models estão acessíveis executando um prompt mínimo de verificação de estado. Isto deteta models avariados antes de os utilizadores encontrarem erros durante o enriquecimento.

AprovadoO modelo responde com êxito. Se tiver sido desativado automaticamente antes, é reativado.
Não encontradoO modelo devolve um erro de “não encontrado”. É desativado automaticamente para evitar falhas futuras.
Outro erroErros de autenticação, timeouts ou limites de taxa são reportados, mas não desencadeiam a desativação.

As verificações de estado podem ser executadas em todos os modelos, nos modelos de um fornecedor específico ou num único modelo. Os resultados são transmitidos em tempo real via SSE com uma barra de progresso que mostra as contagens de aprovações/falhas.

Desativação Automática

Quando uma chamada de enriquecimento falha com um erro “model not found”, o modelo é automaticamente desativado para evitar falhas repetidas. Isto acontece em tempo real durante as operações normais de enriquecimento.

Motivo da desativaçãoDefinido porReativado automaticamente?
Modelo não encontradoErros de enriquecimento ou verificações de saúdeSim (por sincronização de preços ou validação)
Sincronização removidaSincronização de preços (model desapareceu)Sim (se o model reaparecer no registo)
ManualAlternância de administrador na interfaceNão (apenas reativação manual)

Use a Sua Própria Chave (BYOK)

As organizações podem configurar as suas próprias chaves de API de provider de LLM para faturação e monitorização de utilização independentes. O sistema utiliza uma resolução de chaves em dois níveis com seleção LRU:

1.º
Pool de Chaves da Organization

Chaves por organização configuradas na página de Chaves API. Suporta várias chaves por fornecedor com rotação LRU. Encriptadas com Fernet.

2.º
Conjunto de chaves globais

Chaves de todo o sistema geridas por administradores. Partilhadas por todas as organizações. Também suporta várias chaves por fornecedor com rotação LRU.

Cada enriquecimento regista qual a chave utilizada, para que possa acompanhar os custos por chave. As chaves incluem suporte para verificações de estado, contadores de utilização e são automaticamente desativadas em falhas permanentes (chave inválida, pagamento necessário). As chaves com limite de taxa são temporariamente suspensas enquanto são utilizadas outras chaves do conjunto. Saiba como gerir as chaves no guia API Keys.

Importar e exportar

Exporte toda a sua configuração de providers e models em JSON para cópia de segurança ou transferência para outra instância. A importação é sempre uma inserção-ou-atualização: os providers e models existentes são correspondidos pelo nome e atualizados no local, enquanto os novos são adicionados — nada é eliminado.

A exportação inclui as definições do fornecedor, as configurações do modelo, os preços, as capacidades e as especificações canónicas do modelo — mas nunca as chaves de API, que são armazenadas separadamente. Após a importação, configure as chaves de API separadamente. Os administradores do sistema fazem cópias de segurança do catálogo global completo; os proprietários da organização exportam e importam apenas os fornecedores e modelos da sua própria organização — o catálogo global partilhado não pode ser criado nem editado através da importação.

Próximos Passos