Embeddings de texto são representações numéricas de texto que permitem medir a similaridade semântica. Este guia introduz embeddings, suas aplicações e como usar modelos de embedding para tarefas como busca, recomendações e detecção de anomalias.
Modelo | Comprimento do Contexto | Dimensão do Embedding | Descrição |
---|---|---|---|
voyage-3-large | 32.000 | 1024 (padrão), 256, 512, 2048 | A melhor qualidade de recuperação para propósito geral e multilíngue. |
voyage-3 | 32.000 | 1024 | Otimizado para qualidade de recuperação de propósito geral e multilíngue. Veja o post do blog para detalhes. |
voyage-3-lite | 32.000 | 512 | Otimizado para latência e custo. Veja o post do blog para detalhes. |
voyage-code-3 | 32.000 | 1024 (padrão), 256, 512, 2048 | Otimizado para recuperação de código. Veja o post do blog para detalhes. |
voyage-finance-2 | 32.000 | 1024 | Otimizado para recuperação e RAG em finanças. Veja o post do blog para detalhes. |
voyage-law-2 | 16.000 | 1024 | Otimizado para recuperação e RAG jurídico e de contexto longo. Também melhorou o desempenho em todos os domínios. Veja o post do blog para detalhes. |
Modelo | Comprimento do Contexto | Dimensão do Embedding | Descrição |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Modelo de embedding multimodal rico que pode vetorizar texto intercalado e imagens ricas em conteúdo, como capturas de tela de PDFs, slides, tabelas, figuras e mais. Veja o post do blog para detalhes. |
voyageai
ou requisições HTTP, como descrito abaixo.
voyageai
pode ser instalado usando o seguinte comando:
result.embeddings
será uma lista de dois vetores de embedding, cada um contendo 1024 números de ponto flutuante. Após executar o código acima, os dois embeddings serão impressos na tela:
embed()
. Você pode ler mais sobre a especificação aqui
curl
em um terminal:
input_type="document"
e input_type="query"
para incorporar o documento e a consulta, respectivamente. Mais especificações podem ser encontradas aqui.
A saída seria o 5º documento, que é de fato o mais relevante para a consulta:
Por que os embeddings da Voyage têm qualidade superior?
Quais modelos de embedding estão disponíveis e qual devo usar?
voyage-3-large
: Melhor qualidadevoyage-3-lite
: Menor latência e custovoyage-3
: Desempenho equilibrado com qualidade de recuperação superior a um preço competitivoinput_type
para especificar o tipo de consulta ou documento.Modelos específicos de domínio:voyage-law-2
voyage-code-3
voyage-finance-2
Qual função de similaridade devo usar?
Como devo usar o parâmetro input_type?
input_type
como “query” ou “document”. Esta otimização melhora a qualidade da recuperação através de prefixação especializada de prompts:Para consultas:input_type
ou defina-o como None
para tarefas de recuperação.voyage-large-2-instruct
, siga as instruções em nosso repositório GitHub.Quais opções de quantização estão disponíveis?
output_dtype
):Tipo | Descrição | Redução de Tamanho |
---|---|---|
float | Ponto flutuante de precisão simples de 32 bits (padrão) | Nenhuma |
int8 /uint8 | Inteiros de 8 bits (-128 a 127 / 0 a 255) | 4x |
binary /ubinary | Valores de bit único empacotados | 32x |
binary
usando método binário deslocado.Como posso truncar embeddings Matryoshka?