As famílias de modelos Claude 3 e 4 vêm com novas capacidades de visão que permitem ao Claude entender e analisar imagens, abrindo possibilidades empolgantes para interação multimodal.
Proporção | Tamanho da imagem |
---|---|
1:1 | 1092x1092 px |
3:4 | 951x1268 px |
2:3 | 896x1344 px |
9:16 | 819x1456 px |
1:2 | 784x1568 px |
tokens = (largura px * altura px)/750
Aqui estão exemplos de tokenização aproximada e custos para diferentes tamanhos de imagem dentro das restrições de tamanho da nossa API baseados no preço por token do Claude Sonnet 3.7 de $3 por milhão de tokens de entrada:
Tamanho da imagem | Nº de Tokens | Custo / imagem | Custo / 1K imagens |
---|---|---|---|
200x200 px(0,04 megapixels) | ~54 | ~$0,00016 | ~$0,16 |
1000x1000 px(1 megapixel) | ~1334 | ~$0,004 | ~$4,00 |
1092x1092 px(1,19 megapixels) | ~1590 | ~$0,0048 | ~$4,80 |
image
Exemplo: Uma imagem
Papel | Conteúdo |
---|---|
Usuário | [Imagem] Descreva esta imagem. |
Exemplo: Múltiplas imagens
Imagem 1:
e Imagem 2:
e assim por diante. Você não precisa de quebras de linha entre imagens ou entre imagens e o prompt.Peça ao Claude para descrever as diferenças entre múltiplas imagens.Papel | Conteúdo |
---|---|
Usuário | Imagem 1: [Imagem 1] Imagem 2: [Imagem 2] Como essas imagens são diferentes? |
Exemplo: Múltiplas imagens com um prompt de sistema
Conteúdo | |
---|---|
Sistema | Responda apenas em espanhol. |
Usuário | Imagem 1: [Imagem 1] Imagem 2: [Imagem 2] Como essas imagens são diferentes? |
Exemplo: Quatro imagens em duas rodadas de conversa
Papel | Conteúdo |
---|---|
Usuário | Imagem 1: [Imagem 1] Imagem 2: [Imagem 2] Como essas imagens são diferentes? |
Assistente | [Resposta do Claude] |
Usuário | Imagem 1: [Imagem 3] Imagem 2: [Imagem 4] Essas imagens são similares às duas primeiras? |
Assistente | [Resposta do Claude] |
user
como parte de qualquer estrutura padrão de conversa de múltiplas rodadas.Que tipos de arquivo de imagem o Claude suporta?
image/jpeg
image/png
image/gif
image/webp
O Claude pode ler URLs de imagem?
Há um limite para o tamanho do arquivo de imagem que posso carregar?
Quantas imagens posso incluir em uma solicitação?
O Claude lê metadados de imagem?
Posso deletar imagens que carreguei?
Onde posso encontrar detalhes sobre privacidade de dados para carregamentos de imagem?
E se a interpretação de imagem do Claude parecer errada?
O Claude pode gerar ou editar imagens?