Armazenamentos Vetoriais
Este guia ajudará você a entender como usar o Armazenamento Vetorial Rememberizer como um desenvolvedor.
O Armazenamento de Vetores Rememberizer simplifica o processo de lidar com dados vetoriais, permitindo que você se concentre na entrada de texto e aproveite o poder dos vetores para várias aplicações, como pesquisa e análise de dados.
Introdução
O Rememberizer Vector Store fornece uma interface fácil de usar para lidar com dados vetoriais, enquanto abstrai a complexidade das incorporações vetoriais. Alimentado pelo PostgreSQL com a extensão pgvector, o Rememberizer Vector Store permite que você trabalhe diretamente com texto. O serviço lida com a fragmentação, vetorização e armazenamento dos dados de texto, facilitando para você se concentrar na lógica central de sua aplicação.
Para uma compreensão mais profunda dos conceitos teóricos por trás das incorporações vetoriais e bancos de dados vetoriais, veja O que são Incorporações Vetoriais e Bancos de Dados Vetoriais?.
Visão Técnica
Como Funcionam os Armazenamentos de Vetores
Os Armazenamentos de Vetores Rememberizer convertem texto em representações vetoriais de alta dimensão (embeddings) que capturam o significado semântico. Isso possibilita:
Busca Semântica: Encontrar documentos com base no significado em vez de apenas palavras-chave
Correspondência de Similaridade: Identificar conteúdo conceitualmente relacionado
Recuperação Eficiente: Localizar rapidamente informações relevantes em grandes conjuntos de dados
Componentes Chave
Processamento de Documentos: O texto é dividido em pedaços de tamanho otimizado com limites sobrepostos para preservação de contexto
Vetorização: Os pedaços são convertidos em embeddings usando modelos de ponta
Indexação: Algoritmos especializados organizam vetores para busca de similaridade eficiente
Processamento de Consultas: Consultas de busca são vetorizadas e comparadas com embeddings armazenados
Arquitetura
Rememberizer implementa armazenamentos de vetores usando:
PostgreSQL com extensão pgvector: Para armazenamento e busca de vetores eficientes
Organização baseada em coleções: Cada armazenamento de vetores tem sua própria coleção isolada
Acesso orientado a API: Pontos finais RESTful simples para todas as operações
Começando
Criando um Armazenamento de Vetores
Navegue até a Seção de Armazenamentos de Vetores no seu painel
Clique em "Criar novo Armazenamento de Vetores":
Um formulário aparecerá solicitando que você insira os detalhes.
Preencha os Detalhes:
Nome: Forneça um nome único para o seu armazenamento de vetores.
Descrição: Escreva uma breve descrição do armazenamento de vetores.
Modelo de Embedding: Selecione o modelo que converte texto em vetores.
Algoritmo de Indexação: Escolha como os vetores serão organizados para busca.
Métrica de Busca: Defina como a similaridade entre vetores é calculada.
Dimensão do Vetor: O tamanho das embeddings de vetores (tipicamente 768-1536).
Envie o Formulário:
Clique no botão "Criar". Você receberá uma notificação de sucesso, e o novo armazenamento aparecerá na sua lista de armazenamentos de vetores.
Opções de Configuração
Modelos de Embedding
openai/text-embedding-3-large
1536
Modelo de embedding de alta precisão da OpenAI
Aplicações de produção que exigem máxima precisão
openai/text-embedding-3-small
1536
Modelo de embedding menor e mais rápido da OpenAI
Aplicações com requisitos de maior taxa de transferência
Algoritmos de Indexação
IVFFLAT (padrão)
Arquivo invertido com compressão plana
Bom equilíbrio entre velocidade e precisão; funciona bem para a maioria dos conjuntos de dados
HNSW
Mundo Pequeno Navegável Hierárquico
Melhor precisão para grandes conjuntos de dados; maiores requisitos de memória
Métricas de Busca
cosseno (padrão)
Mede o ângulo entre vetores
Correspondência de similaridade de propósito geral
produto interno (ip)
Produto escalar entre vetores
Quando a magnitude do vetor é importante
L2 (Euclidiana)
Distância em linha reta entre vetores
Quando relações espaciais são importantes
Gerenciando Armazenamentos de Vetores
Visualizar e Editar Armazenamentos de Vetores:
Acesse o painel de gerenciamento para visualizar, editar ou excluir armazenamentos de vetores.
Visualizando Documentos:
Navegue por documentos individuais e seus metadados associados dentro de um armazenamento de vetores específico.
Estatísticas:
Veja estatísticas detalhadas, como o número de vetores armazenados, desempenho de consultas e métricas operacionais.
Gerenciamento de Chaves de API
As chaves de API são usadas para autenticar e autorizar o acesso aos endpoints da API do Rememberizer Vector Store. O gerenciamento adequado das chaves de API é essencial para manter a segurança e a integridade dos seus armazéns de vetores.
Criando Chaves de API
Vá para a página de detalhes do seu Vector Store
Navegue até a Seção de Gerenciamento de Chaves de API:
Ela pode ser encontrada na aba "Configuração"
Clique em "Adicionar Chave de API":
Um formulário aparecerá solicitando que você insira os detalhes.
Preencha os Detalhes:
Nome: Forneça um nome para a chave de API para ajudá-lo a identificar seu caso de uso.
Envie o Formulário:
Clique no botão "Criar". A nova chave de API será gerada e exibida. Certifique-se de copiá-la e armazená-la com segurança. Esta chave é usada para autenticar solicitações a esse vetor store específico.
Revogando Chaves de API
Se uma chave de API não for mais necessária, você pode excluí-la para evitar qualquer uso indevido potencial.
Por razões de segurança, você pode querer girar suas chaves de API periodicamente. Isso envolve gerar uma nova chave e revogar a antiga.
Usando a API do Armazenamento Vetorial
Após criar um Armazenamento Vetorial e gerar uma chave de API, você pode interagir com ele usando a API REST.
Exemplos de Código
```ruby require 'net/http' require 'uri' require 'json'
class VectorStoreClient def initialize(api_key, vector_store_id) @api_key = api_key @vector_store_id = vector_store_id @base_url = 'https://api.rememberizer.ai/api/v1' end
Obter detalhes do armazenamento de vetores
def get_vector_store_info uri = URI("#{@base_url}/vector-stores/#{@vector_store_id}") request = Net::HTTP::Get.new(uri) request['x-api-key'] = @api_key
end
Fazer upload de conteúdo de texto
def upload_text(name, content) uri = URI("#{@base_url}/vector-stores/#{@vector_store_id}/documents/text") request = Net::HTTP::Post.new(uri) request['Content-Type'] = 'application/json' request['x-api-key'] = @api_key
end
Pesquisar documentos
def search(query, num_results: 5, prev_chunks: 1, next_chunks: 1, threshold: nil) uri = URI("#{@base_url}/vector-stores/#{@vector_store_id}/documents/search") params = { q: query, n: num_results, prev_chunks: prev_chunks, next_chunks: next_chunks }
end
Listar documentos
def list_documents uri = URI("#{@base_url}/vector-stores/#{@vector_store_id}/documents") request = Net::HTTP::Get.new(uri) request['x-api-key'] = @api_key
end
Fazer upload de arquivo (formulário multipart)
def upload_file(file_path) uri = URI("#{@base_url}/vector-stores/#{@vector_store_id}/documents")
end
private
def send_request(uri, request) http = Net::HTTP.new(uri.host, uri.port) http.use_ssl = (uri.scheme == 'https')
end end
{% endtab %}
{% tab title="cURL" %}
{% endtab %} {% endtabs %}
Considerações de Desempenho
Em breve: Diagrama de Arquitetura do Armazenamento Vetorial
Este diagrama de arquitetura técnica ilustrará:
A arquitetura de fundação PostgreSQL + pgvector
Estruturas de algoritmos de indexação (IVFFLAT vs. HNSW)
Como as métricas de busca funcionam no espaço vetorial (comparação visual)
Processo de fragmentação de documentos com visualização de sobreposição
Considerações de desempenho visualizadas em diferentes escalas
Otimizando para Diferentes Volumes de Dados
Pequeno (<10k documentos)
IVFFLAT, similaridade cosseno
Configuração simples proporciona bom desempenho
Médio (10k-100k documentos)
IVFFLAT, garantir reindexação regular
Equilíbrio entre velocidade de busca e manutenção do índice
Grande (>100k documentos)
HNSW, considerar aumentar as dimensões do vetor
Maior uso de memória, mas mantém desempenho em escala
Estratégias de Fragmentação
O processo de fragmentação impacta significativamente a qualidade da busca:
Tamanho do Fragmento: Rememberizer utiliza um tamanho de fragmento padrão de 1024 bytes com uma sobreposição de 200 bytes
Fragmentos Menores (512-1024 bytes): Correspondências mais precisas, melhores para perguntas específicas
Fragmentos Maiores (1500-2048 bytes): Mais contexto em cada correspondência, melhores para tópicos mais amplos
Sobreposição: Garante que o contexto não seja perdido nas fronteiras dos fragmentos
Otimização de Consulta
Janelas de Contexto: Use
prev_chunksenext_chunkspara recuperar conteúdo ao redorContagem de Resultados: Comece com 3-5 resultados (
nparameter) e ajuste com base nas necessidades de precisãoLimite: Ajuste o parâmetro
tpara filtrar resultados por pontuação de similaridade
Uso Avançado
Reindexação
Rememberizer aciona automaticamente a reindexação quando a contagem de vetores excede os limites predefinidos, mas considere a reindexação manual após:
Carregar um grande número de documentos
Alterar o modelo de incorporação
Modificar o algoritmo de indexação
Aprimoramento de Consulta
Para melhores resultados de busca:
Seja específico nas consultas de busca
Inclua contexto quando possível
Use linguagem natural em vez de palavras-chave
Ajuste parâmetros com base na qualidade do resultado
Migrando de Outras Bases de Dados Vetoriais
Se você está atualmente usando outras soluções de banco de dados vetoriais e deseja migrar para o Rememberizer Vector Store, os seguintes guias o ajudarão a transitar seus dados de forma eficiente.
Visão Geral da Migração
Migrar dados vetoriais envolve:
Exportar dados do seu banco de dados vetorial de origem
Converter os dados para um formato compatível com o Rememberizer
Importar os dados para o seu Armazenamento Vetorial Rememberizer
Verificar se a migração foi bem-sucedida
Benefícios da Migração para Rememberizer
Fundação PostgreSQL: Construído sobre tecnologia de banco de dados madura com backup e recuperação integrados
Ecossistema Integrado: Conexão perfeita com outros componentes do Rememberizer
Gerenciamento Simplificado: Interface unificada para operações vetoriais
Segurança Avançada: Segurança em nível de linha e controles de acesso granulares
Arquitetura Escalável: Otimização de desempenho à medida que seus dados crescem
Migrando do Pinecone
{% tabs %} {% tab title="Python" %}
{% endtab %}
{% tab title="Node.js" %}
{% endtab %} {% endtabs %}
Migrando do Qdrant
{% tabs %} {% tab title="Python" %}
{% endtab %}
{% tab title="Node.js" %}
{% endtab %} {% endtabs %}
Migrando do Supabase pgvector
Se você já está usando o Supabase com pgvector, a migração para o Rememberizer é particularmente simples, uma vez que ambos usam PostgreSQL com a extensão pgvector.
{% tabs %} {% tab title="Python" %}
{% endtab %}
{% tab title="Node.js" %}
Melhores Práticas de Migração
Siga estas recomendações para uma migração bem-sucedida:
Planeje com Antecedência:
Estime o volume de dados e o tempo necessário para a migração
Programe a migração durante períodos de baixo tráfego
Aumente o espaço em disco antes de iniciar grandes migrações
Teste Primeiro:
Crie um vetor de teste no Rememberizer
Migre um pequeno subconjunto de dados (100-1000 vetores)
Verifique a funcionalidade de busca com consultas-chave
Validação de Dados:
Compare a contagem de documentos antes e depois da migração
Execute consultas de benchmark para garantir resultados semelhantes
Valide se os metadados estão corretamente preservados
Otimize para Desempenho:
Use operações em lote para eficiência
Considere a colocação geográfica dos bancos de dados de origem e destino
Monitore os limites de taxa da API e ajuste os tamanhos dos lotes conforme necessário
Etapas Pós-Migração:
Verifique a criação do índice no Rememberizer
Atualize as configurações do aplicativo para apontar para o novo vetor de armazenamento
Mantenha o banco de dados de origem como backup até que a migração seja verificada
Para referência detalhada da API e documentação de endpoints, visite a página APIs de Armazenamento Vetorial.
Certifique-se de manusear as chaves da API de forma segura e siga as melhores práticas para gerenciamento de chaves da API.
Last updated