Cerca documenti dell'Archivio Vettoriale per somiglianza semantica

Cerca documenti del Vector Store con somiglianza semantica e operazioni in batch

Esempi di Richieste

curl -X GET \
  "https://api.rememberizer.ai/api/v1/vector-stores/vs_abc123/documents/search?q=Come%20integrare%20il%20nostro%20prodotto%20con%20sistemi%20di%20terze%20parti&n=5&prev_chunks=1&next_chunks=1" \
  -H "x-api-key: YOUR_API_KEY"

Sostituisci YOUR_API_KEY con la tua reale chiave API del Vector Store e vs_abc123 con il tuo ID del Vector Store.

Parametri del percorso

Parametro
Tipo
Descrizione

vector-store-id

string

Obbligatorio. L'ID del negozio di vettori in cui cercare.

Parametri di Query

Parametro
Tipo
Descrizione

q

string

Obbligatorio. Il testo della query di ricerca.

n

integer

Numero di risultati da restituire. Predefinito: 10.

t

number

Soglia di corrispondenza. Predefinito: 0.7.

prev_chunks

integer

Numero di chunk prima del chunk corrispondente da includere. Predefinito: 0.

next_chunks

integer

Numero di chunk dopo il chunk corrispondente da includere. Predefinito: 0.

Formato di Risposta

Autenticazione

Questo endpoint richiede autenticazione utilizzando una chiave API nell'intestazione x-api-key.

Risposte di Errore

Codice di Stato
Descrizione

400

Richiesta Errata - Parametri richiesti mancanti o formato non valido

401

Non Autorizzato - Chiave API non valida o mancante

404

Non Trovato - Negozio di Vettori non trovato

500

Errore Interno del Server

Suggerimenti per l'Ottimizzazione della Ricerca

Finestre di Contesto

Utilizza i parametri prev_chunks e next_chunks per controllare quanto contesto è incluso con ogni corrispondenza:

  • Imposta entrambi a 0 per corrispondenze precise senza contesto

  • Imposta entrambi a 1-2 per corrispondenze con contesto minimo

  • Imposta entrambi a 3-5 per corrispondenze con contesto sostanziale

Soglia di Corrispondenza

Il parametro t controlla quanto rigorosamente vengono filtrate le corrispondenze:

  • Valori più alti (ad es., 0.9) restituiscono solo corrispondenze molto vicine

  • Valori più bassi (ad es., 0.5) restituiscono più corrispondenze con maggiore varietà

  • Il valore predefinito (0.7) fornisce un approccio equilibrato

Operazioni in Batch

Per applicazioni ad alta capacità, Rememberizer supporta operazioni in batch efficienti sui vettori di archiviazione. Questi metodi ottimizzano le prestazioni durante l'elaborazione di più query di ricerca.

Implementazione della Ricerca in Batch

Ottimizzazione delle Prestazioni per Operazioni in Batch

Quando si implementano operazioni in batch per le ricerche nel vector store, considera queste migliori pratiche:

  1. Dimensionamento Ottimale del Batch: Per la maggior parte delle applicazioni, elaborare 5-10 query in parallelo offre un buon equilibrio tra throughput e utilizzo delle risorse.

  2. Consapevolezza del Rate Limiting: Includi meccanismi di ritardo tra i batch (tipicamente 1-2 secondi) per evitare di superare i limiti di velocità dell'API.

  3. Gestione degli Errori: Implementa una gestione robusta degli errori per le singole query che potrebbero fallire all'interno di un batch.

  4. Gestione delle Connessioni: Per applicazioni ad alto volume, implementa il pooling delle connessioni per ridurre il sovraccarico.

  5. Configurazione dei Timeout: Imposta timeout appropriati per ogni richiesta per evitare che query a lungo termine blocchino l'intero batch.

  6. Elaborazione dei Risultati: Considera di elaborare i risultati in modo asincrono man mano che diventano disponibili piuttosto che attendere tutti i risultati.

  7. Monitoraggio: Monitora metriche di prestazione come il tempo medio di risposta e i tassi di successo per identificare opportunità di ottimizzazione.

Per applicazioni di produzione con volumi di query molto elevati, considera di implementare un sistema di coda con processi di lavoro per gestire grandi batch in modo efficiente.

Questo endpoint ti consente di cercare nel tuo vector store utilizzando la similarità semantica. Restituisce documenti che sono concettualmente correlati alla tua query, anche se non contengono le parole chiave esatte. Questo lo rende particolarmente potente per query in linguaggio naturale e risposte a domande.

Last updated