Søg efter Vektorbutik dokumenter efter semantisk lighed
Søg i Vector Store-dokumenter med semantisk lighed og batchoperationer
Eksempelanmodninger
curl -X GET \
"https://api.rememberizer.ai/api/v1/vector-stores/vs_abc123/documents/search?q=Hvordan%20integrerer%20vi%20vores%20produkt%20med%20tredjeparts%20systemer&n=5&prev_chunks=1&next_chunks=1" \
-H "x-api-key: DIN_API_NØGLE"const searchVectorStore = async (vectorStoreId, query, numResults = 5, prevChunks = 1, nextChunks = 1) => {
const url = new URL(`https://api.rememberizer.ai/api/v1/vector-stores/${vectorStoreId}/documents/search`);
url.searchParams.append('q', query);
url.searchParams.append('n', numResults);
url.searchParams.append('prev_chunks', prevChunks);
url.searchParams.append('next_chunks', nextChunks);
const response = await fetch(url.toString(), {
method: 'GET',
headers: {
'x-api-key': 'DIN_API_NØGLE'
}
});
const data = await response.json();
console.log(data);
};
searchVectorStore(
'vs_abc123',
'Hvordan integrerer vi vores produkt med tredjeparts systemer',
5,
1,
1
);Sti Parametre
vector-store-id
string
Påkrævet. ID'et på vektorbutikken, der skal søges i.
Forespørgselsparametre
q
string
Påkrævet. Den søgeforespørgselstekst.
n
integer
Antal resultater der skal returneres. Standard: 10.
t
number
Matchende tærskel. Standard: 0.7.
prev_chunks
integer
Antal chunks før den matchede chunk der skal inkluderes. Standard: 0.
next_chunks
integer
Antal chunks efter den matchede chunk der skal inkluderes. Standard: 0.
Responsformat
Godkendelse
Denne endpoint kræver godkendelse ved hjælp af en API-nøgle i x-api-key headeren.
Fejlrespons
400
Dårlig anmodning - Manglende nødvendige parametre eller ugyldigt format
401
Uautoriseret - Ugyldig eller manglende API-nøgle
404
Ikke fundet - Vektorbutik ikke fundet
500
Intern serverfejl
Søgeoptimeringstips
Kontekstvinduer
Brug prev_chunks og next_chunks parametrene til at styre, hvor meget kontekst der inkluderes med hver match:
Sæt begge til 0 for præcise matches uden kontekst
Sæt begge til 1-2 for matches med minimal kontekst
Sæt begge til 3-5 for matches med betydelig kontekst
Matchende Tærskel
t parameteret styrer, hvor strengt matches filtreres:
Højere værdier (f.eks. 0.9) returnerer kun meget tætte matches
Lavere værdier (f.eks. 0.5) returnerer flere matches med større variation
Standardværdien (0.7) giver en afbalanceret tilgang
Batch Operationer
For applikationer med høj gennemstrømning understøtter Rememberizer effektive batchoperationer på vektorbutikker. Disse metoder optimerer ydeevnen, når der behandles flere søgeforespørgsler.
Batch Search Implementation
Ydelsesoptimering for Batch-operationer
Når du implementerer batch-operationer til søgninger i vektorbutikker, skal du overveje disse bedste praksisser:
Optimal Batch-størrelse: For de fleste applikationer giver behandling af 5-10 forespørgsler parallelt en god balance mellem gennemløb og ressourceforbrug.
Bevidsthed om Ratebegrænsning: Inkluder forsinkelsesmekanismer mellem batches (typisk 1-2 sekunder) for at undgå at ramme API'ens ratebegrænsninger.
Fejlhåndtering: Implementer robust fejlhåndtering for individuelle forespørgsler, der måtte fejle inden for en batch.
Forbindelsesstyring: For applikationer med høj volumen, implementer forbindelsespulje for at reducere overhead.
Timeout-konfiguration: Sæt passende timeouts for hver anmodning for at forhindre, at langvarige forespørgsler blokerer hele batchen.
Resultatbehandling: Overvej at behandle resultater asynkront, efterhånden som de bliver tilgængelige, i stedet for at vente på alle resultater.
Overvågning: Spor ydelsesmetrikker som gennemsnitlig svartid og succesrater for at identificere optimeringsmuligheder.
For produktionsapplikationer med meget høje forespørgselsvolumener, overvej at implementere et køsystem med arbejdere for effektivt at håndtere store batches.
Denne endpoint giver dig mulighed for at søge i din vektorbutik ved hjælp af semantisk lighed. Den returnerer dokumenter, der er konceptuelt relateret til din forespørgsel, selvom de ikke indeholder de nøjagtige nøgleord. Dette gør det særligt kraftfuldt til naturlige sprogforespørgsler og spørgsmålssvar.
Last updated