Søg efter Vektorbutik dokumenter efter semantisk lighed
Søg i Vector Store-dokumenter med semantisk lighed og batchoperationer
Last updated
Søg i Vector Store-dokumenter med semantisk lighed og batchoperationer
Last updated
vector-store-id
string
Påkrævet. ID'et på vektorbutikken, der skal søges i.
q
string
Påkrævet. Den søgeforespørgselstekst.
n
integer
Antal resultater der skal returneres. Standard: 10.
t
number
Matchende tærskel. Standard: 0.7.
prev_chunks
integer
Antal chunks før den matchede chunk der skal inkluderes. Standard: 0.
next_chunks
integer
Antal chunks efter den matchede chunk der skal inkluderes. Standard: 0.
Denne endpoint kræver godkendelse ved hjælp af en API-nøgle i x-api-key
headeren.
400
Dårlig anmodning - Manglende nødvendige parametre eller ugyldigt format
401
Uautoriseret - Ugyldig eller manglende API-nøgle
404
Ikke fundet - Vektorbutik ikke fundet
500
Intern serverfejl
Brug prev_chunks
og next_chunks
parametrene til at styre, hvor meget kontekst der inkluderes med hver match:
Sæt begge til 0 for præcise matches uden kontekst
Sæt begge til 1-2 for matches med minimal kontekst
Sæt begge til 3-5 for matches med betydelig kontekst
t
parameteret styrer, hvor strengt matches filtreres:
Højere værdier (f.eks. 0.9) returnerer kun meget tætte matches
Lavere værdier (f.eks. 0.5) returnerer flere matches med større variation
Standardværdien (0.7) giver en afbalanceret tilgang
For applikationer med høj gennemstrømning understøtter Rememberizer effektive batchoperationer på vektorbutikker. Disse metoder optimerer ydeevnen, når der behandles flere søgeforespørgsler.
Når du implementerer batch-operationer til søgninger i vektorbutikker, skal du overveje disse bedste praksisser:
Optimal Batch-størrelse: For de fleste applikationer giver behandling af 5-10 forespørgsler parallelt en god balance mellem gennemløb og ressourceforbrug.
Bevidsthed om Ratebegrænsning: Inkluder forsinkelsesmekanismer mellem batches (typisk 1-2 sekunder) for at undgå at ramme API'ens ratebegrænsninger.
Fejlhåndtering: Implementer robust fejlhåndtering for individuelle forespørgsler, der måtte fejle inden for en batch.
Forbindelsesstyring: For applikationer med høj volumen, implementer forbindelsespulje for at reducere overhead.
Timeout-konfiguration: Sæt passende timeouts for hver anmodning for at forhindre, at langvarige forespørgsler blokerer hele batchen.
Resultatbehandling: Overvej at behandle resultater asynkront, efterhånden som de bliver tilgængelige, i stedet for at vente på alle resultater.
Overvågning: Spor ydelsesmetrikker som gennemsnitlig svartid og succesrater for at identificere optimeringsmuligheder.
For produktionsapplikationer med meget høje forespørgselsvolumener, overvej at implementere et køsystem med arbejdere for effektivt at håndtere store batches.
Denne endpoint giver dig mulighed for at søge i din vektorbutik ved hjælp af semantisk lighed. Den returnerer dokumenter, der er konceptuelt relateret til din forespørgsel, selvom de ikke indeholder de nøjagtige nøgleord. Dette gør det særligt kraftfuldt til naturlige sprogforespørgsler og spørgsmålssvar.