Søg efter dokumenter efter semantisk lighed
Semantisk søgeendpoint med batchbehandlingsmuligheder
Last updated
Semantisk søgeendpoint med batchbehandlingsmuligheder
Last updated
q
string
Påkrævet. Den søgeforespørgselstekst (op til 400 ord).
n
integer
Antal resultater der skal returneres. Standard: 3. Brug højere værdier (f.eks. 10) for mere omfattende resultater.
from
string
Starten af tidsintervallet for dokumenter der skal søges, i ISO 8601 format.
to
string
Slutningen af tidsintervallet for dokumenter der skal søges, i ISO 8601 format.
prev_chunks
integer
Antal forudgående chunks der skal inkluderes for kontekst. Standard: 2.
next_chunks
integer
Antal følgende chunks der skal inkluderes for kontekst. Standard: 2.
Når du søger efter et svar på et spørgsmål, så prøv at formulere din forespørgsel, som om det var et ideelt svar. For eksempel:
I stedet for: "Hvad er vektorindlejring?" Prøv: "Vektorindlejring er en teknik, der konverterer tekst til numeriske vektorer i et højdimensionelt rum."
Start med n=3
for hurtige, høj-relevante resultater
Øg til n=10
eller højere for mere omfattende information
Hvis søgningen returnerer utilstrækkelig information, prøv at øge n
-parameteren
Brug from
og to
parametrene til at fokusere på dokumenter fra specifikke tidsperioder:
Nylige dokumenter: Sæt from
til en nylig dato
Historisk analyse: Angiv et specifikt datointerval
Udelukke forældet information: Sæt en passende to
dato
For effektivt at håndtere store mængder af søgeforespørgsler understøtter Rememberizer batchoperationer for at optimere ydeevnen og reducere API-opkaldsoverskuddet.
Når du implementerer batchoperationer, skal du overveje disse bedste praksisser:
Optimal Batchstørrelse: Start med batchstørrelser på 5-10 forespørgsler og juster baseret på din applikations ydelseskarakteristika.
Hastighedsbegrænsning: Inkluder forsinkelser mellem batcher for at forhindre API-throttling. Et godt udgangspunkt er 1 sekund mellem batcher.
Fejlhåndtering: Implementer robust fejlhåndtering for at håndtere mislykkede anmodninger inden for batcher.
Ressourcestyring: Overvåg klient-side ressourceforbrug, især med store batchstørrelser, for at forhindre overdreven hukommelsesforbrug.
Responsbehandling: Behandl batchresultater asynkront, når det er muligt, for at forbedre brugeroplevelsen.
For applikationer med høj volumen, overvej at implementere et køsystem for effektivt at håndtere et stort antal søgeanmodninger.
Denne endpoint giver kraftfulde semantiske søgefunktioner på tværs af din samlede vidensbase. Den bruger vektorindlejringer til at finde indhold baseret på betydning snarere end præcise nøgleordsmatch.
For en dybere forståelse af, hvordan vektorindlejringer fungerer, og hvorfor denne søgemetode er effektiv, se