Vektorbutikker
Denne guide vil hjælpe dig med at forstå, hvordan du bruger Rememberizer Vector Store som udvikler.
Rememberizer Vektorbutik forenkler processen med at håndtere vektordata, så du kan fokusere på tekstinput og udnytte kraften i vektorer til forskellige applikationer såsom søgning og dataanalyse.
Introduktion
Rememberizer Vector Store tilbyder en brugervenlig grænseflade til håndtering af vektordata, mens kompleksiteten ved vektorindlejringer abstraheres. Drevet af PostgreSQL med pgvector-udvidelsen, giver Rememberizer Vector Store dig mulighed for at arbejde direkte med tekst. Tjenesten håndterer opdeling, vektorisering og lagring af tekstdata, hvilket gør det lettere for dig at fokusere på din kerneapplikationslogik.
For en dybere forståelse af de teoretiske koncepter bag vektorindlejringer og vektordatabaser, se Hvad er vektorindlejringer og vektordatabaser?.
Teknisk Oversigt
Hvordan Vektorbutikker Fungerer
Rememberizer Vektorbutikker konverterer tekst til højdimensionale vektorrepræsentationer (indlejring), der fanger semantisk betydning. Dette muliggør:
Semantisk Søgning: Find dokumenter baseret på betydning snarere end blot nøgleord
Ligheds Matching: Identificer konceptuelt relateret indhold
Effektiv Hentning: Hurtigt finde relevant information fra store datasæt
Nøglekomponenter
Dokumentbehandling: Teksten opdeles i optimalt størrelsesdelte bidder med overlappende grænser for at bevare konteksten
Vektorisering: Bidder konverteres til indlejringer ved hjælp af state-of-the-art modeller
Indeksering: Specialiserede algoritmer organiserer vektorer til effektiv lighedssøgning
Forespørgselsbehandling: Søgeforespørgsler vektorisers og sammenlignes med gemte indlejringer
Arkitektur
Rememberizer implementerer vektorbutikker ved hjælp af:
PostgreSQL med pgvector-udvidelse: Til effektiv vektoropbevaring og søgning
Samling-baseret organisering: Hver vektorbutik har sin egen isolerede samling
API-drevet adgang: Enkle RESTful slutpunkter til alle operationer
Kom godt i gang
Oprettelse af en Vektorbutik
Naviger til sektionen for Vektorbutikker i dit dashboard
Klik på "Opret ny Vektorbutik":
En formular vises, der beder dig om at indtaste oplysninger.
Udfyld oplysningerne:
Navn: Angiv et unikt navn til din vektorbutik.
Beskrivelse: Skriv en kort beskrivelse af vektorbutikken.
Indlejringsmodel: Vælg den model, der konverterer tekst til vektorer.
Indekseringsalgoritme: Vælg, hvordan vektorer vil blive organiseret til søgning.
Søgemetrik: Definer, hvordan lighed mellem vektorer beregnes.
Vektordimension: Størrelsen på vektorindlejringerne (typisk 768-1536).
Indsend formularen:
Klik på "Opret" knappen. Du vil modtage en succesmeddelelse, og den nye butik vil vises i din liste over vektorbutikker.

Konfigurationsmuligheder
Indlejringsmodeller
openai/text-embedding-3-large
1536
Højpræcisions indlejringsmodel fra OpenAI
Produktionsapplikationer, der kræver maksimal nøjagtighed
openai/text-embedding-3-small
1536
Mindre, hurtigere indlejringsmodel fra OpenAI
Applikationer med højere gennemstrømningskrav
Indekseringsalgoritmer
IVFFLAT (standard)
Inverteret fil med flad kompression
God balance mellem hastighed og nøjagtighed; fungerer godt for de fleste datasæt
HNSW
Hierarkisk Navigerbar Lille Verden
Bedre nøjagtighed for store datasæt; højere hukommelseskrav
Søgemetrikker
cosine (standard)
Måler vinklen mellem vektorer
Generel formål lighedsmatch
indre produkt (ip)
Punktprodukt mellem vektorer
Når vektormagnituden er vigtig
L2 (Euclidean)
Lige afstand mellem vektorer
Når rumlige forhold betyder noget
Håndtering af Vektorbutikker
Vis og Rediger Vektorbutikker:
Få adgang til administrationsdashboardet for at se, redigere eller slette vektorbutikker.
Visning af Dokumenter:
Gennemse individuelle dokumenter og deres tilknyttede metadata inden for en specifik vektorbutik.
Statistik:
Se detaljerede statistikker såsom antallet af gemte vektorer, forespørgselsydelse og driftsmålinger.

API Nøglehåndtering
API-nøgler bruges til at autentificere og autorisere adgang til Rememberizer Vector Store's API-endepunkter. Korrekt håndtering af API-nøgler er afgørende for at opretholde sikkerheden og integriteten af dine vektorlager.
Oprettelse af API-nøgler
Gå til din Vector Store detaljer side
Naviger til sektionen for API-nøgleadministration:
Den kan findes under fanen "Konfiguration"
Klik på "Tilføj API-nøgle":
En formular vises, der beder dig om at indtaste oplysninger.
Udfyld oplysningerne:
Navn: Angiv et navn til API-nøglen for at hjælpe dig med at identificere dens anvendelsestilfælde.
Indsend formularen:
Klik på "Opret" knappen. Den nye API-nøgle vil blive genereret og vist. Sørg for at kopiere og opbevare den sikkert. Denne nøgle bruges til at godkende anmodninger til den specifikke vector store.

Tilbagetrækning af API-nøgler
Hvis en API-nøgle ikke længere er nødvendig, kan du slette den for at forhindre potentiel misbrug.
Af sikkerhedsmæssige årsager kan du overveje at rotere dine API-nøgler periodisk. Dette indebærer at generere en ny nøgle og tilbagetrække den gamle.
Brug af Vector Store API
Efter at have oprettet en Vector Store og genereret en API-nøgle, kan du interagere med den ved hjælp af REST API'en.
Kodeeksempler
Eksempel på brug
=begin client = VectorStoreClient.new('your_api_key', 'vs_abc123')
Søg efter dokumenter
results = client.search('Hvad er de bedste praksisser for datasikkerhed?') puts "Fundet #{results['matched_chunks'].length} resultater"
Vis top resultat
if results['matched_chunks'].any? top_match = results['matched_chunks'].first puts "Top match (afstand: #{top_match['distance']}):" puts "Dokument: #{top_match['document']['name']}" puts "Indhold: #{top_match['matched_content']}" end =end
Ydelsesovervejelser
Kommer snart: Vektorbutik Arkitekturdiagram
Dette tekniske arkitekturdiagram vil illustrere:
PostgreSQL + pgvector fundamentarkitektur
Indekseringsalgoritmestrukturer (IVFFLAT vs. HNSW)
Hvordan søgemetrikker fungerer i vektorrum (visuel sammenligning)
Dokumentchunking-proces med overlapvisualisering
Ydelsesovervejelser visualiseret på tværs af forskellige skalaer
Optimering for Forskellige Datavolumener
Lille (<10k dokumenter)
IVFFLAT, cosinuslighed
Enkel konfiguration giver god ydeevne
Medium (10k-100k dokumenter)
IVFFLAT, sørg for regelmæssig reindeksering
Balance mellem søgehastighed og indeksvedligeholdelse
Stor (>100k dokumenter)
HNSW, overvej at øge vektordimensioner
Højere hukommelsesforbrug, men opretholder ydeevne i stor skala
Chunking Strategier
Chunking-processen påvirker søgekvaliteten betydeligt:
Chunk Størrelse: Rememberizer bruger en standard chunk størrelse på 1024 bytes med en overlapning på 200 bytes
Mindre Chunks (512-1024 bytes): Mere præcise matches, bedre til specifikke spørgsmål
Større Chunks (1500-2048 bytes): Mere kontekst i hvert match, bedre til bredere emner
Overlapning: Sikrer at konteksten ikke går tabt ved chunk-grænser
Forespørgselsoptimering
Kontekstvinduer: Brug
prev_chunksognext_chunkstil at hente omgivende indholdResultatantal: Start med 3-5 resultater (
nparameter) og juster baseret på præcisionsbehovTærskel: Juster
tparameteren for at filtrere resultater efter lighedsscore
Avanceret brug
Reindeksering
Rememberizer udløser automatisk reindeksering, når vektortællinger overstiger foruddefinerede tærskler, men overvej manuel reindeksering efter:
Upload af et stort antal dokumenter
Ændring af indlejringsmodellen
Modifikation af indekseringsalgoritmen
Spørgsmål Forbedring
For bedre søgeresultater:
Vær specifik i søgespørgsmål
Inkluder kontekst når det er muligt
Brug naturligt sprog frem for nøgleord
Justér parametre baseret på resultatkvalitet
Migration fra Andre Vektordatabaser
Hvis du i øjeblikket bruger andre vektordatabase-løsninger og ønsker at migrere til Rememberizer Vector Store, vil de følgende vejledninger hjælpe dig med at overføre dine data effektivt.
Migrering Oversigt
Migrering af vektordata involverer:
Eksportering af data fra din kildevektordatabase
Konvertering af data til et format, der er kompatibelt med Rememberizer
Importering af data til din Rememberizer Vektorbutik
Verificering af, at migreringen var vellykket
Fordele ved at migrere til Rememberizer
PostgreSQL Foundation: Bygget på moden databasteknologi med indbygget backup og gendannelse
Integreret Økosystem: Problemfri forbindelse med andre Rememberizer-komponenter
Forenklet Administration: Unified interface til vektoroperationer
Avanceret Sikkerhed: Sikkerhed på række-niveau og detaljerede adgangskontroller
Skalerbar Arkitektur: Ydelsesoptimering efterhånden som dine data vokser
Migrering fra Pinecone
Migrering fra Qdrant
Migration fra Supabase pgvector
Hvis du allerede bruger Supabase med pgvector, er migrationen til Rememberizer særligt ligetil, da begge bruger PostgreSQL med pgvector-udvidelsen.
Migrerings bedste praksis
Følg disse anbefalinger for en vellykket migrering:
Planlæg på forhånd:
Estimér datamængden og den tid, der kræves til migrering
Planlæg migrering i perioder med lav trafik
Øg diskpladsen før du starter store migreringer
Test først:
Opret et testvektorlager i Rememberizer
Migrer et lille udsnit af data (100-1000 vektorer)
Bekræft søgefunktionaliteten med nøglespørgsmål
Datavalidering:
Sammenlign dokumenttællinger før og efter migrering
Kør benchmark-spørgsmål for at sikre lignende resultater
Valider at metadata er korrekt bevaret
Optimer for ydeevne:
Brug batchoperationer for effektivitet
Overvej geografisk kolokation af kilde- og mål-databaser
Overvåg API-hastighedsgrænser og juster batchstørrelserne derefter
Post-migrerings trin:
Bekræft indeksoprettelse i Rememberizer
Opdater applikationskonfigurationer til at pege på det nye vektorlager
Behold kilde-databasen som backup, indtil migreringen er bekræftet
For detaljeret API-referencer og endpoint-dokumentation, besøg siden.
Sørg for at håndtere API-nøgler sikkert og følge bedste praksis for API-nøglehåndtering.
Last updated