Ordliste
Et omfattende ordforråd af termer og begreber, der anvendes i Rememberizer
Denne ordbog giver definitioner for nøglebegreber og koncepter, der anvendes i hele Rememberizer-dokumentationen. Brug den som reference, når du støder på ukendt terminologi.
Bemærk: Denne ordbog repræsenterer den standardiserede terminologi for Rememberizer. Selvom du kan støde på små variationer i dokumentationen, bør de termer og definitioner, der er givet her, betragtes som den kanoniske reference.
A
API-nøgle: En sikker autentificeringstoken, der bruges til at få adgang til Rememberizers API-endepunkter programmatisk. API-nøgler bruges primært til adgang til vektorlager og integration af fælles viden.
Autoriseret anmodningsoprindelse: En sikkerhedsindstilling, der specificerer, hvilke domæner der kan foretage API-anmodninger til Rememberizer, hvilket begrænser potentielle angreb med krydssite-anmodninger.
B
Batch Operationer: Behandling af flere elementer (søgninger, uploads osv.) i en enkelt anmodning for at forbedre effektiviteten. Rememberizer understøtter batch operationer for højvolumen arbejdsbyrder.
Batch Størrelse: Antallet af elementer, der behandles sammen under operationer som migration, søgning eller dokumentindtagelse, hvilket påvirker ydeevne og ressourceforbrug.
C
Chunking: Processen med at opdele dokumenter i optimalt størrelse stykker (typisk 512-2048 bytes) med overlappende grænser for at bevare konteksten under vektorsøgninger.
Client ID: En offentlig identifikator udstedt til tredjepartsapplikationer, der muliggør OAuth2-godkendelse med Rememberizer.
Client Secret: En privat nøgle udstedt med et Client ID, som skal opbevares sikkert og bruges til at autentificere applikationen under OAuth2-flow.
Collection-based Organization: Den måde, hvorpå vektorbutikker er organiseret i Rememberizer, hvor hver butik har sin egen isolerede samling til datastyring.
Common Knowledge: Oplysninger offentliggjort af brugere, som kan tilgås af andre brugere eller applikationer, hvilket skaber en delt vidensressource. Common Knowledge er baseret på et Memento og kan tilgås via API. Kaldes også nogle gange "Shared Knowledge" i brugergrænsefladen.
Context Windows: Det omgivende indhold inkluderet med matchede stykker i søgeresultaterne, kontrolleret af prev_chunks
og next_chunks
parametre.
Cosine Similarity: Et mål for lighed mellem vektorer beregnet ved at finde cosinus af vinklen mellem dem, brugt som den standard søgemetrik i Rememberizer.
E
Embedding Model: En AI-model, der genererer vektorindlejringer fra tekst. Rememberizer understøtter flere indlejringsmodeller, herunder OpenAI's text-embedding-3-large og text-embedding-3-small.
Enterprise Integration Patterns: Standardiserede tilgange til implementering af Rememberizer i store virksomhedsmiljøer, herunder arkitektoniske design til sikkerhed, skalering og overholdelse.
G
Globale indstillinger: Systemomspændende konfigurationer til kontrol af standardrettigheder og adfærd på tværs af alle tilsluttede apps i Rememberizer.
H
HNSW (Hierarkisk Navigerbar Lille Verden): En indekseringsalgoritme, der tilbyder bedre nøjagtighed for store datasæt på bekostning af højere hukommelseskrav, tilgængelig som en indekseringsmulighed i Rememberizer Vector Stores.
I
Indexeringsalgoritme: Metoden der bruges til at organisere vektorer for effektiv hentning. Rememberizer understøtter IVFFLAT (standard) og HNSW algoritmer.
IVFFLAT: En indexeringsalgoritme der giver en god balance mellem søgehastighed og nøjagtighed for vektordatabaser, brugt som standard i Rememberizer.
K
Data Source: De forskellige oprindelser af data i Rememberizer, herunder integrationer med platforme som Google Drive, Slack, Dropbox og Gmail. Også omtalt som "Knowledge Source" eller "Integration" i nogle sammenhænge.
L
LangChain Integration: Funktionalitet der gør det muligt for Rememberizer at blive brugt som en retriever i LangChain-applikationer, der understøtter RAG (Retrieval Augmented Generation) systemer.
M
Memento: En filtreringsmekanisme, der kontrollerer, hvilken viden der deles med tredjepartsapplikationer, hvilket giver brugerne mulighed for selektivt at dele specifikke filer, dokumenter eller indhold grupper. Nogle gange omtalt som "Memento Filter" i brugergrænsefladen.
Memory Integration: En funktion, der gør det muligt for apps at gemme værdifuld information i Rememberizer til senere hentning, med konfigurerbare læse-/skriveadgang. Også omtalt som "Shared Memory" i nogle sammenhænge.
O
OAuth2 Godkendelse: Den standard autorisationsprotokol, der bruges til tredjepartsapps til at få adgang til Rememberizer-data med brugerens samtykke, hvilket giver sikker delegeret adgang. Nogle gange forkortet til "OAuth" i dokumentationen.
R
RAG (Retrieval Augmented Generation): En teknik, der kombinerer hentningssystemer (som Rememberizer) med generative modeller for at give mere præcise, forankrede svar baseret på specifik viden.
Read Own/Write Own: Et tilladelsesniveau, hvor apps kun kan få adgang til og ændre deres egne hukommelsesdata i Rememberizer.
Read All/Write Own: Et tilladelsesniveau, hvor apps kan læse hukommelsesdata fra alle apps, men kun kan ændre deres egne hukommelsesdata.
Reindexing: Processen med at genopbygge vektorindekser efter betydelige ændringer for at forbedre søgeydelsen i Rememberizer Vector Stores.
RememberizerRetriever: Den specifikke LangChain retriever-klasse, der grænseflader med Rememberizers semantiske søgefunktioner.
Rememberizer GPT: En tilpasset GPT-applikation, der integrerer med Rememberizers API for at give adgang til personlig viden inden for ChatGPT.
Rememberizer Vector Store: En PostgreSQL-baseret vektordatabaseservice med pgvector-udvidelse, der håndterer chunking, vektorisering og opbevaring af tekstdata. Begreberne "Vector Store" og "Vector Database" bruges om hinanden i Rememberizer-dokumentationen, hvor "Vector Store" er det foretrukne udtryk.
S
Search Metric: Den matematiske metode, der bruges til at beregne lighed mellem vektorer. Rememberizer understøtter cosinus-lighed (standard), indre produkt og L2 (Euclidean) afstand. Begreberne "afstand", "lighed" og "matchning" bruges nogle gange om hinanden for at referere til, hvor tæt vektorer relaterer sig til hinanden.
Semantic Search: Søgefunktionalitet, der finder indhold baseret på betydning snarere end blot nøgleord, hvilket muliggør konceptuelt relaterede resultater, selv når terminologien adskiller sig.
Shared Memory: Et system, der gør det muligt for tredjepartsapps at gemme og få adgang til data i en brugers Rememberizer-konto, hvilket giver vedholdenhed på tværs af flere applikationer.
V
Vektordatabasen: En specialiseret database optimeret til effektivt at gemme og hente vektorindlejringer, hvilket muliggør semantiske søgefunktioner.
Vektordimension: Størrelsen af vektorindlejringer (typisk 768-1536 tal), der påvirker detaljen og nuancerne fanget i den semantiske repræsentation.
Vektorindlejringer: Numeriske repræsentationer (lister af flere hundrede tal), der fanger den semantiske betydning af tekst, hvilket muliggør lighedssammenligninger ud over nøgleordsmatch. Ofte omtalt blot som "Indlejringer" i tekniske sammenhænge.
API Header Konventioner
Når du bruger Rememberizer API'er, skal følgende headerkonventioner følges:
Authorization Header:
Authorization: Bearer YOUR_JWT_TOKEN
API Key Header:
X-API-Key: YOUR_API_KEY
(med store bogstaver som vist)Content-Type Header:
Content-Type: application/json
Relaterede Ressourcer
For mere dybdegående forklaringer af nøglekoncepter:
Last updated