Glossar
Ein umfassendes Glossar von Begriffen und Konzepten, die in Rememberizer verwendet werden
Dieses Glossar bietet Definitionen für Schlüsselbegriffe und Konzepte, die in der Rememberizer-Dokumentation verwendet werden. Nutzen Sie es als Referenz, wenn Sie auf unbekannte Terminologie stoßen.
Hinweis: Dieses Glossar stellt die standardisierte Terminologie für Rememberizer dar. Während Sie möglicherweise leichte Variationen in der Dokumentation antreffen, sollten die hier bereitgestellten Begriffe und Definitionen als die kanonische Referenz betrachtet werden.
A
API-Schlüssel: Ein sicheres Authentifizierungstoken, das verwendet wird, um programmgesteuert auf die API-Endpunkte von Rememberizer zuzugreifen. API-Schlüssel werden hauptsächlich für den Zugriff auf den Vektor-Speicher und die Integration von allgemeinem Wissen verwendet.
Autorisierte Anforderungsquelle: Eine Sicherheitseinstellung, die angibt, welche Domains API-Anfragen an Rememberizer stellen können, um potenzielle Angriffe durch Cross-Site-Request-Forgery zu begrenzen.
B
Batch-Operationen: Verarbeitung mehrerer Elemente (Suchanfragen, Uploads usw.) in einer einzigen Anfrage zur Verbesserung der Effizienz. Rememberizer unterstützt Batch-Operationen für Arbeitslasten mit hohem Volumen.
Batch-Größe: Die Anzahl der Elemente, die während Operationen wie Migration, Suche oder Dokumentenaufnahme gemeinsam verarbeitet werden, was die Leistung und den Ressourcenverbrauch beeinflusst.
C
Chunking: Der Prozess, Dokumente in optimal große Stücke (typischerweise 512-2048 Bytes) mit überlappenden Grenzen zu unterteilen, um den Kontext während Vektorsuchen zu bewahren.
Client ID: Eine öffentliche Kennung, die an Drittanbieteranwendungen ausgegeben wird und die OAuth2-Autorisierung mit Rememberizer ermöglicht.
Client Secret: Ein privater Schlüssel, der mit einer Client ID ausgegeben wird, sicher aufbewahrt werden muss und zur Authentifizierung der Anwendung während der OAuth2-Abläufe verwendet wird.
Collection-based Organization: Die Art und Weise, wie Vektorspeicher in Rememberizer organisiert sind, wobei jeder Speicher eine eigene isolierte Sammlung für das Datenmanagement hat.
Common Knowledge: Informationen, die von Benutzern veröffentlicht werden und von anderen Benutzern oder Anwendungen abgerufen werden können, wodurch eine gemeinsame Wissensressource entsteht. Common Knowledge basiert auf einem Memento und kann über die API abgerufen werden. Wird in der Benutzeroberfläche auch manchmal als "Shared Knowledge" bezeichnet.
Context Windows: Der umgebende Inhalt, der mit übereinstimmenden Chunks in den Suchergebnissen enthalten ist, gesteuert durch die Parameter prev_chunks
und next_chunks
.
Cosine Similarity: Ein Maß für die Ähnlichkeit zwischen Vektoren, das durch das Finden des Kosinus des Winkels zwischen ihnen berechnet wird und als Standard-Suchmetrik in Rememberizer verwendet wird.
E
Embedding-Modell: Ein KI-Modell, das Vektor-Embeddings aus Text generiert. Rememberizer unterstützt mehrere Embedding-Modelle, einschließlich OpenAI's text-embedding-3-large und text-embedding-3-small.
Enterprise-Integrationsmuster: Standardisierte Ansätze zur Implementierung von Rememberizer in großangelegten Unternehmensumgebungen, einschließlich architektonischer Entwürfe für Sicherheit, Skalierung und Compliance.
G
Globale Einstellungen: Systemweite Konfigurationen zur Steuerung der Standardberechtigungen und -verhalten in allen verbundenen Apps in Rememberizer.
H
HNSW (Hierarchisches Navigierbares Kleines Welt): Ein Indexierungsalgorithmus, der bessere Genauigkeit für große Datensätze bietet, jedoch höhere Speicheranforderungen mit sich bringt, verfügbar als Indexierungsoption in Rememberizer Vector Stores.
I
Indexierungsalgorithmus: Die Methode, die verwendet wird, um Vektoren für eine effiziente Abfrage zu organisieren. Rememberizer unterstützt die Algorithmen IVFFLAT (Standard) und HNSW.
IVFFLAT: Ein Indexierungsalgorithmus, der ein gutes Gleichgewicht zwischen Suchgeschwindigkeit und Genauigkeit für Vektordatenbanken bietet und als Standard in Rememberizer verwendet wird.
K
Datenquelle: Die verschiedenen Ursprünge von Daten in Rememberizer, einschließlich Integrationen mit Plattformen wie Google Drive, Slack, Dropbox und Gmail. Auch in einigen Kontexten als "Wissensquelle" oder "Integration" bezeichnet.
L
LangChain-Integration: Funktionalität, die es Rememberizer ermöglicht, als Abrufsystem in LangChain-Anwendungen verwendet zu werden, und RAG (Retrieval Augmented Generation) Systeme unterstützt.
M
Memento: Ein Filtermechanismus, der steuert, welche Kenntnisse mit Drittanbieteranwendungen geteilt werden, sodass Benutzer spezifische Dateien, Dokumente oder Inhaltsgruppen selektiv teilen können. Manchmal in der Benutzeroberfläche als "Memento-Filter" bezeichnet.
Memory Integration: Eine Funktion, die es Apps ermöglicht, wertvolle Informationen in Rememberizer für eine spätere Abfrage zu speichern, mit konfigurierbaren Lese-/Schreibberechtigungen. Auch in einigen Kontexten als "Geteilte Erinnerung" bezeichnet.
O
OAuth2-Authentifizierung: Das standardisierte Autorisierungsprotokoll, das von Drittanbieter-Apps verwendet wird, um mit Zustimmung des Nutzers auf Rememberizer-Daten zuzugreifen und sicheren delegierten Zugriff zu gewähren. Manchmal in der Dokumentation auf "OAuth" verkürzt.
R
RAG (Retrieval Augmented Generation): Eine Technik, die Abrufsysteme (wie Rememberizer) mit generativen Modellen kombiniert, um genauere, fundierte Antworten basierend auf spezifischem Wissen zu liefern.
Read Own/Write Own: Ein Berechtigungslevel, bei dem Apps nur auf ihre eigenen Gedächtnisdaten in Rememberizer zugreifen und diese ändern können.
Read All/Write Own: Ein Berechtigungslevel, bei dem Apps Gedächtnisdaten von allen Apps lesen, aber nur ihre eigenen Gedächtnisdaten ändern können.
Reindexing: Der Prozess des Wiederaufbaus von Vektorindizes nach wesentlichen Änderungen, um die Suchleistung in Rememberizer Vector Stores zu verbessern.
RememberizerRetriever: Die spezifische LangChain-Retriever-Klasse, die mit den semantischen Suchfähigkeiten von Rememberizer interagiert.
Rememberizer GPT: Eine benutzerdefinierte GPT-Anwendung, die mit der API von Rememberizer integriert ist, um Zugriff auf persönliches Wissen innerhalb von ChatGPT zu bieten.
Rememberizer Vector Store: Ein auf PostgreSQL basierender Vektordatenbankdienst mit pgvector-Erweiterung, der das Chunking, Vektorisieren und Speichern von Textdaten verwaltet. Die Begriffe "Vector Store" und "Vector Database" werden in der Dokumentation von Rememberizer synonym verwendet, wobei "Vector Store" der bevorzugte Begriff ist.
S
Suchmetrik: Die mathematische Methode zur Berechnung der Ähnlichkeit zwischen Vektoren. Rememberizer unterstützt die Kosinusähnlichkeit (Standard), das innere Produkt und die L2 (euklidische) Distanz. Die Begriffe "Distanz", "Ähnlichkeit" und "Übereinstimmung" werden manchmal austauschbar verwendet, um zu beschreiben, wie eng Vektoren miteinander in Beziehung stehen.
Semantische Suche: Suchfunktionalität, die Inhalte basierend auf der Bedeutung und nicht nur auf Schlüsselwörtern findet, wodurch konzeptionell verwandte Ergebnisse ermöglicht werden, selbst wenn die Terminologie unterschiedlich ist.
Gemeinsamer Speicher: Ein System, das Drittanbieter-Apps ermöglicht, Daten im Rememberizer-Konto eines Benutzers zu speichern und darauf zuzugreifen, wodurch Persistenz über mehrere Anwendungen hinweg gewährleistet wird.
V
Vektordatenbank: Eine spezialisierte Datenbank, die für die effiziente Speicherung und Abfrage von Vektor-Embeddings optimiert ist und semantische Suchfunktionen ermöglicht.
Vektor-Dimension: Die Größe der Vektor-Embeddings (typischerweise 768-1536 Zahlen), die den Detailgrad und die Nuancen beeinflusst, die in der semantischen Darstellung erfasst werden.
Vektor-Embeddings: Numerische Darstellungen (Listen von mehreren hundert Zahlen), die die semantische Bedeutung von Text erfassen und Ähnlichkeitsvergleiche über die Schlüsselwortübereinstimmung hinaus ermöglichen. Oft einfach als "Embeddings" in technischen Kontexten bezeichnet.
API-Header-Konventionen
Beim Verwenden der Rememberizer-APIs sollten die folgenden Header-Konventionen beachtet werden:
Authorization-Header:
Authorization: Bearer YOUR_JWT_TOKEN
API-Key-Header:
X-API-Key: YOUR_API_KEY
(wie gezeigt in Großbuchstaben)Content-Type-Header:
Content-Type: application/json
Verwandte Ressourcen
Für detailliertere Erklärungen zu Schlüsselkonzepten:
Last updated