Glossario
Un glossario completo di termini e concetti utilizzati in Rememberizer
Questo glossario fornisce definizioni per termini e concetti chiave utilizzati nella documentazione di Rememberizer. Usalo come riferimento quando incontri terminologia sconosciuta.
Nota: Questo glossario rappresenta la terminologia standardizzata per Rememberizer. Anche se potresti incontrare lievi variazioni nella documentazione, i termini e le definizioni forniti qui dovrebbero essere considerati il riferimento canonico.
A
API Key: Un token di autenticazione sicuro utilizzato per accedere programmaticamente agli endpoint API di Rememberizer. Le chiavi API sono utilizzate principalmente per l'accesso al vettore di archiviazione e l'integrazione della conoscenza comune.
Authorized Request Origin: Un'impostazione di sicurezza che specifica quali domini possono effettuare richieste API a Rememberizer, limitando i potenziali attacchi di cross-site request forgery.
B
Operazioni in Batch: Elaborazione di più elementi (ricerche, caricamenti, ecc.) in una singola richiesta per migliorare l'efficienza. Rememberizer supporta operazioni in batch per carichi di lavoro ad alto volume.
Dimensione del Batch: Il numero di elementi elaborati insieme durante operazioni come migrazione, ricerca o ingestione di documenti, che influisce sulle prestazioni e sull'uso delle risorse.
C
Chunking: Il processo di suddivisione dei documenti in pezzi di dimensioni ottimali (tipicamente 512-2048 byte) con confini sovrapposti per preservare il contesto durante le ricerche vettoriali.
Client ID: Un identificatore pubblico rilasciato a applicazioni di terze parti che consente l'autorizzazione OAuth2 con Rememberizer.
Client Secret: Una chiave privata rilasciata con un Client ID che deve essere mantenuta sicura e viene utilizzata per autenticare l'applicazione durante i flussi OAuth2.
Collection-based Organization: Il modo in cui gli archivi vettoriali sono organizzati in Rememberizer, con ogni archivio che ha la propria collezione isolata per la gestione dei dati.
Common Knowledge: Informazioni pubblicate dagli utenti che possono essere accessibili da altri utenti o applicazioni, creando una risorsa di conoscenza condivisa. La Common Knowledge si basa su un Memento e può essere accessibile tramite API. A volte è anche chiamata "Shared Knowledge" nell'interfaccia utente.
Context Windows: Il contenuto circostante incluso con i chunk corrispondenti nei risultati di ricerca, controllato dai parametri prev_chunks
e next_chunks
.
Cosine Similarity: Una misura di somiglianza tra vettori calcolata trovando il coseno dell'angolo tra di essi, utilizzata come metrica di ricerca predefinita in Rememberizer.
E
Modello di Embedding: Un modello di intelligenza artificiale che genera embedding vettoriali a partire dal testo. Rememberizer supporta diversi modelli di embedding, tra cui text-embedding-3-large e text-embedding-3-small di OpenAI.
Modelli di Integrazione Aziendale: Approcci standardizzati per implementare Rememberizer in ambienti aziendali su larga scala, inclusi progetti architettonici per sicurezza, scalabilità e conformità.
G
Impostazioni Globali: Configurazioni a livello di sistema per controllare le autorizzazioni e i comportamenti predefiniti in tutte le app collegate in Rememberizer.
H
HNSW (Gerarchico Navigabile Piccolo Mondo): Un algoritmo di indicizzazione che offre una migliore accuratezza per grandi set di dati a scapito di maggiori requisiti di memoria, disponibile come opzione di indicizzazione negli Store di Vettori di Rememberizer.
I
Algoritmo di Indicizzazione: Il metodo utilizzato per organizzare i vettori per un recupero efficiente. Rememberizer supporta gli algoritmi IVFFLAT (predefinito) e HNSW.
IVFFLAT: Un algoritmo di indicizzazione che fornisce un buon equilibrio tra velocità di ricerca e precisione per i database vettoriali, utilizzato come predefinito in Rememberizer.
K
Fonte Dati: Le varie origini dei dati in Rememberizer, comprese le integrazioni con piattaforme come Google Drive, Slack, Dropbox e Gmail. Nota anche come "Fonte di Conoscenza" o "Integrazione" in alcuni contesti.
L
Integrazione LangChain: Funzionalità che consente a Rememberizer di essere utilizzato come recuperatore nelle applicazioni LangChain, supportando i sistemi RAG (Generazione Aumentata da Recupero).
M
Memento: Un meccanismo di filtraggio che controlla quali conoscenze vengono condivise con applicazioni di terze parti, consentendo agli utenti di condividere selettivamente file, documenti o gruppi di contenuti specifici. A volte chiamato "Filtro Memento" nell'interfaccia utente.
Integrazione della Memoria: Una funzionalità che consente alle app di memorizzare informazioni preziose in Rememberizer per un recupero successivo, con permessi di lettura/scrittura configurabili. Chiamato anche "Memoria Condivisa" in alcuni contesti.
O
Autenticazione OAuth2: Il protocollo di autorizzazione standard utilizzato per le app di terze parti per accedere ai dati di Rememberizer con il consenso dell'utente, fornendo un accesso delegato sicuro. A volte abbreviato in "OAuth" nella documentazione.
R
RAG (Generazione Aumentata da Recupero): Una tecnica che combina sistemi di recupero (come Rememberizer) con modelli generativi per fornire risposte più accurate e fondate basate su conoscenze specifiche.
Leggi Proprietario/Scrivi Proprietario: Un livello di autorizzazione in cui le app possono accedere e modificare solo i propri dati di memoria in Rememberizer.
Leggi Tutti/Scrivi Proprietario: Un livello di autorizzazione in cui le app possono leggere i dati di memoria da tutte le app ma possono modificare solo i propri dati di memoria.
Reindicizzazione: Il processo di ricostruzione degli indici vettoriali dopo cambiamenti significativi per migliorare le prestazioni di ricerca nei Rememberizer Vector Stores.
RememberizerRetriever: La classe retriever specifica di LangChain che si interfaccia con le capacità di ricerca semantica di Rememberizer.
Rememberizer GPT: Un'applicazione GPT personalizzata che si integra con l'API di Rememberizer per fornire accesso a conoscenze personali all'interno di ChatGPT.
Rememberizer Vector Store: Un servizio di database vettoriale basato su PostgreSQL con estensione pgvector che gestisce il chunking, la vettorizzazione e l'archiviazione dei dati testuali. I termini "Vector Store" e "Vector Database" sono usati in modo intercambiabile nella documentazione di Rememberizer, con "Vector Store" come termine preferito.
S
Search Metric: Il metodo matematico utilizzato per calcolare la somiglianza tra vettori. Rememberizer supporta la somiglianza coseno (predefinita), il prodotto interno e la distanza L2 (Euclidea). I termini "distanza", "somiglianza" e "corrispondenza" sono talvolta usati in modo intercambiabile per riferirsi a quanto i vettori siano correlati tra loro.
Semantic Search: Funzionalità di ricerca che trova contenuti basati sul significato piuttosto che solo su parole chiave, consentendo risultati concettualmente correlati anche quando la terminologia differisce.
Shared Memory: Un sistema che consente alle app di terze parti di memorizzare e accedere ai dati nell'account Rememberizer di un utente, fornendo persistenza attraverso più applicazioni.
V
Database Vettoriale: Un database specializzato ottimizzato per memorizzare e recuperare efficientemente gli embedding vettoriali, abilitando capacità di ricerca semantica.
Dimensione Vettoriale: La dimensione degli embedding vettoriali (tipicamente 768-1536 numeri), che influisce sui dettagli e le sfumature catturate nella rappresentazione semantica.
Embedding Vettoriali: Rappresentazioni numeriche (liste di diverse centinaia di numeri) che catturano il significato semantico del testo, consentendo confronti di similarità oltre il semplice abbinamento di parole chiave. Spesso indicati semplicemente come "Embedding" nei contesti tecnici.
Convenzioni dell'intestazione API
Quando si utilizzano le API di Rememberizer, devono essere seguite le seguenti convenzioni per l'intestazione:
Intestazione di autorizzazione:
Authorization: Bearer YOUR_JWT_TOKEN
Intestazione della chiave API:
X-API-Key: YOUR_API_KEY
(in maiuscolo come mostrato)Intestazione Content-Type:
Content-Type: application/json
Risorse Correlate
Per spiegazioni più approfondite sui concetti chiave:
Last updated