용어집
Rememberizer에서 사용되는 용어 및 개념에 대한 포괄적인 용어집
이 용어집은 Rememberizer 문서 전반에 걸쳐 사용되는 주요 용어와 개념에 대한 정의를 제공합니다. 낯선 용어를 접할 때 참고 자료로 사용하세요.
참고: 이 용어집은 Rememberizer의 표준화된 용어를 나타냅니다. 문서에서 약간의 변형을 접할 수 있지만, 여기 제공된 용어와 정의는 공식적인 참고 자료로 간주되어야 합니다.
A
API Key: Rememberizer의 API 엔드포인트에 프로그래밍 방식으로 접근하는 데 사용되는 안전한 인증 토큰입니다. API 키는 주로 벡터 저장소 접근 및 일반 지식 통합에 사용됩니다.
Authorized Request Origin: Rememberizer에 API 요청을 할 수 있는 도메인을 지정하는 보안 설정으로, 잠재적인 교차 사이트 요청 위조 공격을 제한합니다.
B
배치 작업: 효율성을 높이기 위해 단일 요청에서 여러 항목(검색, 업로드 등)을 처리하는 것. Rememberizer는 대량 작업을 위한 배치 작업을 지원합니다.
배치 크기: 마이그레이션, 검색 또는 문서 수집과 같은 작업 중 함께 처리되는 항목의 수로, 성능 및 리소스 사용에 영향을 미칩니다.
C
청킹: 문서를 최적의 크기 조각(일반적으로 512-2048 바이트)으로 나누는 과정으로, 벡터 검색 중 맥락을 보존하기 위해 경계가 겹칩니다.
클라이언트 ID: Rememberizer와의 OAuth2 인증을 가능하게 하는 제3자 애플리케이션에 발급된 공개 식별자입니다.
클라이언트 비밀: 클라이언트 ID와 함께 발급된 개인 키로, 안전하게 보관해야 하며 OAuth2 흐름 중 애플리케이션을 인증하는 데 사용됩니다.
컬렉션 기반 조직: Rememberizer에서 벡터 저장소가 조직되는 방식으로, 각 저장소는 데이터 관리를 위한 고유한 격리된 컬렉션을 가집니다.
공통 지식: 다른 사용자나 애플리케이션이 접근할 수 있는 사용자에 의해 게시된 정보로, 공유 지식 자원을 생성합니다. 공통 지식은 메멘토를 기반으로 하며 API를 통해 접근할 수 있습니다. 사용자 인터페이스에서는 때때로 "공유 지식"이라고도 불립니다.
맥락 창: 검색 결과에서 일치하는 청크와 함께 포함된 주변 콘텐츠로, prev_chunks
및 next_chunks
매개변수에 의해 제어됩니다.
코사인 유사도: 벡터 간의 각도의 코사인을 찾아 계산된 유사도의 척도로, Rememberizer에서 기본 검색 메트릭으로 사용됩니다.
E
임베딩 모델: 텍스트에서 벡터 임베딩을 생성하는 AI 모델. Rememberizer는 OpenAI의 text-embedding-3-large 및 text-embedding-3-small을 포함한 여러 임베딩 모델을 지원합니다.
기업 통합 패턴: 보안, 확장성 및 규정 준수를 위한 아키텍처 설계를 포함하여 대규모 기업 환경에서 Rememberizer를 구현하기 위한 표준화된 접근 방식입니다.
G
글로벌 설정: Rememberizer의 모든 연결된 앱에서 기본 권한 및 동작을 제어하기 위한 시스템 전체 구성입니다.
H
HNSW (계층적 탐색 가능한 작은 세계): 더 높은 메모리 요구 사항의 대가로 대규모 데이터 세트에 대해 더 나은 정확성을 제공하는 인덱싱 알고리즘으로, Rememberizer 벡터 저장소에서 인덱싱 옵션으로 제공됩니다.
I
인덱싱 알고리즘: 효율적인 검색을 위해 벡터를 조직하는 데 사용되는 방법. Rememberizer는 IVFFLAT(기본값) 및 HNSW 알고리즘을 지원합니다.
IVFFLAT: 벡터 데이터베이스에 대해 검색 속도와 정확성의 좋은 균형을 제공하는 인덱싱 알고리즘으로, Rememberizer에서 기본값으로 사용됩니다.
K
데이터 출처: Rememberizer의 데이터의 다양한 출처로, Google Drive, Slack, Dropbox 및 Gmail과 같은 플랫폼과의 통합을 포함합니다. 일부 맥락에서는 "지식 출처" 또는 "통합"이라고도 합니다.
L
LangChain 통합: Rememberizer가 LangChain 애플리케이션에서 검색기로 사용될 수 있도록 하는 기능으로, RAG(검색 증강 생성) 시스템을 지원합니다.
M
Memento: 제3자 애플리케이션과 공유되는 지식을 제어하는 필터링 메커니즘으로, 사용자가 특정 파일, 문서 또는 콘텐츠 그룹을 선택적으로 공유할 수 있도록 합니다. 사용자 인터페이스에서는 "Memento Filter"라고도 불립니다.
Memory Integration: 앱이 나중에 검색할 수 있도록 Rememberizer에 귀중한 정보를 저장할 수 있게 해주는 기능으로, 읽기/쓰기 권한을 구성할 수 있습니다. 일부 맥락에서는 "Shared Memory"라고도 불립니다.
O
OAuth2 인증: 사용자 동의를 통해 서드파티 앱이 Rememberizer 데이터에 접근할 수 있도록 하는 표준 권한 부여 프로토콜로, 안전한 위임 접근을 제공합니다. 문서에서는 때때로 "OAuth"로 줄여서 사용됩니다.
R
RAG (검색 증강 생성): 특정 지식을 기반으로 보다 정확하고 근거 있는 응답을 제공하기 위해 검색 시스템(예: Rememberizer)과 생성 모델을 결합한 기술입니다.
자신 읽기/자신 쓰기: 앱이 Rememberizer에서 자신의 메모리 데이터에만 접근하고 수정할 수 있는 권한 수준입니다.
모두 읽기/자신 쓰기: 앱이 모든 앱의 메모리 데이터를 읽을 수 있지만 자신의 메모리 데이터만 수정할 수 있는 권한 수준입니다.
재색인: Rememberizer 벡터 저장소에서 검색 성능을 개선하기 위해 중요한 변경 후 벡터 인덱스를 재구성하는 과정입니다.
RememberizerRetriever: Rememberizer의 의미 검색 기능과 인터페이스하는 특정 LangChain 검색기 클래스입니다.
Rememberizer GPT: ChatGPT 내에서 개인 지식에 접근할 수 있도록 Rememberizer의 API와 통합된 맞춤형 GPT 애플리케이션입니다.
Rememberizer Vector Store: 청크화, 벡터화 및 텍스트 데이터 저장을 처리하는 pgvector 확장이 포함된 PostgreSQL 기반 벡터 데이터베이스 서비스입니다. "Vector Store"와 "Vector Database"라는 용어는 Rememberizer 문서에서 서로 바꿔 사용되며, "Vector Store"가 선호되는 용어입니다.
S
Search Metric: 벡터 간의 유사성을 계산하는 데 사용되는 수학적 방법. Rememberizer는 코사인 유사성(기본값), 내적, L2(유클리드) 거리를 지원합니다. "거리", "유사성", "매칭"이라는 용어는 때때로 벡터가 서로 얼마나 밀접하게 관련되어 있는지를 나타내기 위해 서로 바꿔 사용됩니다.
Semantic Search: 의미에 따라 콘텐츠를 찾는 검색 기능으로, 용어가 다르더라도 개념적으로 관련된 결과를 허용합니다.
Shared Memory: 타사 앱이 사용자의 Rememberizer 계정에 데이터를 저장하고 액세스할 수 있도록 하는 시스템으로, 여러 애플리케이션 간의 지속성을 제공합니다.
V
벡터 데이터베이스: 벡터 임베딩을 효율적으로 저장하고 검색하도록 최적화된 전문 데이터베이스로, 의미 기반 검색 기능을 가능하게 합니다.
벡터 차원: 벡터 임베딩의 크기(일반적으로 768-1536 숫자)로, 의미 표현에서 포착되는 세부 사항과 뉘앙스에 영향을 미칩니다.
벡터 임베딩: 텍스트의 의미를 포착하는 수치적 표현(수백 개의 숫자 목록)으로, 키워드 일치를 넘어 유사성 비교를 가능하게 합니다. 기술적 맥락에서는 종종 "임베딩"이라고 간단히 언급됩니다.
API 헤더 규칙
Rememberizer API를 사용할 때는 다음 헤더 규칙을 따라야 합니다:
인증 헤더:
Authorization: Bearer YOUR_JWT_TOKEN
API 키 헤더:
X-API-Key: YOUR_API_KEY
(표시된 대로 대문자 사용)콘텐츠 유형 헤더:
Content-Type: application/json
관련 자료
주요 개념에 대한 더 깊이 있는 설명:
Last updated