# 용어집

이 용어집은 Rememberizer 문서 전반에 걸쳐 사용되는 주요 용어와 개념에 대한 정의를 제공합니다. 낯선 용어를 접할 때 참고 자료로 사용하세요.

> **참고**: 이 용어집은 Rememberizer의 표준화된 용어를 나타냅니다. 문서에서 약간의 변형을 접할 수 있지만, 여기 제공된 용어와 정의는 공식적인 참고 자료로 간주되어야 합니다.

## A

**API Key**: Rememberizer의 API 엔드포인트에 프로그래밍 방식으로 접근하는 데 사용되는 안전한 인증 토큰입니다. API 키는 주로 벡터 저장소 접근 및 일반 지식 통합에 사용됩니다.

**Authorized Request Origin**: Rememberizer에 API 요청을 할 수 있는 도메인을 지정하는 보안 설정으로, 잠재적인 교차 사이트 요청 위조 공격을 제한합니다.

## B

**배치 작업**: 효율성을 높이기 위해 단일 요청에서 여러 항목(검색, 업로드 등)을 처리하는 것. Rememberizer는 대량 작업을 위한 배치 작업을 지원합니다.

**배치 크기**: 마이그레이션, 검색 또는 문서 수집과 같은 작업 중 함께 처리되는 항목의 수로, 성능 및 리소스 사용에 영향을 미칩니다.

## C

**청킹**: 문서를 최적의 크기 조각(일반적으로 512-2048 바이트)으로 나누는 과정으로, 벡터 검색 중 맥락을 보존하기 위해 경계가 겹칩니다.

**클라이언트 ID**: Rememberizer와의 OAuth2 인증을 가능하게 하는 제3자 애플리케이션에 발급된 공개 식별자입니다.

**클라이언트 비밀**: 클라이언트 ID와 함께 발급된 개인 키로, 안전하게 보관해야 하며 OAuth2 흐름 중 애플리케이션을 인증하는 데 사용됩니다.

**컬렉션 기반 조직**: Rememberizer에서 벡터 저장소가 조직되는 방식으로, 각 저장소는 데이터 관리를 위한 고유한 격리된 컬렉션을 가집니다.

**공통 지식**: 다른 사용자나 애플리케이션이 접근할 수 있는 사용자에 의해 게시된 정보로, 공유 지식 자원을 생성합니다. 공통 지식은 메멘토를 기반으로 하며 API를 통해 접근할 수 있습니다. 사용자 인터페이스에서는 때때로 "공유 지식"이라고도 불립니다.

**맥락 창**: 검색 결과에서 일치하는 청크와 함께 포함된 주변 콘텐츠로, `prev_chunks` 및 `next_chunks` 매개변수에 의해 제어됩니다.

**코사인 유사도**: 벡터 간의 각도의 코사인을 찾아 계산된 유사도의 척도로, Rememberizer에서 기본 검색 메트릭으로 사용됩니다.

## E

**임베딩 모델**: 텍스트에서 벡터 임베딩을 생성하는 AI 모델. Rememberizer는 OpenAI의 text-embedding-3-large 및 text-embedding-3-small을 포함한 여러 임베딩 모델을 지원합니다.

**기업 통합 패턴**: 보안, 확장성 및 규정 준수를 위한 아키텍처 설계를 포함하여 대규모 기업 환경에서 Rememberizer를 구현하기 위한 표준화된 접근 방식입니다.

## G

**글로벌 설정**: Rememberizer의 모든 연결된 앱에서 기본 권한 및 동작을 제어하기 위한 시스템 전체 구성입니다.

## H

**HNSW (계층적 탐색 가능한 작은 세계)**: 더 높은 메모리 요구 사항의 대가로 대규모 데이터 세트에 대해 더 나은 정확성을 제공하는 인덱싱 알고리즘으로, Rememberizer 벡터 저장소에서 인덱싱 옵션으로 제공됩니다.

## I

**인덱싱 알고리즘**: 효율적인 검색을 위해 벡터를 조직하는 데 사용되는 방법. Rememberizer는 IVFFLAT(기본값) 및 HNSW 알고리즘을 지원합니다.

**IVFFLAT**: 벡터 데이터베이스에 대해 검색 속도와 정확성의 좋은 균형을 제공하는 인덱싱 알고리즘으로, Rememberizer에서 기본값으로 사용됩니다.

## K

**데이터 출처**: Rememberizer의 데이터의 다양한 출처로, Google Drive, Slack, Dropbox 및 Gmail과 같은 플랫폼과의 통합을 포함합니다. 일부 맥락에서는 "지식 출처" 또는 "통합"이라고도 합니다.

## L

**LangChain 통합**: Rememberizer가 LangChain 애플리케이션에서 검색기로 사용될 수 있도록 하는 기능으로, RAG(검색 증강 생성) 시스템을 지원합니다.

## M

**Memento**: 제3자 애플리케이션과 공유되는 지식을 제어하는 필터링 메커니즘으로, 사용자가 특정 파일, 문서 또는 콘텐츠 그룹을 선택적으로 공유할 수 있도록 합니다. 사용자 인터페이스에서는 "Memento Filter"라고도 불립니다.

**Memory Integration**: 앱이 나중에 검색할 수 있도록 Rememberizer에 귀중한 정보를 저장할 수 있게 해주는 기능으로, 읽기/쓰기 권한을 구성할 수 있습니다. 일부 맥락에서는 "Shared Memory"라고도 불립니다.

## O

**OAuth2 인증**: 사용자 동의를 통해 서드파티 앱이 Rememberizer 데이터에 접근할 수 있도록 하는 표준 권한 부여 프로토콜로, 안전한 위임 접근을 제공합니다. 문서에서는 때때로 "OAuth"로 줄여서 사용됩니다.

## R

**RAG (검색 증강 생성)**: 특정 지식을 기반으로 보다 정확하고 근거 있는 응답을 제공하기 위해 검색 시스템(예: Rememberizer)과 생성 모델을 결합한 기술입니다.

**자신 읽기/자신 쓰기**: 앱이 Rememberizer에서 자신의 메모리 데이터에만 접근하고 수정할 수 있는 권한 수준입니다.

**모두 읽기/자신 쓰기**: 앱이 모든 앱의 메모리 데이터를 읽을 수 있지만 자신의 메모리 데이터만 수정할 수 있는 권한 수준입니다.

**재색인**: Rememberizer 벡터 저장소에서 검색 성능을 개선하기 위해 중요한 변경 후 벡터 인덱스를 재구성하는 과정입니다.

**RememberizerRetriever**: Rememberizer의 의미 검색 기능과 인터페이스하는 특정 LangChain 검색기 클래스입니다.

**Rememberizer GPT**: ChatGPT 내에서 개인 지식에 접근할 수 있도록 Rememberizer의 API와 통합된 맞춤형 GPT 애플리케이션입니다.

**Rememberizer Vector Store**: 청크화, 벡터화 및 텍스트 데이터 저장을 처리하는 pgvector 확장이 포함된 PostgreSQL 기반 벡터 데이터베이스 서비스입니다. "Vector Store"와 "Vector Database"라는 용어는 Rememberizer 문서에서 서로 바꿔 사용되며, "Vector Store"가 선호되는 용어입니다.

## S

**Search Metric**: 벡터 간의 유사성을 계산하는 데 사용되는 수학적 방법. Rememberizer는 코사인 유사성(기본값), 내적, L2(유클리드) 거리를 지원합니다. "거리", "유사성", "매칭"이라는 용어는 때때로 벡터가 서로 얼마나 밀접하게 관련되어 있는지를 나타내기 위해 서로 바꿔 사용됩니다.

**Semantic Search**: 의미에 따라 콘텐츠를 찾는 검색 기능으로, 용어가 다르더라도 개념적으로 관련된 결과를 허용합니다.

**Shared Memory**: 타사 앱이 사용자의 Rememberizer 계정에 데이터를 저장하고 액세스할 수 있도록 하는 시스템으로, 여러 애플리케이션 간의 지속성을 제공합니다.

## V

**벡터 데이터베이스**: 벡터 임베딩을 효율적으로 저장하고 검색하도록 최적화된 전문 데이터베이스로, 의미 기반 검색 기능을 가능하게 합니다.

**벡터 차원**: 벡터 임베딩의 크기(일반적으로 768-1536 숫자)로, 의미 표현에서 포착되는 세부 사항과 뉘앙스에 영향을 미칩니다.

**벡터 임베딩**: 텍스트의 의미를 포착하는 수치적 표현(수백 개의 숫자 목록)으로, 키워드 일치를 넘어 유사성 비교를 가능하게 합니다. 기술적 맥락에서는 종종 "임베딩"이라고 간단히 언급됩니다.

## API 헤더 규칙

Rememberizer API를 사용할 때는 다음 헤더 규칙을 따라야 합니다:

* **인증 헤더**: `Authorization: Bearer YOUR_JWT_TOKEN`
* **API 키 헤더**: `X-API-Key: YOUR_API_KEY` (표시된 대로 대문자 사용)
* **콘텐츠 유형 헤더**: `Content-Type: application/json`

## 관련 자료

주요 개념에 대한 더 깊이 있는 설명:

* [벡터 임베딩과 벡터 데이터베이스란?](https://docs.rememberizer.ai/ko/background/what-are-vector-embeddings-and-vector-databases) - Rememberizer 뒤에 있는 기술에 대한 자세한 설명
* [벡터 저장소](https://docs.rememberizer.ai/ko/undefined-1/integration-options/vector-stores) - Rememberizer의 벡터 데이터베이스에 대한 기술적 구현 세부사항
* [메멘토 필터 접근](https://docs.rememberizer.ai/ko/undefined/personal/mementos-filter-access) - 지식에 대한 접근 제어 방법
