用語集

Rememberizerで使用される用語と概念の包括的な用語集

この用語集は、Rememberizer ドキュメント全体で使用される重要な用語と概念の定義を提供します。見慣れない用語に出会ったときの参考にしてください。

注意: この用語集は Rememberizer の標準化された用語を表しています。ドキュメント内で若干のバリエーションに出会うことがあるかもしれませんが、ここに提供されている用語と定義は正式な参照と見なされるべきです。

A

APIキー: RememberizerのAPIエンドポイントにプログラム的にアクセスするために使用される安全な認証トークン。APIキーは主にベクターストアへのアクセスと一般的な知識統合に使用されます。

認可されたリクエスト元: RememberizerにAPIリクエストを行うことができるドメインを指定するセキュリティ設定であり、潜在的なクロスサイトリクエストフォージェリ攻撃を制限します。

B

バッチ操作: 効率を向上させるために、単一のリクエストで複数のアイテム(検索、アップロードなど)を処理すること。Rememberizerは高ボリュームのワークロードに対してバッチ操作をサポートしています。

バッチサイズ: 移行、検索、またはドキュメントの取り込みなどの操作中に一緒に処理されるアイテムの数で、パフォーマンスやリソースの使用に影響を与えます。

C

チャンク化: 文書を最適なサイズの部分(通常は512〜2048バイト)に分割し、ベクトル検索中にコンテキストを保持するために重複する境界を持つプロセス。

クライアントID: RememberizerとのOAuth2認証を可能にするために、サードパーティアプリケーションに発行される公開識別子。

クライアントシークレット: クライアントIDと共に発行される秘密鍵で、安全に保持する必要があり、OAuth2フロー中にアプリケーションを認証するために使用される。

コレクションベースの組織: Rememberizerにおけるベクトルストアの整理方法で、各ストアがデータ管理のために独自の孤立したコレクションを持つ。

共通知識: 他のユーザーやアプリケーションがアクセスできるユーザーによって公開された情報で、共有知識リソースを作成する。共通知識はメメントに基づいており、APIを介してアクセス可能。ユーザーインターフェースでは「共有知識」と呼ばれることもある。

コンテキストウィンドウ: 検索結果において一致したチャンクと共に含まれる周囲のコンテンツで、prev_chunksおよびnext_chunksパラメータによって制御される。

コサイン類似度: ベクトル間の角度のコサインを求めることによって計算されるベクトル間の類似度の尺度で、Rememberizerのデフォルトの検索メトリックとして使用される。

E

埋め込みモデル: テキストからベクトル埋め込みを生成するAIモデル。Rememberizerは、OpenAIのtext-embedding-3-largeおよびtext-embedding-3-smallを含むいくつかの埋め込みモデルをサポートしています。

エンタープライズ統合パターン: セキュリティ、スケーリング、およびコンプライアンスのためのアーキテクチャ設計を含む、大規模エンタープライズ環境でRememberizerを実装するための標準化されたアプローチ。

G

グローバル設定: Rememberizer内のすべての接続されたアプリでデフォルトの権限と動作を制御するためのシステム全体の設定。

H

HNSW (階層的ナビゲーション可能なスモールワールド): 大規模データセットに対してより高い精度を提供するインデックス作成アルゴリズムで、より高いメモリ要件のコストがかかります。Rememberizer Vector Storesのインデックス作成オプションとして利用可能です。

I

インデクシングアルゴリズム: 効率的な検索のためにベクトルを整理するために使用される方法。RememberizerはIVFFLAT(デフォルト)およびHNSWアルゴリズムをサポートしています。

IVFFLAT: ベクトルデータベースにおいて検索速度と精度の良いバランスを提供するインデクシングアルゴリズムで、Rememberizerではデフォルトとして使用されています。

K

データソース: Rememberizerにおけるデータのさまざまな起源であり、Google Drive、Slack、Dropbox、Gmailなどのプラットフォームとの統合を含みます。一部の文脈では「知識ソース」または「統合」とも呼ばれます。

L

LangChain統合: RememberizerをLangChainアプリケーションでリトリーバーとして使用できる機能で、RAG(Retrieval Augmented Generation)システムをサポートしています。

M

Memento: 第三者アプリケーションと共有される知識を制御するフィルタリングメカニズムで、ユーザーが特定のファイル、文書、またはコンテンツグループを選択的に共有できるようにします。ユーザーインターフェースでは「Memento Filter」と呼ばれることもあります。

Memory Integration: アプリがRememberizerに貴重な情報を保存し、後で取得できるようにする機能で、読み取り/書き込みの権限を設定可能です。一部の文脈では「Shared Memory」と呼ばれることもあります。

O

OAuth2 認証: ユーザーの同意を得て、サードパーティアプリが Rememberizer データにアクセスするために使用される標準の認可プロトコルで、安全な委任アクセスを提供します。ドキュメントでは時々「OAuth」と省略されます。

R

RAG (リトリーバル拡張生成): 特定の知識に基づいて、より正確で根拠のある応答を提供するために、リトリーバルシステム(Rememberizerのような)と生成モデルを組み合わせた技術。

自分の読み取り/自分の書き込み: アプリがRememberizer内の自分のメモリデータにのみアクセスし、変更できる権限レベル。

すべての読み取り/自分の書き込み: アプリがすべてのアプリからメモリデータを読み取ることができるが、自分のメモリデータのみを変更できる権限レベル。

再インデックス作成: Rememberizer Vector Storesにおける検索パフォーマンスを向上させるために、重要な変更後にベクトルインデックスを再構築するプロセス。

RememberizerRetriever: Rememberizerのセマンティック検索機能とインターフェースを持つ特定のLangChainリトリーバークラス。

Rememberizer GPT: ChatGPT内で個人の知識にアクセスするために、RememberizerのAPIと統合されたカスタムGPTアプリケーション。

Rememberizer Vector Store: チャンク化、ベクトル化、テキストデータの保存を処理するpgvector拡張を持つPostgreSQLベースのベクトルデータベースサービス。 "Vector Store"と"Vector Database"という用語はRememberizerの文書内で互換的に使用されており、"Vector Store"が好まれる用語です。

S

Search Metric: ベクトル間の類似性を計算するために使用される数学的手法。Rememberizerはコサイン類似度(デフォルト)、内積、およびL2(ユークリッド)距離をサポートしています。「距離」、「類似性」、および「マッチング」という用語は、ベクトルがどれだけ互いに関連しているかを指すために時折互換的に使用されます。

Semantic Search: 意味に基づいてコンテンツを見つける検索機能であり、用語が異なっていても概念的に関連する結果を可能にします。

Shared Memory: 第三者のアプリがユーザーのRememberizerアカウントにデータを保存しアクセスできるシステムであり、複数のアプリケーション間での永続性を提供します。

V

ベクトルデータベース: ベクトル埋め込みを効率的に保存および取得するために最適化された専門のデータベースで、セマンティック検索機能を可能にします。

ベクトル次元: ベクトル埋め込みのサイズ(通常は768-1536の数値)で、セマンティック表現において捉えられる詳細やニュアンスに影響を与えます。

ベクトル埋め込み: テキストのセマンティックな意味を捉える数値表現(数百の数値のリスト)で、キーワードマッチングを超えた類似性の比較を可能にします。技術的な文脈では「埋め込み」と単に呼ばれることが多いです。

API ヘッダーの規約

Rememberizer API を使用する際は、以下のヘッダーの規約に従う必要があります:

  • 認証ヘッダー: Authorization: Bearer YOUR_JWT_TOKEN

  • API キーヘッダー: X-API-Key: YOUR_API_KEY(表示の通り大文字)

  • コンテンツタイプヘッダー: Content-Type: application/json

関連リソース

主要な概念についての詳細な説明:

Last updated