意味的類似性による文書の検索
バッチ処理機能を備えたセマンティック検索エンドポイント
例リクエスト
curl -X GET \
"https://api.rememberizer.ai/api/v1/documents/search/?q=Rememberizer%20を%20カスタム%20アプリケーションと%20統合する%20方法&n=5&from=2023-01-01T00:00:00Z&to=2023-12-31T23:59:59Z" \
-H "Authorization: Bearer YOUR_JWT_TOKEN"const searchDocuments = async (query, numResults = 5, from = null, to = null) => {
const url = new URL('https://api.rememberizer.ai/api/v1/documents/search/');
url.searchParams.append('q', query);
url.searchParams.append('n', numResults);
if (from) {
url.searchParams.append('from', from);
}
if (to) {
url.searchParams.append('to', to);
}
const response = await fetch(url.toString(), {
method: 'GET',
headers: {
'Authorization': 'Bearer YOUR_JWT_TOKEN'
}
});
const data = await response.json();
console.log(data);
};
searchDocuments('Rememberizerをカスタムアプリケーションと統合する方法', 5);クエリパラメータ
q
文字列
必須。 検索クエリテキスト(最大400語)。
n
整数
返す結果の数。デフォルト: 3。より包括的な結果を得るために高い値(例: 10)を使用します。
from
文字列
検索対象の文書の時間範囲の開始、ISO 8601形式。
to
文字列
検索対象の文書の時間範囲の終了、ISO 8601形式。
prev_chunks
整数
コンテキストのために含める前のチャンクの数。デフォルト: 2。
next_chunks
整数
コンテキストのために含める後のチャンクの数。デフォルト: 2。
レスポンスフォーマット
検索最適化のヒント
質問応答のために
質問への答えを探すときは、理想的な答えのようにクエリを構成してみてください。例えば:
代わりに: "ベクトル埋め込みとは何ですか?" 試してみてください: "ベクトル埋め込みは、テキストを高次元空間の数値ベクトルに変換する技術です。"
結果数の調整
高い関連性のある結果を迅速に得るために
n=3から始めるより包括的な情報を得るために
n=10以上に増やす検索結果が不十分な場合は、
nパラメータを増やしてみる
時間ベースのフィルタリング
from および to パラメータを使用して、特定の期間の文書に焦点を当てます:
最近の文書:
fromを最近の日付に設定歴史的分析:特定の日付範囲を指定
古い情報を除外:適切な
to日付を設定
バッチ操作
大量の検索クエリを効率的に処理するために、Rememberizerはパフォーマンスを最適化し、APIコールのオーバーヘッドを削減するためのバッチ操作をサポートしています。
バッチ検索
パフォーマンスの考慮事項
バッチ操作を実装する際は、以下のベストプラクティスを考慮してください。
最適なバッチサイズ: 5-10 クエリのバッチサイズから始め、アプリケーションのパフォーマンス特性に基づいて調整します。
レート制限: API のスロットリングを防ぐために、バッチ間に遅延を含めます。バッチ間に 1 秒の遅延を設けるのが良い出発点です。
エラーハンドリング: バッチ内の失敗したリクエストを管理するために、堅牢なエラーハンドリングを実装します。
リソース管理: 特に大きなバッチサイズの場合、クライアント側のリソース使用状況を監視し、過剰なメモリ消費を防ぎます。
レスポンス処理: 可能な限り非同期でバッチ結果を処理し、ユーザーエクスペリエンスを向上させます。
高ボリュームのアプリケーションでは、大量の検索リクエストを効率的に管理するためにキューシステムの実装を検討してください。
このエンドポイントは、あなたの知識ベース全体にわたる強力なセマンティック検索機能を提供します。意味に基づいてコンテンツを見つけるためにベクトル埋め込みを使用し、正確なキーワード一致ではなく意味に基づいています。
Last updated