意味的類似性によるベクターストアドキュメントの検索
セマンティック類似性とバッチ操作を使用してベクトルストアのドキュメントを検索する
Last updated
セマンティック類似性とバッチ操作を使用してベクトルストアのドキュメントを検索する
Last updated
vector-store-id
string
必須。 検索するベクトルストアのID。
q
文字列
必須。 検索クエリテキスト。
n
整数
返す結果の数。デフォルト: 10。
t
数値
一致の閾値。デフォルト: 0.7。
prev_chunks
整数
一致したチャンクの前に含めるチャンクの数。デフォルト: 0。
next_chunks
整数
一致したチャンクの後に含めるチャンクの数。デフォルト: 0。
このエンドポイントは、x-api-key
ヘッダーを使用して API キーによる認証を必要とします。
400
不正なリクエスト - 必須パラメータが欠落しているか、無効な形式
401
認証エラー - 無効または欠落したAPIキー
404
未検出 - ベクトルストアが見つかりません
500
サーバ内部エラー
prev_chunks
と next_chunks
パラメータを使用して、各一致に含まれるコンテキストの量を制御します:
両方を 0 に設定すると、コンテキストなしの正確な一致になります
両方を 1-2 に設定すると、最小限のコンテキストを持つ一致になります
両方を 3-5 に設定すると、 substantial context を持つ一致になります
t
パラメータは、一致がどのように厳密にフィルタリングされるかを制御します:
高い値(例:0.9)は、非常に近い一致のみを返します
低い値(例:0.5)は、より多様な一致を返します
デフォルト(0.7)は、バランスの取れたアプローチを提供します
高スループットアプリケーション向けに、Rememberizerはベクトルストアに対する効率的なバッチ操作をサポートしています。これらのメソッドは、複数の検索クエリを処理する際のパフォーマンスを最適化します。
ベクトルストア検索のためのバッチ操作を実装する際は、以下のベストプラクティスを考慮してください。
最適なバッチサイズ: ほとんどのアプリケーションでは、5-10のクエリを並行して処理することで、スループットとリソース使用の良いバランスが得られます。
レート制限の認識: バッチ間に遅延メカニズム(通常1-2秒)を含めて、APIのレート制限に達しないようにします。
エラーハンドリング: バッチ内で失敗する可能性のある個々のクエリに対して、堅牢なエラーハンドリングを実装します。
接続管理: 高ボリュームのアプリケーションでは、オーバーヘッドを減らすために接続プーリングを実装します。
タイムアウト設定: 長時間実行されるクエリが全体のバッチをブロックしないように、各リクエストに適切なタイムアウトを設定します。
結果処理: すべての結果を待つのではなく、利用可能になった結果を非同期に処理することを検討してください。
モニタリング: 平均応答時間や成功率などのパフォーマンス指標を追跡して、最適化の機会を特定します。
非常に高いクエリボリュームを持つプロダクションアプリケーションでは、大規模なバッチを効率的に管理するために、ワーカープロセスを持つキューシステムの実装を検討してください。
このエンドポイントを使用すると、意味的類似性を利用してベクトルストアを検索できます。これは、クエリに正確なキーワードが含まれていなくても、概念的に関連する文書を返します。これにより、自然言語クエリや質問応答に特に強力になります。
Initiate a search operation with a query text and receive most semantically similar responses from the vector store.
The ID of the vector store.
The search query text.
Number of chunks to return.
Matching threshold.
Number of chunks before the matched chunk to include.
Number of chunks after the matched chunk to include.
The API key for authentication.
Search results retrieved successfully.