上傳文件到向量儲存

批次操作將檔案內容上傳至向量儲存

範例請求

curl -X POST \
  https://api.rememberizer.ai/api/v1/vector-stores/vs_abc123/documents/upload \
  -H "x-api-key: YOUR_API_KEY" \
  -F "files=@/path/to/document1.pdf" \
  -F "files=@/path/to/document2.docx"

YOUR_API_KEY 替換為您的實際向量儲存 API 金鑰,vs_abc123 替換為您的向量儲存 ID,並提供您本地文件的路徑。

批次上傳最佳實踐

為了在上傳大量文件時優化性能和可靠性:

  1. 管理批次大小:保持批次大小在 5-10 個文件之間以獲得最佳性能。單個請求中的文件過多會增加超時的風險。

  2. 實施速率限制:在批次之間添加延遲(建議 2-3 秒)以避免觸及 API 速率限制。

  3. 添加錯誤重試邏輯:對於生產系統,對失敗的上傳實施重試邏輯,並使用指數退避。

  4. 驗證文件類型:在嘗試上傳之前,預先過濾文件以確保它們是支持的類型。

  5. 監控批次進度:對於面向用戶的應用程序,提供批次操作的進度反饋。

  6. 處理部分成功:API 可能會返回 207 狀態碼以表示部分成功。始終檢查單個文檔的狀態。

  7. 清理資源:確保所有文件句柄在發生錯誤時正確關閉。

  8. 明智地並行化:對於非常大的上傳(數千個文件),考慮針對不同的向量存儲進行多個並發批次處理,然後在需要時合併結果。

  9. 實施校驗和:對於關鍵數據,在上傳前後使用校驗和驗證文件完整性。

  10. 記錄全面結果:保持所有上傳操作的詳細日誌以便故障排除。

通過遵循這些最佳實踐,您可以有效地管理大規模文檔的攝取到您的向量存儲中。

Last updated