上傳文件到向量儲存

批次操作將檔案內容上傳至向量儲存

post

Upload files to a vector store.

Path parameters
vector-store-idstringRequired

The ID of the vector store.

Header parameters
x-api-keystringRequired

The API key for authentication.

Body
filesstring · binary[]Optional

The files to upload.

Responses
201

Files uploaded successfully.

application/json
post
/vector-stores/{vector-store-id}/documents/upload
POST /api/v1/vector-stores/{vector-store-id}/documents/upload HTTP/1.1
Host: api.rememberizer.ai
x-api-key: text
Content-Type: multipart/form-data
Accept: */*
Content-Length: 20

{
  "files": [
    "binary"
  ]
}
{
  "documents": [
    {
      "id": 1,
      "name": "text"
    }
  ],
  "errors": [
    {
      "file": "text",
      "error": "text"
    }
  ]
}

範例請求

curl -X POST \
  https://api.rememberizer.ai/api/v1/vector-stores/vs_abc123/documents/upload \
  -H "x-api-key: YOUR_API_KEY" \
  -F "files=@/path/to/document1.pdf" \
  -F "files=@/path/to/document2.docx"

YOUR_API_KEY 替換為您的實際向量儲存 API 金鑰,vs_abc123 替換為您的向量儲存 ID,並提供您本地文件的路徑。

批次上傳最佳實踐

為了在上傳大量文件時優化性能和可靠性:

  1. 管理批次大小:保持批次大小在 5-10 個文件之間以獲得最佳性能。單個請求中的文件過多會增加超時的風險。

  2. 實施速率限制:在批次之間添加延遲(建議 2-3 秒)以避免觸及 API 速率限制。

  3. 添加錯誤重試邏輯:對於生產系統,對失敗的上傳實施重試邏輯,並使用指數退避。

  4. 驗證文件類型:在嘗試上傳之前,預先過濾文件以確保它們是支持的類型。

  5. 監控批次進度:對於面向用戶的應用程序,提供批次操作的進度反饋。

  6. 處理部分成功:API 可能會返回 207 狀態碼以表示部分成功。始終檢查單個文檔的狀態。

  7. 清理資源:確保所有文件句柄在發生錯誤時正確關閉。

  8. 明智地並行化:對於非常大的上傳(數千個文件),考慮針對不同的向量存儲進行多個並發批次處理,然後在需要時合併結果。

  9. 實施校驗和:對於關鍵數據,在上傳前後使用校驗和驗證文件完整性。

  10. 記錄全面結果:保持所有上傳操作的詳細日誌以便故障排除。

通過遵循這些最佳實踐,您可以有效地管理大規模文檔的攝取到您的向量存儲中。

Last updated