Tìm kiếm tài liệu Lưu Trữ Vector theo sự tương đồng ngữ nghĩa
Tìm kiếm tài liệu Vector Store với sự tương đồng ngữ nghĩa và các thao tác theo lô
Last updated
Tìm kiếm tài liệu Vector Store với sự tương đồng ngữ nghĩa và các thao tác theo lô
Last updated
vector-store-id
chuỗi
Bắt buộc. ID của cửa hàng vector để tìm kiếm.
q
chuỗi
Bắt buộc. Văn bản truy vấn tìm kiếm.
n
số nguyên
Số lượng kết quả trả về. Mặc định: 10.
t
số
Ngưỡng khớp. Mặc định: 0.7.
prev_chunks
số nguyên
Số lượng khối trước khối khớp để bao gồm. Mặc định: 0.
next_chunks
số nguyên
Số lượng khối sau khối khớp để bao gồm. Mặc định: 0.
Điểm cuối này yêu cầu xác thực bằng cách sử dụng khóa API trong tiêu đề x-api-key
.
400
Yêu Cầu Không Hợp Lệ - Thiếu tham số bắt buộc hoặc định dạng không hợp lệ
401
Không Được Phép - Khóa API không hợp lệ hoặc bị thiếu
404
Không Tìm Thấy - Không tìm thấy Vector Store
500
Lỗi Máy Chủ Nội Bộ
Sử dụng các tham số prev_chunks
và next_chunks
để kiểm soát lượng ngữ cảnh được bao gồm với mỗi kết quả:
Đặt cả hai thành 0 để có các kết quả chính xác mà không có ngữ cảnh
Đặt cả hai thành 1-2 để có các kết quả với ngữ cảnh tối thiểu
Đặt cả hai thành 3-5 để có các kết quả với ngữ cảnh đáng kể
Tham số t
điều khiển mức độ nghiêm ngặt của việc lọc các kết quả khớp:
Giá trị cao hơn (ví dụ: 0.9) chỉ trả về các kết quả khớp rất gần
Giá trị thấp hơn (ví dụ: 0.5) trả về nhiều kết quả khớp với sự đa dạng lớn hơn
Mặc định (0.7) cung cấp một cách tiếp cận cân bằng
Đối với các ứng dụng có lưu lượng cao, Rememberizer hỗ trợ các hoạt động theo lô hiệu quả trên các kho vector. Những phương pháp này tối ưu hóa hiệu suất khi xử lý nhiều truy vấn tìm kiếm.
Khi triển khai các thao tác theo lô cho việc tìm kiếm trong kho vector, hãy xem xét những thực tiễn tốt nhất sau:
Kích thước lô tối ưu: Đối với hầu hết các ứng dụng, xử lý 5-10 truy vấn song song cung cấp sự cân bằng tốt giữa thông lượng và mức sử dụng tài nguyên.
Nhận thức về giới hạn tốc độ: Bao gồm các cơ chế trì hoãn giữa các lô (thường là 1-2 giây) để tránh chạm vào giới hạn tốc độ API.
Xử lý lỗi: Triển khai xử lý lỗi mạnh mẽ cho các truy vấn riêng lẻ có thể thất bại trong một lô.
Quản lý kết nối: Đối với các ứng dụng có khối lượng lớn, triển khai kết nối pooling để giảm thiểu chi phí.
Cấu hình thời gian chờ: Đặt thời gian chờ thích hợp cho mỗi yêu cầu để ngăn chặn các truy vấn chạy lâu làm tắc nghẽn toàn bộ lô.
Xử lý kết quả: Xem xét việc xử lý kết quả một cách không đồng bộ khi chúng trở nên khả dụng thay vì chờ đợi tất cả kết quả.
Giám sát: Theo dõi các chỉ số hiệu suất như thời gian phản hồi trung bình và tỷ lệ thành công để xác định cơ hội tối ưu hóa.
Đối với các ứng dụng sản xuất có khối lượng truy vấn rất cao, hãy xem xét việc triển khai một hệ thống hàng đợi với các quy trình làm việc để quản lý các lô lớn một cách hiệu quả.
Điểm cuối này cho phép bạn tìm kiếm kho vector của mình bằng cách sử dụng sự tương đồng ngữ nghĩa. Nó trả về các tài liệu có liên quan về mặt khái niệm đến truy vấn của bạn, ngay cả khi chúng không chứa các từ khóa chính xác. Điều này làm cho nó đặc biệt mạnh mẽ cho các truy vấn ngôn ngữ tự nhiên và trả lời câu hỏi.
Initiate a search operation with a query text and receive most semantically similar responses from the vector store.
The ID of the vector store.
The search query text.
Number of chunks to return.
Matching threshold.
Number of chunks before the matched chunk to include.
Number of chunks after the matched chunk to include.
The API key for authentication.
Search results retrieved successfully.