Tìm kiếm tài liệu theo sự tương đồng ngữ nghĩa
Điểm cuối tìm kiếm ngữ nghĩa với khả năng xử lý theo lô
Last updated
Điểm cuối tìm kiếm ngữ nghĩa với khả năng xử lý theo lô
Last updated
q
chuỗi
Bắt buộc. Văn bản truy vấn tìm kiếm (tối đa 400 từ).
n
số nguyên
Số lượng kết quả trả về. Mặc định: 3. Sử dụng giá trị cao hơn (ví dụ: 10) để có kết quả toàn diện hơn.
from
chuỗi
Bắt đầu khoảng thời gian cho các tài liệu được tìm kiếm, theo định dạng ISO 8601.
to
chuỗi
Kết thúc khoảng thời gian cho các tài liệu được tìm kiếm, theo định dạng ISO 8601.
prev_chunks
số nguyên
Số lượng đoạn trước đó để bao gồm cho ngữ cảnh. Mặc định: 2.
next_chunks
số nguyên
Số lượng đoạn tiếp theo để bao gồm cho ngữ cảnh. Mặc định: 2.
Khi tìm kiếm câu trả lời cho một câu hỏi, hãy cố gắng diễn đạt truy vấn của bạn như thể đó là một câu trả lời lý tưởng. Ví dụ:
Thay vì: "Vector embedding là gì?" Hãy thử: "Vector embedding là một kỹ thuật chuyển đổi văn bản thành các vector số trong một không gian nhiều chiều."
Bắt đầu với n=3
để có kết quả nhanh, có độ liên quan cao
Tăng lên n=10
hoặc cao hơn để có thông tin toàn diện hơn
Nếu tìm kiếm trả về thông tin không đủ, hãy thử tăng tham số n
Sử dụng các tham số from
và to
để tập trung vào các tài liệu từ các khoảng thời gian cụ thể:
Tài liệu gần đây: Đặt from
thành một ngày gần đây
Phân tích lịch sử: Xác định một khoảng thời gian cụ thể
Loại trừ thông tin lỗi thời: Đặt một ngày to
phù hợp
Để xử lý hiệu quả một khối lượng lớn các truy vấn tìm kiếm, Rememberizer hỗ trợ các hoạt động theo lô nhằm tối ưu hóa hiệu suất và giảm thiểu chi phí gọi API.
Khi triển khai các thao tác theo lô, hãy xem xét những thực tiễn tốt nhất sau:
Kích thước Lô Tối Ưu: Bắt đầu với kích thước lô từ 5-10 truy vấn và điều chỉnh dựa trên đặc điểm hiệu suất của ứng dụng của bạn.
Giới Hạn Tốc Độ: Bao gồm các khoảng thời gian giữa các lô để ngăn chặn việc giới hạn API. Một điểm khởi đầu tốt là 1 giây giữa các lô.
Xử Lý Lỗi: Triển khai xử lý lỗi mạnh mẽ để quản lý các yêu cầu không thành công trong các lô.
Quản Lý Tài Nguyên: Giám sát việc sử dụng tài nguyên phía khách, đặc biệt với kích thước lô lớn, để ngăn chặn việc tiêu thụ bộ nhớ quá mức.
Xử Lý Phản Hồi: Xử lý kết quả lô một cách không đồng bộ khi có thể để cải thiện trải nghiệm người dùng.
Đối với các ứng dụng có khối lượng lớn, hãy xem xét triển khai một hệ thống hàng đợi để quản lý hiệu quả số lượng lớn các yêu cầu tìm kiếm.
Điểm cuối này cung cấp khả năng tìm kiếm ngữ nghĩa mạnh mẽ trên toàn bộ cơ sở tri thức của bạn. Nó sử dụng các nhúng vector để tìm nội dung dựa trên ý nghĩa thay vì các khớp từ khóa chính xác.
Để hiểu sâu hơn về cách hoạt động của vector embeddings và tại sao phương pháp tìm kiếm này hiệu quả, hãy xem
Initiate a search operation with a query text of up to 400 words and receive the most semantically similar responses from the stored knowledge. For question-answering, convert your question into an ideal answer and submit it to receive similar real answers.
Up to 400 words sentence for which you wish to find semantically similar chunks of knowledge.
Number of semantically similar chunks of text to return. Use 'n=3' for up to 5, and 'n=10' for more information. If you do not receive enough information, consider trying again with a larger 'n' value.
Start of the time range for documents to be searched, in ISO 8601 format.
End of the time range for documents to be searched, in ISO 8601 format.