의미적 유사성으로 문서 검색
배치 처리 기능이 있는 의미 검색 엔드포인트
예제 요청
curl -X GET \
"https://api.rememberizer.ai/api/v1/documents/search/?q=How%20to%20integrate%20Rememberizer%20with%20custom%20applications&n=5&from=2023-01-01T00:00:00Z&to=2023-12-31T23:59:59Z" \
-H "Authorization: Bearer YOUR_JWT_TOKEN"const searchDocuments = async (query, numResults = 5, from = null, to = null) => {
const url = new URL('https://api.rememberizer.ai/api/v1/documents/search/');
url.searchParams.append('q', query);
url.searchParams.append('n', numResults);
if (from) {
url.searchParams.append('from', from);
}
if (to) {
url.searchParams.append('to', to);
}
const response = await fetch(url.toString(), {
method: 'GET',
headers: {
'Authorization': 'Bearer YOUR_JWT_TOKEN'
}
});
const data = await response.json();
console.log(data);
};
searchDocuments('How to integrate Rememberizer with custom applications', 5);쿼리 매개변수
q
문자열
필수. 검색 쿼리 텍스트(최대 400단어).
n
정수
반환할 결과 수. 기본값: 3. 더 포괄적인 결과를 위해 더 높은 값(예: 10)을 사용하세요.
from
문자열
검색할 문서의 시간 범위 시작, ISO 8601 형식.
to
문자열
검색할 문서의 시간 범위 종료, ISO 8601 형식.
prev_chunks
정수
문맥을 포함할 이전 청크 수. 기본값: 2.
next_chunks
정수
문맥을 포함할 다음 청크 수. 기본값: 2.
응답 형식
검색 최적화 팁
질문 답변을 위한
질문에 대한 답을 찾을 때, 쿼리를 이상적인 답변처럼 구성해 보세요. 예를 들어:
대신: "벡터 임베딩이란 무엇인가?" 시도해 보세요: "벡터 임베딩은 텍스트를 고차원 공간의 숫자 벡터로 변환하는 기술입니다."
결과 수 조정
빠르고 높은 관련성의 결과를 위해
n=3으로 시작더 포괄적인 정보를 위해
n=10이상으로 증가검색 결과가 불충분하면
n매개변수를 증가시켜 보세요
시간 기반 필터링
from 및 to 매개변수를 사용하여 특정 기간의 문서에 집중하세요:
최근 문서:
from을 최근 날짜로 설정역사적 분석: 특정 날짜 범위를 지정
오래된 정보 제외: 적절한
to날짜 설정
배치 작업
대량의 검색 쿼리를 효율적으로 처리하기 위해 Rememberizer는 성능을 최적화하고 API 호출 오버헤드를 줄이기 위한 배치 작업을 지원합니다.
배치 검색
성능 고려사항
배치 작업을 구현할 때 다음의 모범 사례를 고려하십시오:
최적의 배치 크기: 5-10 쿼리의 배치 크기로 시작하고 애플리케이션의 성능 특성에 따라 조정하십시오.
요금 제한: API 제한을 방지하기 위해 배치 간에 지연을 포함하십시오. 배치 간 1초가 좋은 시작점입니다.
오류 처리: 배치 내에서 실패한 요청을 관리하기 위해 강력한 오류 처리를 구현하십시오.
자원 관리: 특히 큰 배치 크기로 클라이언트 측 자원 사용을 모니터링하여 과도한 메모리 소비를 방지하십시오.
응답 처리: 가능한 경우 비동기적으로 배치 결과를 처리하여 사용자 경험을 개선하십시오.
대량의 애플리케이션의 경우, 많은 검색 요청을 효율적으로 관리하기 위해 큐 시스템을 구현하는 것을 고려하십시오.
이 엔드포인트는 전체 지식 기반에 걸쳐 강력한 의미 검색 기능을 제공합니다. 이는 의미에 따라 콘텐츠를 찾기 위해 벡터 임베딩을 사용하며, 정확한 키워드 일치가 아닙니다.
Last updated