의미적 유사성으로 문서 검색

배치 처리 기능이 있는 의미 검색 엔드포인트

예제 요청

curl -X GET \
  "https://api.rememberizer.ai/api/v1/documents/search/?q=How%20to%20integrate%20Rememberizer%20with%20custom%20applications&n=5&from=2023-01-01T00:00:00Z&to=2023-12-31T23:59:59Z" \
  -H "Authorization: Bearer YOUR_JWT_TOKEN"

YOUR_JWT_TOKEN을 실제 JWT 토큰으로 교체하세요.

쿼리 매개변수

매개변수
유형
설명

q

문자열

필수. 검색 쿼리 텍스트(최대 400단어).

n

정수

반환할 결과 수. 기본값: 3. 더 포괄적인 결과를 위해 더 높은 값(예: 10)을 사용하세요.

from

문자열

검색할 문서의 시간 범위 시작, ISO 8601 형식.

to

문자열

검색할 문서의 시간 범위 종료, ISO 8601 형식.

prev_chunks

정수

문맥을 포함할 이전 청크 수. 기본값: 2.

next_chunks

정수

문맥을 포함할 다음 청크 수. 기본값: 2.

응답 형식

검색 최적화 팁

질문 답변을 위한

질문에 대한 답을 찾을 때, 쿼리를 이상적인 답변처럼 구성해 보세요. 예를 들어:

대신: "벡터 임베딩이란 무엇인가?" 시도해 보세요: "벡터 임베딩은 텍스트를 고차원 공간의 숫자 벡터로 변환하는 기술입니다."

벡터 임베딩이 어떻게 작동하는지와 이 검색 접근 방식이 효과적인 이유에 대한 더 깊은 이해를 원하시면 벡터 임베딩과 벡터 데이터베이스란 무엇인가?를 참조하세요.

결과 수 조정

  • 빠르고 높은 관련성의 결과를 위해 n=3으로 시작

  • 더 포괄적인 정보를 위해 n=10 이상으로 증가

  • 검색 결과가 불충분하면 n 매개변수를 증가시켜 보세요

시간 기반 필터링

fromto 매개변수를 사용하여 특정 기간의 문서에 집중하세요:

  • 최근 문서: from을 최근 날짜로 설정

  • 역사적 분석: 특정 날짜 범위를 지정

  • 오래된 정보 제외: 적절한 to 날짜 설정

배치 작업

대량의 검색 쿼리를 효율적으로 처리하기 위해 Rememberizer는 성능을 최적화하고 API 호출 오버헤드를 줄이기 위한 배치 작업을 지원합니다.

배치 검색

성능 고려사항

배치 작업을 구현할 때 다음의 모범 사례를 고려하십시오:

  1. 최적의 배치 크기: 5-10 쿼리의 배치 크기로 시작하고 애플리케이션의 성능 특성에 따라 조정하십시오.

  2. 요금 제한: API 제한을 방지하기 위해 배치 간에 지연을 포함하십시오. 배치 간 1초가 좋은 시작점입니다.

  3. 오류 처리: 배치 내에서 실패한 요청을 관리하기 위해 강력한 오류 처리를 구현하십시오.

  4. 자원 관리: 특히 큰 배치 크기로 클라이언트 측 자원 사용을 모니터링하여 과도한 메모리 소비를 방지하십시오.

  5. 응답 처리: 가능한 경우 비동기적으로 배치 결과를 처리하여 사용자 경험을 개선하십시오.

대량의 애플리케이션의 경우, 많은 검색 요청을 효율적으로 관리하기 위해 큐 시스템을 구현하는 것을 고려하십시오.

이 엔드포인트는 전체 지식 기반에 걸쳐 강력한 의미 검색 기능을 제공합니다. 이는 의미에 따라 콘텐츠를 찾기 위해 벡터 임베딩을 사용하며, 정확한 키워드 일치가 아닙니다.

Last updated