의미적 유사성으로 벡터 저장소 문서 검색하기
의미적 유사성과 배치 작업으로 벡터 저장소 문서 검색
Last updated
의미적 유사성과 배치 작업으로 벡터 저장소 문서 검색
Last updated
vector-store-id
문자열
필수. 검색할 벡터 저장소의 ID입니다.
q
문자열
필수. 검색 쿼리 텍스트.
n
정수
반환할 결과 수. 기본값: 10.
t
숫자
일치 임계값. 기본값: 0.7.
prev_chunks
정수
일치하는 청크 이전에 포함할 청크 수. 기본값: 0.
next_chunks
정수
일치하는 청크 이후에 포함할 청크 수. 기본값: 0.
이 엔드포인트는 x-api-key
헤더에 API 키를 사용하여 인증이 필요합니다.
400
잘못된 요청 - 필수 매개변수가 누락되었거나 형식이 잘못됨
401
인증되지 않음 - 잘못되었거나 누락된 API 키
404
찾을 수 없음 - 벡터 저장소를 찾을 수 없음
500
내부 서버 오류
prev_chunks
및 next_chunks
매개변수를 사용하여 각 일치 항목에 포함되는 컨텍스트의 양을 제어합니다:
정확한 일치를 위해 둘 다 0으로 설정
최소한의 컨텍스트가 있는 일치를 위해 둘 다 1-2로 설정
상당한 컨텍스트가 있는 일치를 위해 둘 다 3-5로 설정
t
매개변수는 일치 항목이 얼마나 엄격하게 필터링되는지를 제어합니다:
높은 값(예: 0.9)은 매우 가까운 일치 항목만 반환합니다
낮은 값(예: 0.5)은 더 다양한 일치 항목을 반환합니다
기본값(0.7)은 균형 잡힌 접근 방식을 제공합니다
고속 처리 애플리케이션을 위해 Rememberizer는 벡터 저장소에서 효율적인 배치 작업을 지원합니다. 이러한 방법은 여러 검색 쿼리를 처리할 때 성능을 최적화합니다.
벡터 저장소 검색을 위한 배치 작업을 구현할 때 다음의 모범 사례를 고려하세요:
최적의 배치 크기: 대부분의 애플리케이션에서는 5-10개의 쿼리를 병렬로 처리하는 것이 처리량과 자원 사용 간의 좋은 균형을 제공합니다.
속도 제한 인식: API 속도 제한에 걸리지 않도록 배치 간에 지연 메커니즘(일반적으로 1-2초)을 포함하세요.
오류 처리: 배치 내에서 실패할 수 있는 개별 쿼리에 대해 강력한 오류 처리를 구현하세요.
연결 관리: 대량의 애플리케이션의 경우 오버헤드를 줄이기 위해 연결 풀링을 구현하세요.
타임아웃 구성: 전체 배치가 차단되지 않도록 각 요청에 적절한 타임아웃을 설정하세요.
결과 처리: 모든 결과를 기다리기보다는 결과가 제공되는 대로 비동기적으로 처리하는 것을 고려하세요.
모니터링: 평균 응답 시간 및 성공률과 같은 성능 지표를 추적하여 최적화 기회를 식별하세요.
쿼리 볼륨이 매우 높은 프로덕션 애플리케이션의 경우, 대규모 배치를 효율적으로 관리하기 위해 작업 프로세스가 있는 큐 시스템을 구현하는 것을 고려하세요.
이 엔드포인트는 의미적 유사성을 사용하여 벡터 저장소를 검색할 수 있게 해줍니다. 이는 쿼리와 개념적으로 관련된 문서를 반환하며, 정확한 키워드를 포함하지 않더라도 가능합니다. 이는 자연어 쿼리 및 질문 응답에 특히 강력합니다.
Initiate a search operation with a query text and receive most semantically similar responses from the vector store.
The ID of the vector store.
The search query text.
Number of chunks to return.
Matching threshold.
Number of chunks before the matched chunk to include.
Number of chunks after the matched chunk to include.
The API key for authentication.
Search results retrieved successfully.