Buscar documentos por similitud semántica
Punto final de búsqueda semántica con capacidades de procesamiento por lotes
Last updated
Punto final de búsqueda semántica con capacidades de procesamiento por lotes
Last updated
q
cadena
Requerido. El texto de la consulta de búsqueda (hasta 400 palabras).
n
entero
Número de resultados a devolver. Predeterminado: 3. Utilice valores más altos (por ejemplo, 10) para obtener resultados más completos.
from
cadena
Inicio del rango de tiempo para los documentos a buscar, en formato ISO 8601.
to
cadena
Fin del rango de tiempo para los documentos a buscar, en formato ISO 8601.
prev_chunks
entero
Número de fragmentos anteriores a incluir para contexto. Predeterminado: 2.
next_chunks
entero
Número de fragmentos siguientes a incluir para contexto. Predeterminado: 2.
Al buscar una respuesta a una pregunta, intenta formular tu consulta como si fuera una respuesta ideal. Por ejemplo:
En lugar de: "¿Qué es la incrustación vectorial?" Intenta: "La incrustación vectorial es una técnica que convierte texto en vectores numéricos en un espacio de alta dimensión."
Comienza con n=3
para resultados rápidos y de alta relevancia
Aumenta a n=10
o más para información más completa
Si la búsqueda devuelve información insuficiente, intenta aumentar el parámetro n
Utiliza los parámetros from
y to
para centrarte en documentos de períodos de tiempo específicos:
Documentos recientes: Establece from
en una fecha reciente
Análisis histórico: Especifica un rango de fechas específico
Excluyendo información desactualizada: Establece una fecha to
apropiada
Para manejar de manera eficiente grandes volúmenes de consultas de búsqueda, Rememberizer admite operaciones por lotes para optimizar el rendimiento y reducir la sobrecarga de llamadas a la API.
Al implementar operaciones por lotes, considera estas mejores prácticas:
Tamaño Óptimo del Lote: Comienza con tamaños de lote de 5-10 consultas y ajusta según las características de rendimiento de tu aplicación.
Limitación de Tasa: Incluye retrasos entre lotes para prevenir la limitación de la API. Un buen punto de partida es 1 segundo entre lotes.
Manejo de Errores: Implementa un manejo de errores robusto para gestionar solicitudes fallidas dentro de los lotes.
Gestión de Recursos: Monitorea el uso de recursos del lado del cliente, particularmente con tamaños de lote grandes, para prevenir un consumo excesivo de memoria.
Procesamiento de Respuestas: Procesa los resultados de los lotes de manera asíncrona cuando sea posible para mejorar la experiencia del usuario.
Para aplicaciones de alto volumen, considera implementar un sistema de cola para gestionar grandes cantidades de solicitudes de búsqueda de manera eficiente.
Este endpoint proporciona potentes capacidades de búsqueda semántica en toda tu base de conocimientos. Utiliza incrustaciones vectoriales para encontrar contenido basado en el significado en lugar de coincidencias exactas de palabras clave.
Para una comprensión más profunda de cómo funcionan las incrustaciones vectoriales y por qué este enfoque de búsqueda es efectivo, consulta
Initiate a search operation with a query text of up to 400 words and receive the most semantically similar responses from the stored knowledge. For question-answering, convert your question into an ideal answer and submit it to receive similar real answers.
Up to 400 words sentence for which you wish to find semantically similar chunks of knowledge.
Number of semantically similar chunks of text to return. Use 'n=3' for up to 5, and 'n=10' for more information. If you do not receive enough information, consider trying again with a larger 'n' value.
Start of the time range for documents to be searched, in ISO 8601 format.
End of the time range for documents to be searched, in ISO 8601 format.