Récupérer le contenu des documents
Returns the content of the document with the specified ID, along with the index of the latest retrieved chunk. Each call fetches up to 20 chunks. To get more, use the end_chunk value from the response as the start_chunk for the next call.
The ID of the document to retrieve contents for.
Indicate the starting chunk that you want to retrieve. If not specified, the default value is 0.
Indicate the ending chunk that you want to retrieve. If not specified, the default value is start_chunk + 20.
Content of the document and index of the latest retrieved chunk.
Document not found.
Internal server error.
GET /api/v1/documents/{document_id}/contents/ HTTP/1.1
Host: api.rememberizer.ai
Accept: */*
{
"content": "text",
"end_chunk": 20
}Exemples de Requêtes
curl -X GET \
"https://api.rememberizer.ai/api/v1/documents/12345/contents/?start_chunk=0&end_chunk=20" \
-H "Authorization: Bearer VOTRE_JWT_TOKEN"const getDocumentContents = async (documentId, startChunk = 0, endChunk = 20) => {
const url = new URL(`https://api.rememberizer.ai/api/v1/documents/${documentId}/contents/`);
url.searchParams.append('start_chunk', startChunk);
url.searchParams.append('end_chunk', endChunk);
const response = await fetch(url.toString(), {
method: 'GET',
headers: {
'Authorization': 'Bearer VOTRE_JWT_TOKEN'
}
});
const data = await response.json();
console.log(data);
// S'il y a plus de morceaux, vous pouvez les récupérer
if (data.end_chunk < totalChunks) {
// Récupérer le prochain ensemble de morceaux
await getDocumentContents(documentId, data.end_chunk, data.end_chunk + 20);
}
};
getDocumentContents(12345);import requests
def get_document_contents(document_id, start_chunk=0, end_chunk=20):
headers = {
"Authorization": "Bearer VOTRE_JWT_TOKEN"
}
params = {
"start_chunk": start_chunk,
"end_chunk": end_chunk
}
response = requests.get(
f"https://api.rememberizer.ai/api/v1/documents/{document_id}/contents/",
headers=headers,
params=params
)
data = response.json()
print(data)
# S'il y a plus de morceaux, vous pouvez les récupérer
# C'est un exemple simpliste - vous voudrez peut-être implémenter un véritable contrôle de récursion
if 'end_chunk' in data and data['end_chunk'] < total_chunks:
get_document_contents(document_id, data['end_chunk'], data['end_chunk'] + 20)
get_document_contents(12345)Paramètres de chemin
document_id
entier
Requis. L'ID du document pour lequel récupérer le contenu.
Paramètres de requête
start_chunk
entier
L'index du morceau de départ. Par défaut, c'est 0.
end_chunk
entier
L'index du morceau de fin. Par défaut, c'est start_chunk + 20.
Format de Réponse
{
"content": "Le texte complet du contenu des morceaux de document...",
"end_chunk": 20
}Réponses d'erreur
404
Document non trouvé
500
Erreur interne du serveur
Pagination pour de Grands Documents
Pour de grands documents, le contenu est divisé en morceaux. Vous pouvez récupérer le document complet en effectuant plusieurs requêtes :
Faites une requête initiale avec
start_chunk=0Utilisez la valeur
end_chunkretournée commestart_chunkpour la requête suivanteContinuez jusqu'à ce que vous ayez récupéré tous les morceaux
Ce point de terminaison renvoie le contenu textuel brut d'un document, vous permettant d'accéder à l'ensemble des informations pour un traitement ou une analyse détaillée.
Last updated