# Dokumenteninhalt abrufen

{% openapi src="<https://2490272757-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2Fx5M0COIHmFFlpJ9e5pvp%2Fuploads%2Fgit-blob-77b6137eeb641262ec8e531c78123c02b825b865%2Frememberizer_openapi.yml?alt=media&token=22d7ca07-e3b4-475f-840e-857109bf09bc>" path="/documents/{document\_id}/contents/" method="get" %}
[rememberizer\_openapi.yml](https://2490272757-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2Fx5M0COIHmFFlpJ9e5pvp%2Fuploads%2Fgit-blob-77b6137eeb641262ec8e531c78123c02b825b865%2Frememberizer_openapi.yml?alt=media\&token=22d7ca07-e3b4-475f-840e-857109bf09bc)
{% endopenapi %}

## Beispielanfragen

{% tabs %}
{% tab title="cURL" %}

```bash
curl -X GET \
  "https://api.rememberizer.ai/api/v1/documents/12345/contents/?start_chunk=0&end_chunk=20" \
  -H "Authorization: Bearer YOUR_JWT_TOKEN"
```

{% hint style="info" %}
Ersetzen Sie `YOUR_JWT_TOKEN` durch Ihr tatsächliches JWT-Token und `12345` durch eine tatsächliche Dokument-ID.
{% endhint %}
{% endtab %}

{% tab title="JavaScript" %}

```javascript
const getDocumentContents = async (documentId, startChunk = 0, endChunk = 20) => {
  const url = new URL(`https://api.rememberizer.ai/api/v1/documents/${documentId}/contents/`);
  url.searchParams.append('start_chunk', startChunk);
  url.searchParams.append('end_chunk', endChunk);
  
  const response = await fetch(url.toString(), {
    method: 'GET',
    headers: {
      'Authorization': 'Bearer YOUR_JWT_TOKEN'
    }
  });
  
  const data = await response.json();
  console.log(data);
  
  // Wenn es weitere Chunks gibt, können Sie diese abrufen
  if (data.end_chunk < totalChunks) {
    // Abrufen des nächsten Satzes von Chunks
    await getDocumentContents(documentId, data.end_chunk, data.end_chunk + 20);
  }
};

getDocumentContents(12345);
```

{% hint style="info" %}
Ersetzen Sie `YOUR_JWT_TOKEN` durch Ihr tatsächliches JWT-Token und `12345` durch eine tatsächliche Dokument-ID.
{% endhint %}
{% endtab %}

{% tab title="Python" %}

```python
import requests

def get_document_contents(document_id, start_chunk=0, end_chunk=20):
    headers = {
        "Authorization": "Bearer YOUR_JWT_TOKEN"
    }
    
    params = {
        "start_chunk": start_chunk,
        "end_chunk": end_chunk
    }
    
    response = requests.get(
        f"https://api.rememberizer.ai/api/v1/documents/{document_id}/contents/",
        headers=headers,
        params=params
    )
    
    data = response.json()
    print(data)
    
    # Wenn es weitere Chunks gibt, können Sie diese abrufen
    # Dies ist ein einfaches Beispiel - Sie möchten möglicherweise eine ordnungsgemäße Rekursionsprüfung implementieren
    if 'end_chunk' in data and data['end_chunk'] < total_chunks:
        get_document_contents(document_id, data['end_chunk'], data['end_chunk'] + 20)

get_document_contents(12345)
```

{% hint style="info" %}
Ersetzen Sie `YOUR_JWT_TOKEN` durch Ihr tatsächliches JWT-Token und `12345` durch eine tatsächliche Dokument-ID.
{% endhint %}
{% endtab %}
{% endtabs %}

## Pfadparameter

| Parameter    | Typ        | Beschreibung                                                                    |
| ------------ | ---------- | ------------------------------------------------------------------------------- |
| document\_id | ganzzahlig | **Erforderlich.** Die ID des Dokuments, dessen Inhalte abgerufen werden sollen. |

## Abfrageparameter

| Parameter    | Typ        | Beschreibung                                         |
| ------------ | ---------- | ---------------------------------------------------- |
| start\_chunk | ganzzahlig | Der Start-Chunk-Index. Standard ist 0.               |
| end\_chunk   | ganzzahlig | Der End-Chunk-Index. Standard ist start\_chunk + 20. |

## Antwortformat

```json
{
  "content": "Der vollständige Textinhalt der Dokumentenabschnitte...",
  "end_chunk": 20
}
```

## Fehlerantworten

| Statuscode | Beschreibung            |
| ---------- | ----------------------- |
| 404        | Dokument nicht gefunden |
| 500        | Interner Serverfehler   |

## Paginierung für große Dokumente

Für große Dokumente wird der Inhalt in Abschnitte unterteilt. Sie können das vollständige Dokument abrufen, indem Sie mehrere Anfragen stellen:

1. Stellen Sie eine erste Anfrage mit `start_chunk=0`
2. Verwenden Sie den zurückgegebenen `end_chunk`-Wert als `start_chunk` für die nächste Anfrage
3. Fahren Sie fort, bis Sie alle Abschnitte abgerufen haben

Dieser Endpunkt gibt den Rohtextinhalt eines Dokuments zurück, sodass Sie auf die vollständigen Informationen für eine detaillierte Verarbeitung oder Analyse zugreifen können.
