# Grundlagen der LLMs

### **Definition von LLMs (Große Sprachmodelle)**:

Große Sprachmodelle (LLMs) sind KI-Systeme, die mit großen Textmengen trainiert werden, um natürliche Sprache zu verstehen und zu erzeugen. Sie können bei einer Vielzahl von Aufgaben helfen, wie etwa Fragen beantworten, Dokumente zusammenfassen, Texte übersetzen usw.\
LLMs können in allem eingesetzt werden, von Chatbots und Suche bis hin zu Geschäftsautomatisierung und Forschung.

#### **Unterschied zwischen LLM und R-LLM**:

* **LLM (Großes Sprachmodell)**

  LLMs werden darauf trainiert, menschenähnlichen Text auf der Grundlage von Mustern in Daten zu verstehen und zu erzeugen. Sie sind großartig bei Aufgaben wie Schreiben, Übersetzen, Zusammenfassen und dem Beantworten einfacher Fragen. Allerdings können sie an ihre Grenzen stoßen, wenn Aufgaben tieferes Schlussfolgern, schrittweise Logik oder komplexe Entscheidungsfindung erfordern.
* **R-LLM (Sprachmodell mit Schlussfolgerungsfähigkeit)**

  R-LLMs gehen einen Schritt weiter. Sie sind nicht nur darauf ausgelegt, Text zu erzeugen, sondern auch, Probleme durch logisches Schlussfolgern zu bearbeiten. Diese Modelle können komplexere Aufgaben bewältigen, wie Entscheidungen zu erklären, mehrstufige Probleme zu lösen oder logische Schlussfolgerungen zu ziehen, indem sie ihren Denkprozess aufschlüsseln und strukturiertere, nachvollziehbare Antworten liefern.

### Wie LLMs funktionieren (einfach erklärt)

Wenn du eine Nachricht sendest, zerlegt das LLM deinen Text in kleine Einheiten, genannt **Tokens** (ungefähr ein Wort oder ein Wortteil), verarbeitet sie, um Kontext und Bedeutung zu verstehen, und erzeugt dann eine Antwort – Token für Token. Die gesamte Textmenge, die das Modell auf einmal verarbeiten kann (dein Prompt, der Gesprächsverlauf und seine Antwort zusammen), wird als **Kontextfenster** bezeichnet – je größer es ist, desto mehr Informationen kann das Modell auf einmal verarbeiten.

### Was sind Tokens?

Tokens sind die Einheit, die LLMs verwenden, um Text zu lesen und zu erzeugen. Nutzer müssen das verstehen, weil:

* Es beeinflusst direkt **den Verbrauch von Compute Block (CB)**
* Es erklärt, warum längere Prompts oder Antworten mehr kosten
* Es führt das Konzept von **Kontextfenstern**

> Beispiel: *"Der flinke braune Fuchs"* = \~4 Tokens

### Was ist ein Kontextfenster?

Eine **Kontextfenster** ist die gesamte Textmenge, die ein LLM gleichzeitig in seinem „Arbeitsgedächtnis“ halten kann – einschließlich deiner Anweisungen, des Gesprächsverlaufs, aller von dir geteilten Dokumente und der Antwort des Modells. Sobald das Gespräch diese Grenze überschreitet, beginnt das Modell, frühere Teile des Austauschs zu „vergessen“.

### Wie geht es weiter?

* Tauche ein in die [Übersicht über LLMs](/de/fur-nutzer/alles-uber-llms/ubersicht-uber-llms.md) um herauszufinden, welche LLMs du in Blockbrain verwenden kannst
* Finde heraus, welches für dich am besten funktioniert, indem du liest [Wie man das richtige LLM auswählt](/de/fur-nutzer/alles-uber-llms/wie-man-das-richtige-llm-auswahlt.md)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.en.theblockbrain.ai/de/fur-nutzer/alles-uber-llms/grundlagen-der-llms.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.