# Glossar

### 1. Künstliche Intelligenz&#x20;

**Künstliche Intelligenz (KI)** bezeichnet die Simulation menschlicher Intelligenzprozesse durch Maschinen, insbesondere Computersysteme. Zu diesen Prozessen gehören Lernen (das Erwerben von Informationen und Regeln zur Nutzung der Informationen), Schlussfolgern (die Verwendung von Regeln, um zu annähernden oder eindeutigen Schlussfolgerungen zu gelangen) und Selbstkorrektur. KI wird in verschiedenen Anwendungen eingesetzt, darunter Expertensysteme, Verarbeitung natürlicher Sprache, Spracherkennung und maschinelles Sehen.

### 2. Große Sprachmodelle (LLM)

LLMs sind fortschrittliche KI-Systeme, die darauf ausgelegt sind, menschenähnlichen Text auf der Grundlage großer Datenmengen zu verstehen und zu erzeugen. \
\&#xNAN;*Blockbrain* ist ein modellunabhängiges KI-Tool, das sicherstellt, dass wir stets die besten verfügbaren KI-Modelle in einer DSGVO-konformen Umgebung in der EU anbieten, unabhängig vom Modellanbieter. Sie können aus den führenden Modellen von OpenAI, Anthropic, Meta, Mistral usw. wählen.&#x20;

Das Training eines Großen Sprachmodells (LLM) umfasst die Verwendung großer Datensätze, um dem Modell die Wahrscheinlichkeiten des gemeinsamen Auftretens von Wörtern beizubringen. In dieser Phase lernt das Modell, das nächste Wort in einer Sequenz vorherzusagen, indem es semantische Verbindungen zwischen Wörtern versteht. Sobald das Training abgeschlossen ist, kann das Modell keine neuen Informationen mehr lernen, und dies wird als „Knowledge-Cutoff-Datum“ bezeichnet – der Zeitpunkt, bis zu dem das Modell trainiert wurde.&#x20;

### 3. Chatbot

Ein Chatbot ist ein Programm, das künstliche Intelligenz (KI) nutzt, um menschenähnliche Gespräche zu führen. Er kann Fragen beantworten, Aufgaben ausführen und Informationen bereitstellen. Diese Chatbots nutzen die Verarbeitung natürlicher Sprache (NLP), um Benutzereingaben kohärent und kontextgerecht zu verstehen und darauf zu reagieren. Sie werden häufig im Kundenservice, als virtuelle Assistenten und auf verschiedenen Online-Plattformen eingesetzt, um die Nutzerinteraktion zu verbessern und Routineaufgaben zu automatisieren.

### **4. Verarbeitung natürlicher Sprache (NLP)**

NLP ist die Technologie, die Chatbots befähigt, menschliche Sprache zu verstehen und zu verarbeiten. Sie hilft dem Chatbot, die Bedeutung hinter Ihren Worten zu erkennen, sodass er präzise und kontextbezogen antworten kann. NLP umfasst verschiedene Techniken wie Tokenisierung, Sentimentanalyse und Entitätserkennung, die gemeinsam die Fähigkeit des Chatbots verbessern, menschenähnliche Antworten zu interpretieren und zu erzeugen.

### **5. Maschinelles Lernen**

Maschinelles Lernen ist eine Methode, bei der Computer aus Daten lernen und ihre Leistung verbessern, ohne explizit programmiert zu werden. Chatbots nutzen diese Technik, um ihre Antworten auf der Grundlage früherer Interaktionen zu verbessern. Dies umfasst Algorithmen, die Muster erkennen und Vorhersagen treffen, wodurch Chatbots im Laufe der Zeit genauer und effizienter werden. Durch die kontinuierliche Analyse von Benutzereingaben und Feedback ermöglicht maschinelles Lernen Chatbots, sich anzupassen und relevantere sowie personalisiertere Antworten zu liefern.

### **6. Absicht und Entität**

* **Absicht:** Der Zweck oder das Ziel hinter einer Benutzereingabe. Absichten beschreiben, was der Benutzer erreichen oder erfragen möchte. In der Anfrage „Wie ist das Wetter?“ besteht die Absicht beispielsweise darin, eine Wettervorhersage zu erhalten. Das Erkennen der Absicht hilft dem Chatbot, die Anfrage des Benutzers zu verstehen und eine passende Antwort zu geben.
* **Entität:** Spezifische Informationen, die aus einer Benutzereingabe extrahiert werden und den Kontext sowie die notwendigen Details liefern, um die Absicht zu erfüllen. Entitäten sind oft Substantive oder Eigennamen, die zusätzliche Informationen zur Anfrage des Benutzers liefern. In der Anfrage „Wie ist das Wetter in Berlin?“ ist beispielsweise „Berlin“ die Entität. Das Erkennen von Entitäten ermöglicht es dem Chatbot, seine Antwort genauer auf die Bedürfnisse des Benutzers zuzuschneiden.

### 7. Halluzination

Im Kontext großer Sprachmodelle (LLMs) bezeichnet Halluzination die Erzeugung von Informationen oder Antworten, die nicht auf den Eingabedaten oder der Realität basieren. Dies tritt auf, wenn das Modell Text vorhersagt, der plausibel erscheint, aber faktisch nicht korrekt oder für den gegebenen Kontext nicht relevant ist. Halluzinationen können zu irreführenden oder falschen Ausgaben führen und verdeutlichen die Bedeutung der Überprüfung von KI-generierten Inhalten auf Genauigkeit und Zuverlässigkeit.

### 8. Tokenisierung

**Definition:** Tokenisierung ist der Prozess, einen Textstring in kleinere Einheiten, sogenannte Token, zu zerlegen. Diese Token können Wörter, Phrasen oder sogar Zeichen sein, je nach dem erforderlichen Detaillierungsgrad.

**Zweck in Chatbots:**

1. **Textverarbeitung:** Tokenisierung ist ein grundlegender Schritt in der Verarbeitung natürlicher Sprache (NLP), der es Chatbots ermöglicht, Benutzereingaben zu verstehen und zu analysieren.
2. **Kontextverständnis:** Durch das Aufteilen von Sätzen in Token können Chatbots den Kontext und die Bedeutung jedes Wortes oder jeder Phrase besser verstehen.
3. **Merkmalsextraktion:** Token dienen als Merkmale, die Chatbots verwenden, um Absichten und Entitäten innerhalb einer Unterhaltung zu identifizieren.

**Beispiel:**

* Eingabe: „Wie ist das Wetter in Berlin?“
* Token: \["Wie", "ist", "das", "Wetter", "in", "Berlin", "?"]

**Vorteile:**

* **Verbesserte Genauigkeit:** Hilft dabei, Benutzeranfragen präzise zu interpretieren, indem der Fokus auf einzelne Komponenten gelegt wird.
* **Verbesserte Leistung:** Erleichtert eine effizientere Verarbeitung und Antwortgenerierung

### 9. Kontextfenster&#x20;

Das Kontextfenster bezeichnet die maximale Textmenge, die ein Sprachmodell in einer einzelnen empfangenen Nachricht verarbeiten kann. Es umfasst die Eingabe des Benutzers, den vorherigen Chatverlauf, angehängte Dokumente und alle Anweisungen des Assistenten. Dieses Fenster bestimmt, wie viele Informationen das Modell bei der Generierung einer Antwort berücksichtigen kann, und stellt sicher, dass es auf Grundlage des gegebenen Kontexts relevante und kohärente Antworten liefern kann.&#x20;

### 10. Sentimentanalyse&#x20;

Sentimentanalyse ist eine Technik, die in der Verarbeitung natürlicher Sprache (NLP) verwendet wird, um den emotionalen Ton eines Textes zu bestimmen. Dabei werden Textdaten analysiert, um Meinungen zu identifizieren und als positiv, negativ oder neutral zu kategorisieren. Dieser Prozess hilft dabei, die Stimmung des Benutzers zu verstehen, was für Anwendungen wie die Analyse von Kundenfeedback, die Überwachung sozialer Medien und die Verbesserung von Nutzerinteraktionen in Chatbots entscheidend sein kann.

### 11. Prompting

Prompting bezeichnet die Methode, einem Sprachmodell Eingaben oder Anweisungen zu geben, um eine gewünschte Antwort hervorzurufen. Dabei werden spezifische Fragen oder Aussagen formuliert, die das Modell bei der Erzeugung relevanter und präziser Ausgaben leiten. Effektives Prompting ist entscheidend, um den Nutzen von KI-Modellen zu maximieren, da es dabei hilft, genaue und kontextgerechte Antworten zu erhalten.

### 12. KI-Prompts

Ein KI-Prompt ist eine Softwareeinheit, die darauf ausgelegt ist, Aufgaben autonom auszuführen, oft repetitive, indem sie vordefinierten Regeln oder erlernten Mustern folgt. Diese Prompts können Informationen verarbeiten, Entscheidungen treffen und Aktionen ausführen, was sie ideal für die Automatisierung routinemäßiger Aufgaben und die Steigerung der Effizienz in verschiedenen Anwendungen macht, etwa in virtuellen Assistenten und im automatisierten Kundenservice.

### 13. Workflows

Ein Workflow ist eine Abfolge von Aufgaben, die organisiert sind, um ein bestimmtes Ziel zu erreichen, häufig unter Einsatz automatisierter Systeme oder von Prompts, die Aufgaben in einer bestimmten Reihenfolge ausführen. Die Ausgabe jedes Prompts wird zur Eingabe des nächsten, was Effizienz und Konsistenz sicherstellt. Diese Struktur automatisiert repetitive Aufgaben, verwaltet Abhängigkeiten und ermöglicht skalierbare Abläufe.

### 14. Chunk-Größe

Dieser Parameter bestimmt die Textmenge in Zeichen, die die KI in einem einzelnen Chunk aus den hochgeladenen Dokumenten verarbeitet. Eine kleinere Chunk-Größe lenkt die Analyse der KI auf einen engeren Textabschnitt, was zu präziseren und direkt relevanteren Antworten führt. Umgekehrt ermöglicht eine größere Chunk-Größe der KI, ein breiteres Spektrum an Informationen zu berücksichtigen, wodurch möglicherweise mehr Kontext erfasst wird, aber auch die Genauigkeit der Erkenntnisse durch weniger direkt relevante Informationen verwässert werden kann.

Empfohlene Verwendung: Für Anfragen, die hohe Präzision und direkte Antworten erfordern, sollten kleinere Größen gewählt werden (z. B. 1000–2000 Zeichen). Bei Fragen, die von einer breiteren Analyse des Textes profitieren oder bei denen der Kontext für das Verständnis entscheidend ist, können größere Größen (z. B. 3000–4000 Zeichen) effektiver sein. Es ist wichtig, das Bedürfnis nach detaillierten Informationen gegen das Risiko abzuwägen, zu viele periphere Inhalte einzubeziehen.

### 15. Chunk-Überlappung

Dieser Parameter steuert die Textmenge in Zeichen, die sich zwischen aufeinanderfolgenden Chunks überschneidet. Eine erhöhte Überlappung sorgt für bessere Kontinuität und Kontextbewahrung über die Chunks hinweg und verbessert die Kohärenz der von der KI erzeugten Erkenntnisse. Eine geringere Überlappung kann zu einer stärker fragmentierten Analyse führen, kann jedoch die Verarbeitungseffizienz durch Verringerung von Redundanz erhöhen.

Empfohlene Verwendung: Kleinere Überlappungswerte (z. B. 100–200 Zeichen) sind in der Regel für allgemeine Anfragen ausreichend und helfen, die Verarbeitungsgeschwindigkeit aufrechtzuerhalten. Für komplexe Analysen, bei denen der Kontext entscheidend ist (insbesondere in nuancierten oder technischen Dokumenten), können höhere Überlappungswerte (z. B. 300–500 Zeichen) präzisere und kontextreichere Antworten liefern. Passen Sie diese Einstellung je nach Bedarf für Kontextkontinuität versus Verarbeitungsgeschwindigkeit an.

Wichtig: Die Chunk-Größe sollte größer sein als die Chunk-Überlappung

### 16. Intelligente Tabellenverarbeitung

Aktivieren Sie diese Funktion, um Tabellen in hochgeladenen PDFs automatisch zu erkennen und in ein strukturiertes Textformat umzuwandeln, das für LLMs lesbar ist. Hinweis: Dies verursacht zusätzliche Kosten und Verarbeitungszeit.

### 17. Intelligente Bildverarbeitung

Aktivieren Sie diese Funktion, um Bilder in hochgeladenen PDFs automatisch zu erkennen und in ein strukturiertes Textformat umzuwandeln, das für LLMs lesbar ist. Hinweis: Dies verursacht zusätzliche Kosten und Verarbeitungszeit.

### 18. Bildextraktion

Aktivieren Sie diese Funktion, um Bilder aus hochgeladenen PDFs zu extrahieren. Dadurch kann der Bot die Bilder abrufen und anzeigen und so die Antworten verbessern.

### **19. Suchmethode - Indexsuche**

* Definition: Traditionelle Volltextsuche, die für einfache Anfragen eine präzise Übereinstimmung liefert.
* So funktioniert es:
  * Erstellt einen Index aller Wörter in einem Dokument oder einer Datenbankquelle
  * Sucht nach exakten Wortübereinstimmungen
* Vorteile:
  * Schnell und effizient für einfache Suchanfragen
  * Sehr präzise bei der Suche nach bestimmten Begriffen oder Phrasen
* Nachteile:
  * Kann Synonyme oder verwandte Konzepte übersehen
  * Weniger effektiv bei komplexen oder mehrdeutigen Anfragen

### **20. Suchmethode - KI-Suche**

* Definition: Eine semantische Suchfunktion, die Kontext und Bedeutung jenseits exakter Wortübereinstimmungen versteht.
* So funktioniert es:
  * Nutzt künstliche Intelligenz und maschinelles Lernen
  * Analysiert den Kontext und die Absicht hinter einer Suchanfrage
  * Berücksichtigt Synonyme, verwandte Konzepte und Nuancen
* Vorteile:
  * Besonders effektiv bei komplexen und nuancierten Anfragen
  * Kann die Absicht des Benutzers besser verstehen und interpretieren
  * Liefert oft relevantere Ergebnisse bei unklaren Suchanfragen
* Nachteile:
  * Kann bei sehr spezifischen oder technischen Suchen weniger präzise sein
  * Erfordert mehr Rechenleistung und kann langsamer sein als die Indexsuche

### **21. Suchmethode - Hybridsuche**

* Definition: Eine ausgefeilte Kombination aus Volltext- und semantischer Suche, die das Beste aus beiden Welten bietet.
* So funktioniert es:
  * Kombiniert die Präzision der Indexsuche mit dem kontextbezogenen Verständnis der KI-Suche
  * Verwendet Algorithmen, um zu entscheiden, welche Suchmethode für eine bestimmte Anfrage am besten geeignet ist
* Vorteile:
  * Bietet eine ausgewogene Mischung aus präziser Übereinstimmung und kontextbezogenem Verständnis
  * Ideal für vielfältige Anwendungsfälle und unterschiedliche Arten von Suchanfragen
  * Kann sowohl bei einfachen als auch bei komplexen Suchen gute Ergebnisse liefern
* Anwendungsbereiche:
  * E-Commerce-Plattformen
  * Digitale Bibliotheken und Archivdienste
  * Unternehmenssuchsysteme mit vielfältigen Inhalten


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.en.theblockbrain.ai/de/ubersicht/glossar.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.