# Übersicht über LLMs

### 1. Primäre Anwendungsfälle für LLMs & R-LLMs finden

<table><thead><tr><th width="282.18182373046875">Anwendungsfall</th><th>LLM-Modelle</th></tr></thead><tbody><tr><td>Allgemeine Produktivität</td><td>GPT 5.4, Gemini 2.5 Pro, Claude Haiku 4.5</td></tr><tr><td>Komplexes Schlussfolgern</td><td>Gemini 2.5 Pro, Claude Sonnet 4.6, Claude Opus 4.6</td></tr><tr><td>Strukturiertes Schreiben &#x26; Synthese</td><td>GPT 5.4, Claude Sonnet 4.6</td></tr><tr><td>Programmierung &#x26; technische Workflows</td><td>GPT 5.3 Codex, Claude Sonnet 4.6</td></tr><tr><td>Schnelle &#x26; skalierbare Verarbeitung</td><td>GPT 5.4 Non-Thinking, Gemini 2.5 Flash (Lite), Claude Haiku 4.5</td></tr></tbody></table>

### 2. Hosting-Präferenz

Wählen Sie, wo Ihre Daten verarbeitet werden, basierend auf Ihren Datenschutzanforderungen und Zugriffsprioritäten. Wir bieten zwei Hosting-Optionen, EU und US, jeweils mit unterschiedlichen Vorteilen in Bezug auf Compliance, Geschwindigkeit und Modellzugriff.

| Faktor                                  | EU-Hosting (Datenschutz First)                                       | US-Hosting (Feature First)                                 |
| --------------------------------------- | -------------------------------------------------------------------- | ---------------------------------------------------------- |
| **DSGVO-Konformität**                   | Vollständig DSGVO-konform                                            | Standardmäßig nicht DSGVO-konform                          |
| **Datenresidenz**                       | Daten bleiben in der EU                                              | Daten werden global gespeichert                            |
| **Modellverfügbarkeit**                 | Verspätete Modellausgabe je nach Verfügbarkeit des EU-Rechenzentrums | Vollzugriff auf die neuesten Modelle und Funktionen zuerst |
| **Rechtliche & regulatorische Risiken** | Erfüllt strengere EU-Datenschutzgesetze                              | Unterliegt US-Recht und Übermittlungsschutzmaßnahmen       |

**Zusammenfassung:**

* **Wählen Sie EU-Hosting** wenn Sie Wert legen auf **DSGVO-Konformität** und **strikten Datenschutz** innerhalb Europas.
* **Wählen Sie US-Hosting** wenn Sie wollen **die neuesten Modelle** und globale Rechenzentren.

### 3. Geschwindigkeit vs. Tiefe: Was ist Ihnen wichtiger?

Einige Modelle sind für schnelle, leichte Aufgaben konzipiert. Andere sind darauf ausgelegt, tiefer zu gehen, intensiver zu denken und mehr Komplexität zu bewältigen. Wählen Sie je nach gewünschtem Erlebnis.

| Präferenz                                                  | Wann wählen                                                                                  | Modelle                                                         |
| ---------------------------------------------------------- | -------------------------------------------------------------------------------------------- | --------------------------------------------------------------- |
| <p>Hohe Geschwindigkeit<br>(schnell, reaktionsschnell)</p> | Für schnelle Antworten oder einfache Aufgaben, bei denen geringe Latenz am wichtigsten ist.  | Gemini 2.5 Flash (Lite), Claude Sonnet 4.6 (Fast), GPT 5.4 Mini |
| <p>Hohe Tiefe<br>(detailliert, strukturiert)</p>           | Für komplexe Prompts, mehrstufige Logik oder detaillierte Analysen, die Reflexion erfordern. | Gemini 2.5 Pro, Claude 4.6 Sonnet, GPT 5.4 High Thinking        |

### 4. Wählen Sie Ihre gewünschten LLMs

| Modell                               | Beschreibung                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
| ------------------------------------ | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| Claude Sonnet 4.6                    | Verbessertes Sonnet-Modell mit stärkerer Programmierung, Computer-Nutzung und Langkontext-Reasoning. Besser geeignet für Agenten-Workflows, Aufgaben mit großen Codebasen, Dokumentenanalyse und andere mehrstufige Arbeit.                                                                                                                                                                                                                                                                     |
| Claude Sonnet 4.6 (Fast)             | Eine Konfiguration von Claude Sonnet 4.6. Läuft strikt im "Non-Reasoning"-Modus und umgeht lange Denkphasen, um qualitativ hochwertige Ergebnisse mit niedriger Latenz zu liefern.                                                                                                                                                                                                                                                                                                              |
| Claude Opus 4.6                      | <p>Verbessert die Programmierstärken früherer Modelle mit zuverlässigerer Leistung für agentische Aufgaben, Codebase-Verwaltung sowie strukturierte Code-Reviews und Debugging.<br>Auch bei alltäglicher Arbeit stärker. Handhabt Analyse, Dokumentenprüfung und Multitasking konsistenter und effizienter.</p>                                                                                                                                                                                 |
| Claude Opus 4.5                      | Entwickelt für agentisches Programmieren, langfristiges Schlussfolgern und komplexe toolgestützte Workflows, mit hoher Korrektheit bei mehrstufiger Ausführung. Es glänzt bei Software-Engineering-Aufgaben, Terminal- und Computer-Nutzung, strukturierter Tool-Orchestrierung und neuartigem Problemlösen und erzielt starke Ergebnisse beim ersten Versuch mit weniger Wiederholungen.                                                                                                       |
| Claude Haiku 4.5                     | Schnell, effizient und für Skalierung gebaut. Liefert Coding- und Reasoning-Leistung nahezu auf Sonnet-Niveau bei etwa 3× geringeren Kosten und 2× höherer Geschwindigkeit. Überzeugt bei Tool-Nutzung, UI-Interaktion und paralleler Aufgabenausführung, ideal als Worker-Modell in Multi-Agenten- oder Produktionsumgebungen. Stark bei Coding-Zuverlässigkeit. Am besten für Backend-Automatisierungen, Chat-Workloads und Agentensysteme, die Geschwindigkeit und geringe Kosten benötigen. |
| Claude Sonnet 4.5                    | Erweitert die ausgewogene Leistung mit stärkerem Reasoning, längerer Aufgabenpersistenz und zuverlässigerer Tool-Nutzung und erzielt State-of-the-Art-Ergebnisse bei Programmierung und realen Computeraufgaben. Liefert höhere Genauigkeit, mehr Autonomie und flüssigere mehrstufige Workflows im Vergleich zu Claude 4 Sonnet.                                                                                                                                                               |
| Claude Sonnet 4.5 (Fast)             | Eine Konfiguration von Claude Sonnet 4.5. Läuft strikt im "Non-Reasoning"-Modus und umgeht lange Denkphasen, um qualitativ hochwertige Ergebnisse mit niedriger Latenz zu liefern.                                                                                                                                                                                                                                                                                                              |
| Claude Opus 4.1                      | Scharfer, stabiler, intelligenter. Baut auf Opus 4 auf mit deutlich saubereren Code-Fixes, längeren autonomen agentischen Workflows und präziserem Reasoning. Bewältigt lange, mehrstufige Aufgaben mit Hybrid-Reasoning und erweitertem "Denken", einschließlich Code-Refactoring, Deep Research und strategischer Synthese.                                                                                                                                                                   |
| Claude Opus 4                        | Konzipiert für lange, anspruchsvolle Aufgaben, die tiefes Nachdenken und konstante Leistung erfordern. Besonders stark beim Antrieb autonomer Agenten, beim Umgang mit großen, komplexen Codebasen und bei mehrstufigen Workflows, die stundenlang dauern können. Ideal für fortgeschrittene Programmieraufgaben, detaillierte Analysen und Aufgaben, die konzentrierte, anhaltende Aufmerksamkeit erfordern.                                                                                   |
| Claude Sonnet 4                      | Verbessert die ausgewogene Leistung durch verfeinertes Reasoning, erweiterte Autonomie und präzise Befolgung von Anweisungen und liefert im Vergleich zu Claude 3.7 Sonnet verbesserte Coding-Fähigkeiten und höhere Aufgabengenauigkeit.                                                                                                                                                                                                                                                       |
| Gemini 3.1 Pro                       | Ideal für komplexes Reasoning, Programmierung und Langkontext-Arbeit über Text, Bilder, Audio, Video, PDFs und große Codebasen hinweg. Am besten für Deep Research, mehrstufige Agenten-Workflows, technische Planung und dokumentenlastige Analysen.                                                                                                                                                                                                                                           |
| Gemini 3 Pro                         | Hochleistungsfähiges multimodales Modell für Teams, die mit Texten, Bildern, Dokumenten, Videos und Code arbeiten. Bietet starkes Langkontext-Reasoning, zuverlässige Analyse über große Dateien hinweg und fortgeschrittene Tool-Nutzung für stärker automatisierte Workflows.                                                                                                                                                                                                                 |
| Gemini 2.5 Pro (Enterprise Search)   | Überzeugt bei Reasoning, Konversation und Programmierung und ist für sichere kommerzielle Nutzung konfiguriert. Nutzt Web Grounding for Enterprise, um Zugriff auf Live-Webdaten zu bieten, ohne die Datenschutzrisiken standardmäßiger Suchtools.                                                                                                                                                                                                                                              |
| Gemini 2.5 Pro                       | Ausgewogenes, zuverlässiges Modell für alltägliche Aufgaben. Überzeugt bei Reasoning, Konversation und Programmierung. Eine starke Wahl für intelligente Assistenten, Business-Tools und kreative Workflows, die Geschwindigkeit, Genauigkeit und durchdachte Ergebnisse erfordern.                                                                                                                                                                                                             |
| Gemini 2.5 Flash                     | Intelligenter und leistungsfähiger als 2.0 Flash, mit schnellen Antworten und sichtbarem Reasoning. Am besten für Echtzeitaufgaben, die sowohl Geschwindigkeit als auch leichtes Denken erfordern, wie Chatbots, Copilots und skalierbare KI-Tools.                                                                                                                                                                                                                                             |
| Google Vertex Imagen 4 Generate      | Entwickelt für Premium-Text-zu-Bild-Generierung mit reichen Details und gleichbleibender Ausgabequalität. Mit integrierter Sicherheit, Wasserzeichen und Prompt-Optimierung. Passt gut in Unternehmens-Workflows, die vertrauenswürdige und konforme visuelle Erstellung erfordern.                                                                                                                                                                                                             |
| Google Vertex 2.5 Flash Image        | Optimiert für schnelle, flexible Bildgenerierung und -bearbeitung. Beherrscht Text-zu-Bild, gezielte visuelle Bearbeitungen, Charakterkonsistenz und Multi-Image-Fusion. Ideal für schnelle visuelle Experimente und konsistente Produktbilder in kosteneffizienten Workflows.                                                                                                                                                                                                                  |
| Gemini 2.0 Flash (Thinking Mode)     | Entwickelt für akademische Präzision, komplexe Logik und strukturiertes Problemlösen. Gut geeignet für wissenschaftliche Berichte, schrittweises Reasoning und Dateninterpretationsaufgaben, die Tiefe statt Geschwindigkeit erfordern. Nicht für schnelle Durchlaufzeiten oder Echtzeiteinsatz gedacht.                                                                                                                                                                                        |
| GPT 5.5 Pro                          | Dasselbe zugrunde liegende Modell wie GPT-5.5, verwendet jedoch parallele Testzeit-Berechnung für die schwierigsten Aufgaben. Führt bei BrowseComp (90,1 %) und FrontierMath Tier 4 (39,6 %) an. Am besten für Probleme, bei denen standardmäßiger Reasoning-Aufwand nicht ausreicht.                                                                                                                                                                                                           |
| GPT 5.5                              | Bewältigt komplexe agentische Arbeit sowie Programmierung, Recherche, Computer-Nutzung und Aufgaben mit hohem Token-Bedarf. Erzielt 82,7 % bei Terminal-Bench 2.0 und 84,9 % bei GDPval. Am besten für Aufgaben, die anhaltendes Reasoning über den Kontext hinweg erfordern.                                                                                                                                                                                                                   |
| GPT 5.4 High Thinking mit Suche      | Verwendet mehr Reasoning-Ressourcen für komplexe und mehrstufige Aufgaben. Am besten für tiefe Analysen, Strategie und technische Problemlösung mit automatischer Suchunterstützung.                                                                                                                                                                                                                                                                                                            |
| GPT 5.4 Low Thinking mit Suche       | Verwendet zusätzliche Reasoning-Berechnung zur Verbesserung von Genauigkeit und Struktur. Geeignet für Zusammenfassungen, leichte Analysen und grundlegende Entscheidungsfindung mit automatischer Suche nach aktuellen Informationen.                                                                                                                                                                                                                                                          |
| GPT 5.4 None Thinking mit Suche      | Verwendet grundlegendes Reasoning ohne zusätzliche Berechnung. Auf Geschwindigkeit und Kosten optimiert, ideal für Formatierung, Klassifizierung und strukturierte Ausgaben, mit automatischer Suche bei Bedarf.                                                                                                                                                                                                                                                                                |
| GPT 5.4 Mini                         | Hauptsächlich für Programmierung, Tool-Workflows und Ausführung von Aufgaben mit hohem Volumen konzipiert. Schnell und kosteneffizient. Am besten als Standard-Produktionsmodell statt für tiefes Reasoning.                                                                                                                                                                                                                                                                                    |
| GPT 5.3 Codex                        | Gebaut für agentisches Software-Engineering und kombiniert die Coding-Leistung von GPT-5.2 Codex mit breiterem Reasoning über Recherche, Dokumentation und technische Entscheidungsfindung hinweg. Läuft 25 % schneller als sein Vorgänger.                                                                                                                                                                                                                                                     |
| GPT 5.2 Thinking mit Suche           | Gebaut für komplexes Reasoning und mehrstufige agentische Workflows. Optimiert für langfristige Wissensarbeit mit verbesserter Faktentreue und integrierter Suche.                                                                                                                                                                                                                                                                                                                              |
| GPT 5.2                              | Gebaut für professionelle Wissensarbeit von Anfang bis Ende und langfristig laufende Agenten. Produziert qualitativ hochwertigere Arbeitsergebnisse, schreibt und refaktoriert Code effektiver, versteht langen Kontext besser und erkennt Bilder genauer.                                                                                                                                                                                                                                      |
| GPT 5.1 Codex Max                    | Gebaut für komplexe, risikoreiche Programmierarbeit und autonome Agenten. Stärkeres Reasoning und mehr Konsistenz über große Codebasen hinweg. Am besten für mehrstufige Refactorings, bei denen Korrektheit und Tiefe wichtiger sind als Geschwindigkeit.                                                                                                                                                                                                                                      |
| GPT 5.1 Codex                        | Hoher Nutzen für Entwickler-Workflows wie Codegenerierung und Programmieraufgaben. Am besten für kurze bis mittlere Coding-Probleme. Ideal für Entwicklung mit menschlicher Kontrolle im Loop.                                                                                                                                                                                                                                                                                                  |
| GPT 5.1 High Reasoning               | Verwendet hohe Reasoning-Ressourcen für Antworten höchster Qualität. Entwickelt für Aufgaben, bei denen ein hohes Maß an strategischem Denken und Planung erforderlich ist.                                                                                                                                                                                                                                                                                                                     |
| GPT 5.1 Low Reasoning                | Nutzen reduzierte Reasoning-Ressourcen für hohe Reaktionsfähigkeit. Umgeht tiefes reflektierendes Verarbeiten für nahezu sofortige Antworten. Gut für Echtzeitgespräche und Datenverarbeitung mit hohem Volumen.                                                                                                                                                                                                                                                                                |
| GPT 5.1 None Reasoning               | Verwendet die wenigsten Reasoning-Ressourcen für die niedrigste Latenz und maximale Kosteneffizienz. Entwickelt für einfache Textformatierung, Klassifizierung mit hohem Volumen und Konversationsfluss.                                                                                                                                                                                                                                                                                        |
| GPT 5.1                              | Gebaut für schnelle, zuverlässige Gespräche mit stärkerer Befolgung von Anweisungen und natürlicherem Dialog. Ein verfeinertes Upgrade zu GPT-5 mit flüssigerer Kommunikation und verbesserter Alltagstauglichkeit.                                                                                                                                                                                                                                                                             |
| GPT 5 Codex                          | Eine auf Software-Engineering zugeschnittene Version von GPT-5. Baut Projekte, fügt Funktionen hinzu, debuggt, refaktoriert Code und führt Code-Reviews durch. Passt die Denkzeit an die Aufgabenkomplexität an.                                                                                                                                                                                                                                                                                |
| GPT-5 (Auto)                         | Wählt automatisch das am besten geeignete GPT-Modell basierend auf der Komplexität der Anfrage und den Leistungsanforderungen aus. Leitet an die Familien GPT-5 & GPT-4.1 und o4 Mini weiter.                                                                                                                                                                                                                                                                                                   |
| GPT-5 Thinking                       | Denkt wie ein Experte und passt sich der Aufgabe an. Bewältigt Schreiben, Programmierung, Recherche und Datenanalyse. Vorgesehen als Ersatz für OpenAI o3 und OpenAI o3 Pro.                                                                                                                                                                                                                                                                                                                    |
| GPT-5 Nano                           | Ultraleicht und blitzschnell. Gebaut für geringe Latenzanforderungen wie Zusammenfassungen, Klassifizierung und schnelle Q\&A zu einem Bruchteil der Kosten. Vorgesehen als Ersatz für GPT 4.1 Nano.                                                                                                                                                                                                                                                                                            |
| GPT-5 Mini                           | Schlank, kostensensibel und dennoch präzise. Liefert zuverlässiges Befolgen von Anweisungen, reichhaltige multimodale Antworten und reduzierte Latenz bei geringerem Rechenaufwand und Preis. Vorgesehen als Ersatz für GPT 4o Mini und OpenAI o4 Mini.                                                                                                                                                                                                                                         |
| GPT-5                                | Zugeschnitten auf natürliche Gespräche auf Enterprise-Niveau. Multimodal und kontextbewusst. Vorgesehen als Ersatz für GPT 4o.                                                                                                                                                                                                                                                                                                                                                                  |
| Azure GPT Image 1.5                  | Verbesserte Version von Azure GPT Image 1 mit besserer Bildqualität, schnelleren Generierungszeiten und besserer Verarbeitung komplexer Prompts.                                                                                                                                                                                                                                                                                                                                                |
| Azure GPT-image-1                    | Gebaut für hochwertige Bilderzeugung und präzise Befolgung von Anweisungen innerhalb von Azures Enterprise-Umgebung.                                                                                                                                                                                                                                                                                                                                                                            |
| GPT 4o Realtime                      | Ideal für schnelle, dialogorientierte Aufgaben mit Streaming-Audio. Extrem niedrige Latenz und starkes Verständnis für sprachbasierte Interaktionen. Am besten für Echtzeit-Assistenten und Audio-first-Produkte.                                                                                                                                                                                                                                                                               |
| GPT Realtime                         | Gebaut für Live-Gespräche mit niedriger Latenz und Voice-in-/Voice-out-Streaming. Am besten für interaktive Assistenten und Echtzeit-Übersetzer. Nicht für lange, komplexe Reasoning-Aufgaben gedacht.                                                                                                                                                                                                                                                                                          |
| GPT 4.5                              | Liefert subtile Verbesserungen bei emotionalem Ton, Schreibfluss und kreativer Ideation, insbesondere in chatähnlichen Umgebungen. Am besten für ausgereifte Gesprächsausgaben. Hinweis: Sehr teuer (10–15× teurer als GPT-4o.                                                                                                                                                                                                                                                                  |
| GPT 4o Mini                          | Eine kleinere, erschwinglichere Version von GPT-4 Omni für schnelle, hochwertige Antworten ohne die höheren Kosten. Großartig für intelligente Assistenten, alltägliche Aufgaben und Apps, die zuverlässiges Reasoning mit etwas Bild- oder Audioeingabe benötigen.                                                                                                                                                                                                                             |
| GPT 4.1 Nano                         | Das schnellste und leichtgewichtigste GPT-4.1-Modell, gebaut für Geschwindigkeit und Einfachheit. Ideal für schnelles Autocomplete, schnelle Klassifizierungen oder leichte Assistenten, bei denen Kosten und Antwortzeit am wichtigsten sind.                                                                                                                                                                                                                                                  |
| GPT 4.1 Mini                         | Eine schnellere, effizientere Version von GPT-4.1, die einen Großteil der Qualität beibehält und gleichzeitig weniger Ressourcen nutzt. Großartig für Entwickler, Start-ups und Produktteams, die schnelle, leistungsfähige Ergebnisse zu geringeren Kosten benötigen.                                                                                                                                                                                                                          |
| GPT 4.1                              | Ein leistungsstarkes und verfeinertes Modell für Aufgaben, die Präzision und Tiefe verlangen. Überzeugt bei Programmierung, Befolgen von Anweisungen und beim Umgang mit umfangreichen Dokumenten mit einem Kontextfenster von 1 Million Tokens.                                                                                                                                                                                                                                                |
| Magistral Medium                     | Schlank, schnell und leistungsstark. Gebaut für schnelle, umfangreiche Aufgaben mit niedriger Latenz. Bietet starkes Befolgen von Anweisungen, dialogische Finesse und robustes multimodales Verständnis.                                                                                                                                                                                                                                                                                       |
| Mistral Small 24B                    | Entwickelt für Langform-Analysen, tiefes Dokumentenverständnis und multimodale Aufgaben. Unterstützt einen enormen Kontext von 10 Millionen Tokens und überzeugt bei Reasoning, Bildverständnis und Programmierung.                                                                                                                                                                                                                                                                             |
| Mistral Large                        | Ein Enterprise-Reasoning-Kraftpaket, das durch Reinforcement Learning aufgebaut wurde. Liefert schnelle, nachvollziehbare, mehrsprachige Gedankengänge. Bewältigt komplexe Aufgaben in Mathematik, Code, Logik und regelbasierten Workflows mit Präzision und Transparenz.                                                                                                                                                                                                                      |
| Mistral Small                        | Ein Generalist der Spitzenklasse für Unternehmensanforderungen. Überzeugt in Programmierung, mathematischem Denken, Langdokumentenverständnis, Dialog und multimodalen Aufgaben. Bietet bis zu 128K Token Kontext mit Function Calling und agentischen Workflows.                                                                                                                                                                                                                               |
| Mistral Medium                       | Konzentriert sich auf Sprachflüssigkeit, Antwortqualität und mehrsprachige Abdeckung. Gut geeignet für Chatbots, Schreibhilfe und globalen Kundensupport.                                                                                                                                                                                                                                                                                                                                       |
| Mistral Nemo 12B                     | Versteht sowohl Sprache als auch Bilder mit beeindruckender Genauigkeit. Ideal für Forschung, Unternehmenswerkzeuge und Aufgaben, die visuelles Reasoning mit starken Sprachfähigkeiten verbinden.                                                                                                                                                                                                                                                                                              |
| Mistral Nemo                         | Ein mehrsprachiges Kraftpaket für tiefes Reasoning, Code, Mathematik und Agenten-Workflows. Bietet ein Kontextfenster von 32K Tokens, natives Function Calling und RAG-Unterstützung.                                                                                                                                                                                                                                                                                                           |
| Mistral Codestral                    | Gut geeignet für Echtzeit-Entwicklung, Code-Automatisierung und Debugging über verschiedene Programmiersprachen hinweg. Verbessert gegenüber früheren offenen Modellen die Geschwindigkeit der Codegenerierung, die Genauigkeit und die Mehrsprachenunterstützung.                                                                                                                                                                                                                              |
| Grok 4                               | Grok-Modell auf Frontier-Niveau mit nativer Tool-Nutzung, Echtzeit-Webzugriff und fortgeschrittenem Reasoning. Ideal für Power-User, die Live-Daten, Langkontext-Verständnis und komplexe Aufgabenausführung benötigen.                                                                                                                                                                                                                                                                         |
| Grok 3 Mini (thinking - High Effort) | Ein effizienteres Grok-Modell, optimiert für durchdachtes, tieferes Reasoning. Ideal für mäßig komplexe Aufgaben, bei denen Sie genaue Antworten ohne die vollen Kosten eines Flaggschiffmodells wünschen.                                                                                                                                                                                                                                                                                      |
| Grok 3 Mini (thinking - Low Effort)  | Ein schnelles, ressourcenschonendes Grok-Modell für lockere Interaktionen und einfache Aufgaben. Ideal, wenn Geschwindigkeit wichtiger ist als Tiefe.                                                                                                                                                                                                                                                                                                                                           |
| Grok 3                               | Gebaut für stärkeres Reasoning und tiefere Gespräche über alltägliche und technische Themen hinweg. Gut geeignet für intelligente Assistenten, Recherchetools und fortgeschrittene Chat-Erlebnisse.                                                                                                                                                                                                                                                                                             |
| Grok 2 Vision                        | Entwickelt, um sowohl Bilder als auch Text zu verstehen. Hilfreich für visuelle Anfragen, Screenshots und bildbasierte Aufgaben.                                                                                                                                                                                                                                                                                                                                                                |
| Nebius AI Flux Schnell               | Optimiert für schnelle Bilderzeugung in hohem Volumen. Überzeugt bei schneller visueller Iteration für Design-Exploration, Marketing-Assets und kreative Prototypen.                                                                                                                                                                                                                                                                                                                            |
| Teuken 7B                            | Ausgewogene Leistungsfähigkeit für anspruchsvolle, gemischte Workloads. Kombiniert starkes multimodales Reasoning, Programmierung und mehrsprachige Fähigkeiten mit einem Kontext von 1 Million Tokens. Am besten für vielseitige Unternehmensanwendungen und KI-Agenten.                                                                                                                                                                                                                       |


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.en.theblockbrain.ai/de/fur-nutzer/alles-uber-llms/ubersicht-uber-llms.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
