Cookie Preferences

Choose which cookies you want to allow. You can change your settings at any time.

We use cookies to improve your experience and analyze our traffic. Privacy Policy

    Die Geschichte der KI, Teil 2: Die Sprachrevolution (2018–2020)

    Die Geschichte der KI, Teil 2: Die Sprachrevolution (2018–2020)

    Till FreitagTill Freitag10. August 20252 min read
    Till Freitag

    TL;DR: „BERT und GPT zeigten zwei Wege – aber beide bewiesen: Maschinen können Sprache verstehen und generieren."

    — Till Freitag

    Die Transformer-Architektur wird entfesselt

    Nachdem 2017 die Transformer-Architektur vorgestellt wurde, begann ein Wettrennen. Zwei Ansätze kristallisierten sich heraus – und beide veränderten die AI-Welt grundlegend.

    2018: BERT – Google versteht Kontext

    Im Oktober 2018 veröffentlichte Google BERT (Bidirectional Encoder Representations from Transformers). Der Clou: BERT liest Text in beide Richtungen gleichzeitig und versteht dadurch Kontext besser als alles zuvor.

    Ein Beispiel

    Der Satz: „Die Bank am Fluss war nass."

    • Vorher: Modelle wussten nicht, ob „Bank" das Möbelstück oder das Finanzinstitut meint
    • BERT: Versteht durch den Kontext „Fluss" und „nass", dass es um eine Sitzbank geht

    Google integrierte BERT direkt in die Suche – der größte Algorithmus-Sprung seit Jahren. Plötzlich verstand Google, was du meinst, nicht nur was du tippst.

    2019: GPT-2 – „Too dangerous to release"

    OpenAI veröffentlichte GPT-2 im Februar 2019 – aber nur teilweise. Das vollständige Modell hielten sie zunächst zurück, mit der Begründung: zu gefährlich für die Öffentlichkeit. Die Angst: Massenhaft generierter Fake-Content.

    GPT-2 konnte erstaunlich kohärente Texte schreiben. Ganze Nachrichtenartikel, Geschichten, sogar simple Programmieraufgaben. 1,5 Milliarden Parameter – damals unvorstellbar groß.

    Die Debatte beginnt

    Die GPT-2-Kontroverse markierte den Beginn einer Diskussion, die bis heute anhält:

    • Sicherheit vs. Offenheit – Wer entscheidet, was „zu gefährlich" ist?
    • Dual Use – Jede AI-Fähigkeit kann nützlich oder schädlich sein
    • Verantwortung der Entwickler – OpenAI wurde zum Zentrum dieser Debatte

    2020: GPT-3 – der Paradigmenwechsel

    Im Juni 2020 erschien GPT-3 mit 175 Milliarden Parametern – über 100x größer als GPT-2. Und plötzlich wurde klar: Skalierung allein erzeugt emergente Fähigkeiten.

    GPT-3 konnte Dinge, die niemand explizit trainiert hatte:

    • Programmiercode schreiben
    • Zwischen Sprachen übersetzen
    • Mathematische Probleme lösen
    • Kreative Texte in verschiedenen Stilen verfassen
    • Wenige Beispiele reichten zum „Lernen" (Few-Shot Learning)

    Die Skalierungshypothese

    Modell Parameter Jahr Fähigkeiten
    GPT-1 117 Mio. 2018 Einfache Textvervollständigung
    GPT-2 1,5 Mrd. 2019 Kohärente Absätze
    GPT-3 175 Mrd. 2020 Code, Übersetzung, Reasoning

    Die Botschaft war klar: Mehr Parameter = mehr Fähigkeiten. Die sogenannte Skalierungshypothese wurde zur treibenden Kraft der gesamten Branche.

    GitHub Copilot – AI wird zum Werkzeug

    Ende 2020 begann die Entwicklung von GitHub Copilot, basierend auf GPT-3 (später Codex). Zum ersten Mal wurde ein großes Sprachmodell direkt in ein Produkt integriert, das Millionen Menschen täglich nutzen.

    Copilot zeigte: AI ist keine Zukunftsmusik mehr. Sie sitzt in deinem Editor und schreibt Code mit dir.

    Was wir aus dieser Ära lernen

    Die Jahre 2018–2020 brachten drei fundamentale Erkenntnisse:

    1. Sprache ist der Schlüssel – Wer Sprache beherrscht, kann fast alles beherrschen
    2. Skalierung funktioniert – Größere Modelle können qualitativ neue Dinge
    3. AI wird Produkt – Von der Forschung in den Arbeitsalltag

    Doch das wirklich Große stand noch bevor.


    Weiter geht's mit Teil 3: Der ChatGPT-Moment – AI erreicht die Welt (2022–2023)

    TeilenLinkedInWhatsAppE-Mail

    Related Articles

    Die Geschichte der KI, Teil 5: Ausblick 2026 – Was kommt als Nächstes?
    February 17, 20263 min

    Die Geschichte der KI, Teil 5: Ausblick 2026 – Was kommt als Nächstes?

    AGI, autonome Agenten, AI-native Unternehmen: Ein pragmatischer Ausblick auf das AI-Jahr 2026.…

    Read more
    Die Geschichte der KI, Teil 4: AI wird Infrastruktur (2024–2025)
    December 15, 20253 min

    Die Geschichte der KI, Teil 4: AI wird Infrastruktur (2024–2025)

    Von Chatbots zu Agenten, von Text zu Multimodal: Wie AI 2024 und 2025 zur Infrastruktur der Arbeitswelt wurde.…

    Read more
    Die Geschichte der KI, Teil 3: Der ChatGPT-Moment (2022–2023)
    October 5, 20253 min

    Die Geschichte der KI, Teil 3: Der ChatGPT-Moment (2022–2023)

    100 Millionen Nutzer in zwei Monaten: Wie ChatGPT, DALL-E und GPT-4 die Welt auf den Kopf stellten.…

    Read more
    Die Geschichte der KI, Teil 1: Als Maschinen sehen und spielen lernten (2012–2017)
    June 15, 20252 min

    Die Geschichte der KI, Teil 1: Als Maschinen sehen und spielen lernten (2012–2017)

    Von AlexNet über AlphaGo bis zum Transformer-Paper: Wie die Grundlagen gelegt wurden, die heute alles verändern.…

    Read more
    BullshitBench – Welche KI erkennt Nonsense?
    July 9, 20255 min

    BullshitBench – Welche KI erkennt Nonsense?

    BullshitBench testet, ob KI-Modelle plausibel klingenden Nonsense erkennen – oder ihn einfach schlucken. Die Ergebnisse …

    Read more
    monday Vibe Q1/2026: Ein Jahres-Backlog in einem Quartal – Das größte Update seit Launch
    April 7, 20264 min

    monday Vibe Q1/2026: Ein Jahres-Backlog in einem Quartal – Das größte Update seit Launch

    monday.com hat im Q1/2026 ein komplettes Jahres-Backlog für Vibe Apps ausgeliefert. 19+ Features, 26 A/B-Tests, Mobile S…

    Read more
    Gemma 4 KI-Modell läuft auf kompaktem Mini-PC – Frontier-Intelligenz wird lokal
    April 6, 20264 min

    Gemma 4: Frontier-Intelligenz auf dem Laptop – der Hype ist real

    Googles Gemma 4 liefert GPT-4-Niveau in 14 GB. 85 Tokens pro Sekunde auf Consumer-Hardware, 256K Kontext, Function Calli…

    Read more
    AI tötet Software? Die Geschichte sagt: Nein.
    April 5, 20262 min

    AI tötet Software? Die Geschichte sagt: Nein.

    Jede Technologie-Generation fügt eine Abstraktionsschicht hinzu – und wird als Tod der vorherigen erklärt. Assembly, C, …

    Read more
    OpenClaw Preisschock: So vermeidest du die $500-Rechnung
    April 5, 20262 min

    OpenClaw Preisschock: So vermeidest du die $500-Rechnung

    Anthropic streicht die Third-Party-Tool-Abdeckung unter Claude-Abos. Wer OpenClaw ohne Vorbereitung betreibt, zahlt bald…

    Read more