
MiniMax M3: Wie ein Shanghaier Lab die Open-Source-Spitze neu definiert
TL;DR: „MiniMax M3 (Release 1. Juni 2026) ist das erste Open-Weight-Modell mit Frontier-Coding (59% SWE-Bench Pro nach eigenen Angaben), 1M-Token-Kontext über die neue MSA-Architektur und nativer Multimodalität. Artificial Analysis sieht es bei 55 Intelligence Index – Spitze der Open Weights, dicht hinter GPT-5.5 und Gemini 3.1 Pro. Der eigentliche Hebel ist nicht der Benchmark, sondern die Sparse-Attention-Architektur, die 1M-Kontext bezahlbar macht."
— Till FreitagTL;DR
🎯 MiniMax M3 wurde am 1. Juni 2026 veröffentlicht – als erstes Open-Weight-Modell, das drei Frontier-Eigenschaften kombiniert:
- 1M Token Kontext über die neue MSA-Architektur (MiniMax Sparse Attention)
- Native Multimodalität (Text, Bild, Video als Input)
- Frontier-nahes Coding: 59,0 % auf SWE-Bench Pro nach MiniMax-eigenen Angaben
Artificial Analysis misst 55 Intelligence Index – damit wäre M3 das stärkste Open-Weight-Modell weltweit, knapp vor MiMo-V2-Pro (50) und in Reichweite von GPT-5.5 / Gemini 3.1 Pro. Die Gewichte sind angekündigt, aber zum Release-Zeitpunkt noch nicht freigegeben – ein wiederkehrendes Muster bei chinesischen Frontier-Releases.
Die eigentliche Geschichte ist nicht der Benchmark. Es ist MSA: eine Sparse-Attention-Architektur, die 1M-Kontext zu Preisen unterhalb westlicher Closed-Source-Modelle ermöglicht.
Der Release: 1. Juni 2026
MiniMax, ein Shanghaier KI-Lab, hat M3 ohne Vorab-Leaks veröffentlicht. Das ist ungewöhnlich – die meisten chinesischen Frontier-Modelle der letzten Monate (siehe Hunter Alpha / MiMo-V2-Pro) tauchten zuerst anonym auf OpenRouter auf.
M3 ist anders:
- Direkter Launch mit Paper, Blogpost und API
- Eigene Code-IDE (MiniMax Code) als Erst-Surface
- Preis pro Million Token deutlich unter GPT-5.5 / Claude Opus 5
- Open-Weight angekündigt – Lizenz-Details stehen aus
Das Signal ist klar: MiniMax positioniert sich als westlich-kompatibler Open-Source-Anbieter – nicht nur als Forschungslab.
Was M3 wirklich kann: drei Ebenen
1. Coding & Agentic
| Benchmark | M3 (MiniMax-Eigenangabe) | Claude Opus 5 | GPT-5.5 |
|---|---|---|---|
| SWE-Bench Pro | 59,0 % | ~57 % | ~58 % |
| ClawEval (agentic) | 64,2 | 66,8 | 65,1 |
| Terminal-Bench | 41,3 % | 44,1 % | 42,7 % |
Lesart: MiniMax claimt Frontier-Niveau. Unabhängige Re-Tests durch Artificial Analysis und BenchLM positionieren M3 etwas darunter, aber klar als #1 Open Weights – und in Schlagdistanz zu den Closed-Modellen.
2. 1M Kontext über MSA
MSA = MiniMax Sparse Attention. Statt jeder Token gegen jeden zu attendieren (quadratisch), nutzt MSA lernbar gesteuerte Sparse-Patterns – ähnlich Mixture-of-Experts, aber auf der Attention-Ebene.
Konkret:
- Linear-skalierende Attention für Long-Range-Dependencies
- Dense-Attention-Fenster für lokale Präzision
- Ergebnis: 1M Kontext ohne quadratische Kosten
Das ist der wichtigere Beitrag als jeder Benchmark-Score. Wer 1M Kontext zu MoE-Preisen anbietet, verändert die Wirtschaftlichkeit von Long-Context-Workloads – RAG-Killer-Use-Cases, Repo-weite Code-Analyse, Multi-Dokument-Reasoning.
3. Native Multimodalität
M3 ist das erste M-Serie-Modell mit Bild- und Video-Input out-of-the-box. Kein adapter-basiertes Bolt-on, sondern gemeinsame Trainings-Phase – analog zu Gemini 2 / GPT-5o.
Einordnung in die Open-Source-Landschaft
Nach M3 sieht die Open-Weight-Spitze (Stand Juni 2026) so aus:
| Modell | Lab | Intelligence Index | Kontext | Status |
|---|---|---|---|---|
| MiniMax M3 | MiniMax (CN) | 55 | 1M | Weights angekündigt |
| MiMo-V2-Pro | Xiaomi (CN) | 50 | 1M | Open via OpenRouter |
| DeepSeek V4 | DeepSeek (CN) | 53 | 256K | Open Weights |
| Qwen3.5-Max | Alibaba (CN) | 49 | 256K | Open Weights |
| Llama 5 405B | Meta (US) | 46 | 128K | Open Weights |
Die unbequeme Wahrheit: Die Top-5 Open Weights sind vier chinesische Modelle und ein US-Modell. Wer 2026 Open-Source-LLMs deployt, deployt mehrheitlich chinesische Architekturen.
Das ist keine ideologische Aussage – es ist eine technische. Und es hat Konsequenzen für Sovereignty-, Compliance- und Supply-Chain-Strategien, die europäische Unternehmen jetzt durchdenken müssen.
Was an dem Hype dran ist – und was nicht
Dran ist:
- MSA ist real und reproduzierbar. Das Paper ist publiziert, die Architektur ist nachvollziehbar
- 1M Kontext zu MoE-Preisen ist eine echte Disruption für RAG-Architekturen
- Open-Weight-Versprechen wäre, sobald eingelöst, ein neuer Anker für die gesamte Open-Source-Community
Nicht dran ist:
- "Schlägt GPT-5.5" – die unabhängigen Re-Tests (Artificial Analysis: 55 vs. ~62 für GPT-5.5) erzählen eine andere Geschichte als die MiniMax-eigenen Charts
- "Sofort produktionsreif" – ohne freigegebene Weights ist die Lieferkette an MiniMax-API gebunden, also de facto Closed-Source mit Open-Source-Marketing
- "Alles in einem Modell" – Multimodalität ist nativ, aber video-output und audio fehlen weiterhin
Was bedeutet das für AI-First-Teams?
Drei konkrete Empfehlungen:
1. MSA als Pattern verfolgen, nicht nur M3 als Modell. Sparse Attention auf 1M ist die wichtigere Story. Erwarte ähnliche Architekturen bei DeepSeek V5, Qwen 4, Claude Opus 6. Wer heute Long-Context-Workloads architekturiert, sollte kostenlinear denken, nicht quadratisch.
2. Open-Weight-Roadmap beobachten, nicht blind deployen. Solange die Weights nicht öffentlich sind, ist M3 API-only. Für produktive China-API-Nutzung gelten dieselben Daten-Governance-Fragen wie für DeepSeek oder Qwen. Plane mit, dass die Weights kommen – nicht damit, dass sie schon da sind.
3. RAG-Architekturen neu denken. Wenn 1M-Kontext zu Open-Source-Preisen verfügbar wird, ändert sich die Make-or-Buy-Entscheidung zwischen Retrieval-Pipeline und Long-Context-Brute-Force. Viele aktuelle RAG-Setups werden mit MSA-Modellen billiger ohne Retrieval als mit. Das ist eine Architektur-Debatte, die viele Teams in Q3 führen werden.
Fazit
MiniMax M3 ist kein "ChatGPT-Moment" – aber ein Architektur-Moment. MSA verändert, was Open Weights ökonomisch leisten können. Der Benchmark-Hype wird sich nach den unabhängigen Re-Tests einpendeln; die Architektur bleibt.
Für europäische AI-First-Teams ist die Lesart einfach: Die Open-Source-Spitze sitzt nicht mehr in San Francisco oder Paris. Sie sitzt in Shanghai, Hangzhou und Peking. Das ist kein Drama, sondern eine strategische Realität, die in Modellauswahl, Compliance und Lieferketten einfließen muss.
Weiterlesen:








