Samenvatting: Twee Chinese modellen schoven deze maand naar de wereldtop. MiniMax M3 draait mee in de hoogste klasse voor zo'n vijftig dollarcent per miljoen tokens. Qwen 3.7 Max van Alibaba klopt op eigen metingen Claude Opus 4.7 op agent-taken, voor de helft van de prijs. De Stanford AI Index meet het gat tussen de beste Amerikaanse en Chinese modellen op nog 2,7 procent; twee jaar terug was dat dertig. Ik lees die cijfers met een korrel zout, want veel komt van de makers zelf. Maar de richting klopt: bijna-topkwaliteit wordt spotgoedkoop. Dat verandert niet welk model het slimst is. Het verandert wat je betaalt om er een te draaien.

Twee lanceringen, dezelfde boodschap

Op 1 juni bracht MiniMax uit Shanghai zijn model M3 uit. Tien dagen eerder toonde Alibaba in Hangzhou Qwen 3.7 Max. Verschillende doelen, dezelfde strekking. De afstand tot de Amerikaanse top is klein geworden, en de prijs van die top is ingestort.

Begin dit jaar leidden de Westerse labs nog met gemak. Die voorsprong is weg.

MiniMax M3: topklasse voor een prikkie

M3 leest tekst, beeld en video, en het kan een computer bedienen: klikken, typen, door schermen navigeren. Op de OSWorld-test voor computergebruik haalt het ruim 70 procent. Het contextvenster is een miljoen tokens, genoeg voor een hele codebase of een stapel contracten in één keer.

Maar het nieuws is de prijs. MiniMax rekent volgens zijn prijslijst ongeveer $0,30 per miljoen tokens invoer en $1,20 uitvoer. Gemengd zit je rond de vijftig dollarcent. Artificial Analysis zet M3 boven aan zijn prijsklasse en schrijft dat het, zodra de gewichten vrij zijn, het sterkste open model wordt. En MiniMax geeft het als open gewichten vrij. Je mag het dus zelf draaien.

Die lage prijs komt niet uit de lucht. M3 gebruikt een techniek, MiniMax Sparse Attention, die het rekenwerk bij lange teksten flink terugbrengt. Minder rekenwerk per token betekent een lagere prijs per token.

De coderscijfers, bijna 60 procent op SWE-Bench Pro, komen wel van MiniMax zelf. Die geloof ik pas als een onafhankelijke partij ze natrekt.

Qwen 3.7 Max: de helft van Opus, en sneller op agent-werk

Waar M3 op prijs mikt, mikt Alibaba op de kroon. Qwen 3.7 Max is gebouwd voor agent-werk: lange, zelfstandige klussen waarbij het model gereedschappen aanroept en stap voor stap een taak afmaakt. Alibaba laat het in één run 35 uur doorwerken, met meer dan duizend aanroepen.

Op de eigen cijfers verslaat het Claude Opus 4.7 op meerdere agent-tests: 69,7 om 65,4 op Terminal-Bench 2.0, en 60,6 om 57,3 op SWE-Bench Pro. Onafhankelijk houdt het stand. Bij Artificial Analysis staat Qwen 3.7 Max vijfde wereldwijd en eerste van de Chinese modellen, met de laagste neiging tot verzinsels van de hele kopgroep.

De prijs: $2,50 invoer en $7,50 uitvoer per miljoen tokens. Ongeveer de helft van Opus 4.7. Anders dan M3 houdt Alibaba de gewichten dicht. Je huurt het via de API, je draait het niet zelf.

Het gat is geslonken tot 2,7 procent

Eén lancering is toeval. Twee is een patroon. De Stanford AI Index 2026 meet het verschil tussen het beste Amerikaanse en het beste Chinese model. In mei 2023 lag dat tussen de 17 en 31 procentpunt. In maart 2026 was het 2,7 procent.

Dat is opvallend, want het geld loopt totaal uiteen. Amerikaanse bedrijven staken vorig jaar $285,9 miljard in AI, Chinese $12,4 miljard. Een factor 23. China levert dus bijna-topkwaliteit voor een schijntje, en rekent dat door in zijn tarieven.

Ik wil het niet mooier maken dan het is. Onderzoeksinstituut Epoch AI komt op een nuchterder beeld: gemiddeld lopen Chinese modellen sinds 2023 zo'n zeven maanden achter op de Amerikaanse frontier. "Ingehaald" is te sterk. "Vlak erachter, en veel goedkoper" klopt beter. Dat gat van een paar maanden merk je bij de meeste taken amper. De prijs merk je wel.

Wat dit met je rekening doet

Het slimste model is voor de meeste organisaties allang slim genoeg. De winst zit in de prijs. Kost een model van bijna hetzelfde niveau vijf tot tien keer minder, dan verandert de rekensom onder alles wat op veel tokens leunt: een klantenchatbot, een pijplijn die duizenden documenten samenvat, een agent die de hele dag draait. Bij lage volumes merk je het amper. Bij hoge volumes beslist het of een project uit kan.

Mijn advies is simpel. Klink je opzet niet vast aan één leverancier. Houd je promptlogica en je evaluaties modelonafhankelijk, zodat je een goedkoper model erlangs legt en meet of het jouw taak even goed doet. Niet om meteen over te stappen, maar om de keuze te hébben.

Aan een Chinees model hangt wel een eigen afweging, en die is niet alleen technisch. Waar staan je data, en onder welke wet? Voor een open model als M3 dat je zelf draait, is dat antwoord anders dan voor een gesloten API in een Chinees datacenter. Net als bij Amerikaanse modellen is de echte vraag niet "welk model is het slimst?", maar "waar draait het, wie kan erbij, en wat doe ik als deze aanbieder wegvalt?". Het prijskaartje is verleidelijk. Laat het je governance niet overstemmen.

Volgende Stap

De kwaliteit van AI-modellen kruipt naar elkaar toe; het prijsverschil loopt juist uiteen. Daarmee is je modelkeuze een doorlopende afweging tussen kosten, prestaties en datacontrole, geen eenmalig besluit. Wij helpen je die afweging concreet maken: een onafhankelijke vergelijking op jouw taken, verplaatsbare prompt- en evaluatielogica, en een nuchtere blik op de risico's per leverancier.

→ Plan een AI Strategie Sessie of bekijk onze workshops voor teams.

Bronnen: MiniMax, Alibaba Cloud, Artificial Analysis, Stanford AI Index 2026 via The Next Web, Epoch AI en MarkTechPost. Headerbeeld: MiniMax. Volg de blog van AI Centrum Nederland om op de hoogte te blijven.

De prijs van intelligentie stort in: twee Chinese modellen zitten al op de Westerse top