Samenvatting: Deze week ging het over de laag onder de modellen: de chips. OpenAI onthulde zijn eerste eigen processor, de Jalapeño, gebouwd met Broadcom om minder afhankelijk te zijn van Nvidia. Tegelijk reisde de Nederlandse handelsminister naar Washington om ASML te verdedigen tegen nieuwe Amerikaanse exportregels. Boven op de chiplaag werden de agents praktischer: Google zette computer use in zijn goedkoopste model, Mistral bracht een self-hostbaar document-AI-model uit, en Anthropic liet Claude meelezen in je Slack. En een geruststellend cijfer voor wie zich zorgen maakt over banen: engineers blijken juist het minst te krimpen.

OpenAI bouwt zijn eigen chip om van Nvidia af te komen

De Jalapeño is gemaakt voor één ding: modellen draaien

OpenAI heeft een chip. Op 24 juni onthulde het bedrijf de Jalapeño, zijn eerste eigen processor, ontworpen samen met Broadcom. De chip doet maar één ding, en doet dat bewust: inference. Dat is het draaien van een al getraind model wanneer jij een vraag stelt. Niet het trainen, wel het antwoorden.

De samenwerking met Broadcom liep al sinds oktober 2025. Dit is de eerste tastbare chip die eruit komt, na negen maanden van ontwerp tot tape-out. President Greg Brockman legde de logica plat uit:

"We have a deep understanding of the workload. We've really been looking for specific workloads that are underserved."

— Greg Brockman, President OpenAI (TechCrunch)

De inzet is kosten. Inference is inmiddels de grootste rekening van een AI-bedrijf, want elk gesprek, elke coding-sessie en elke agent-run kost rekenkracht. Wie die rekening met eigen silicium kan drukken, hoeft minder van Nvidia te kopen. OpenAI verwoordt het als controle over de hele keten:

"OpenAI operates across the stack, [so] each layer can be optimized around the same goal: making its models faster, more reliable, and more affordable for users."

— OpenAI, bedrijfsverklaring (TechCrunch)

Geloof het prestatiecijfer pas als iemand het natrekt

OpenAI claimt dat de Jalapeño per watt "substantieel beter" presteert dan de huidige beste chips. Mooi getal. Alleen komt het uit OpenAI's eigen labtests, en het technische rapport volgt pas "in de komende maanden" (SiliconANGLE). Neem het dus voor wat het is: een richting, geen feit. De uitrol op gigawatt-schaal staat gepland vanaf eind 2026.

En laten we eerlijk zijn over de primeur. Google draait al jaren op eigen TPU's, Amazon op Trainium, Meta op MTIA. OpenAI was het laatste grote lab dat volledig aan Nvidia hing. Dit is geen primeur, dit is bijbenen.

De chip ligt in een datacenter, het effect ligt op je factuur

Niemand verkoopt je een Jalapeño. Hij draait in OpenAI's datacenters. Toch raakt hij je, op termijn, via de prijs. Als OpenAI zijn inferentiekosten echt omlaag krijgt, kan dat de tokenprijzen drukken, of in elk geval het tempo van prijsverlagingen vasthouden. Reken er niet op dat het morgen gebeurt. Maar de richting is helder: de labs proberen de kostenkant onder controle te krijgen, want die liep uit de hand. Wie zijn AI-budget voor 2027 plant, kan beter rekenen met "prijzen blijven dalen, langzaam" dan met de tarieven van vandaag.

De chipoorlog staat nu voor de deur in Veldhoven

Vorige week ging het hier over een Amerikaanse minister die een model kon uitzetten (week 25). Deze week zakt het conflict een laag dieper, naar de machines die de chips maken. En daar staat een Nederlands bedrijf middenin.

De Nederlandse handelsminister Sjoerd Sjoerdsma reisde naar Washington. Reden: het MATCH Act, een wetsvoorstel dat de exportban naar China zou uitbreiden naar ASML's oudere lithografiemachines, de DUV-immersiesystemen. De ban op de allernieuwste EUV-machines bestaat al. Dit zou ook tien jaar oude techniek treffen. Sjoerdsma noemde zijn eigen reis ongebruikelijk:

"It's exceptional that I'm coming here to broadly outline our concerns to Congress."

— Sjoerd Sjoerdsma, Nederlands handelsminister (TechCrunch)

Waarom dit telt voor een Nederlandse lezer: ASML is het waardevolste bedrijf van Europa en de enige ter wereld die de geavanceerde machines maakt waarmee AI-chips worden gemaakt. Volgens TechCrunch is China goed voor 19% van ASML's netto-systeemverkoop. Een vijfde van de hardware-omzet hangt dus aan een markt die Washington wil dichtdraaien. ASML-CEO Christophe Fouquet wees er eerder al op dat het om verouderde techniek gaat:

"what China can currently buy are older-generation deep ultraviolet tools, gear first shipped about a decade ago."

— Christophe Fouquet, CEO ASML (TechCrunch)

De les is breder dan ASML. Europa zit klem tussen twee blokken die het niet zelf bestuurt. Voor wie hier zaken doet, betekent dat: leveranciersrisico is niet langer alleen een vraag over één bedrijf, maar over welke regering invloed heeft op je hele keten. Heb je hardware, modellen of cloud die door één land kunnen worden geblokkeerd, zet dat dan in je risicoregister. Niet als doemscenario, wel als scenario.

Computer use zit nu in Google's goedkoopste model

Google bracht op 24 juni computer use naar Gemini 3.5 Flash, het snelle en goedkope model dat op I/O debuteerde (week 21). Computer use betekent dat een agent je scherm kan zien en bedienen: klikken in een browser, een mobiele app gebruiken, een desktopprogramma aansturen. Tot nu toe zat dat in een apart, duurder Gemini 2.5-model. Nu is het een ingebouwde functie van de goedkope variant.

Product manager Mateo Quiros van Google DeepMind vatte het kort samen:

"Computer use is now a built-in tool in Gemini 3.5 Flash to build agents that can interact across platforms."

— Mateo Quiros, Product Manager Google DeepMind (Google)

Anthropic deed computer use al in 2024, OpenAI volgde met agents die taken uitvoeren. Het nieuws is dus niet de functie zelf, maar de prijs. Wat een premium-feature was, zit nu in het instapmodel. Daarmee wordt het goedkoop genoeg om een agent eindeloos te laten klikken in een testomgeving of een saai formulierproces.

Daar zit ook het addertje. Een agent die je desktop bedient, is een nieuw aanvalsoppervlak. Een kwaadaardige instructie in een webpagina of document kan de agent kapen, het zogeheten prompt injection. Google erkent het risico en zegt er "gerichte adversarial training" tegenin te zetten. Dat is geruststellend en zorgwekkend tegelijk: je traint er pas tegen als het een echt probleem is.

Wil je hier iets mee, begin dan klein en gesloten. Laat een agent een proces draaien in een afgeschermde omgeving zonder toegang tot productiesystemen of echte klantdata. Meet wat hij doet voordat je hem ergens op loslaat waar fouten geld kosten. En controleer of dit via de Gemini API ook binnen de EU mag draaien, want dat staat in de aankondiging niet hard.

Mistral OCR 4 draait op je eigen servers

Een document-AI-model is zelden voorpaginanieuws. Voor een Nederlandse organisatie die werkt met facturen, contracten of formulieren is het dat wel. Het Europese Mistral bracht op 23 juni OCR 4 uit: een model dat documenten omzet in gestructureerde, machine-leesbare data. Niet alleen de tekst, maar ook waar die tekst staat (bounding boxes), wat het is (een titel, een tabel, een handtekening) en hoe zeker het model is per woord.

Twee dingen maken het relevant voor dit publiek. Het model kan 170 talen aan. En het is self-hostbaar in één container. Dat laatste is geen technisch detail: het betekent dat je gevoelige documenten kunt verwerken zonder ze naar een externe cloud te sturen. Voor wie met de AVG en straks de AI-verordening worstelt, is "de data blijft op onze eigen servers" vaak het verschil tussen wel en niet mogen.

De prestatiecijfers komen van Mistral zelf, dus weeg ze met gezond wantrouwen. Volgens Mistral verkiezen onafhankelijke beoordelaars OCR 4 boven elk getest concurrerend systeem. Een klant verwoordde het concreter:

"Equivalent accuracy at roughly 8x lower cost and 17x lower latency."

— Aidan Donohue, AI Engineer bij Rogo (Mistral)

De prijs is helder: $4 per 1.000 pagina's via de API, $2 met de Batch-korting. Beschikbaar via Mistral Studio, Amazon SageMaker, Microsoft Foundry en Snowflake, met self-hosting voor enterprise.

Heb je een proces waar nu mensen handmatig data uit pdf's overtikken, dan is dit het soort tool om een week op te testen. Pak je grootste, saaiste documentstroom. Reken uit wat het handwerk nu kost en zet daar de $4 per 1.000 pagina's naast. Dat is een businesscase die je directie in één tabel begrijpt.

Claude leest voortaan mee in je Slack

Anthropic zette Claude deze week neer als teamgenoot in Slack. Claude Tag, heet het. Je tagt @Claude in een kanaal en het model bouwt geheugen op: het leest mee, onthoudt de context van dat kanaal en pakt werk op waar een collega het liet liggen. Anthropic beschrijft het zo:

"As Claude follows along with its channel, it learns ever more about the work."

— Anthropic (TechCrunch)

Dat klinkt handig, en dat is het ook. Maar lees die zin nog eens met een governance-bril op. Een model dat "steeds meer leert over het werk" door mee te lezen in je Slack, bouwt een geheugen op van wat er in je organisatie gebeurt. Wie ziet dat geheugen? Waar staat het? Mag het weg als een medewerker vertrekt?

Anthropic heeft daar antwoord op, en dat is het vermelden waard. Het geheugen is channel-scoped: een Claude in het juridische kanaal kan zijn kennis niet doorsluizen naar engineering. Beheerders bepalen welke kanalen en tools Claude mag zien. Dat is precies de geruststelling die een privacy-officer wil horen. Het blijft wel een belofte van de leverancier, geen bewijs. Het zit in beta voor Claude Enterprise en Team.

Voor je hier iets mee doet: behandel Claude Tag als een nieuwe medewerker met toegang tot je interne communicatie. Je zou een stagiair ook niet zomaar in elk Slack-kanaal zetten. Bepaal eerst welke kanalen geschikt zijn, welke data daar langskomt en wie de toegang beheert. En zoek uit of dit binnen de EU draait voordat je gevoelige kanalen openzet.

Engineers blijken het minst te krimpen, niet het meest

Twee jaar lang was het de stelling: AI gaat de programmeurs als eerste vervangen. Nieuwe data zegt het omgekeerde. Durfkapitalist SignalFire bracht zijn State of Talent Report 2026 uit, en de cijfers verrassen.

De aantallen, volgens de SignalFire-data zoals samengevat door TechCrunch: de totale aanwerving bij grote techbedrijven daalde met 25% ten opzichte van 2019. Engineering-rollen daalden maar met 11%. Sterker, engineers waren in 2025 goed voor 55% van alle nieuwe aanwervingen, tegen 46% in 2019. Vroege startups namen zelfs 7% meer engineers aan dan voor de pandemie. Onderzoeksbaas Asher Bantock van SignalFire verklaart het simpel:

"They're suddenly a lot more productive, and there's endless work for them to do."

— Asher Bantock, head of research SignalFire (TechCrunch)

De logica is dat AI engineers niet vervangt, maar versnelt. Een productievere engineer maakt meer af, en er ligt altijd meer werk klaar. Het zijn juist de routinematige, goed te beschrijven taken die het eerst onder druk staan, niet het bouwwerk zelf.

Voor een HR- of IT-manager in Nederland is dit een nuchtere correctie op de paniekverhalen. Plan je personeel niet op de aanname dat AI hele functies wegvaagt. Plan op verschuiving binnen functies: welke taken neemt AI over, en wat doen die mensen dan met de vrijgekomen tijd. Dat is een opleidings- en herinrichtingsvraag, geen ontslagvraag.

Verder deze week

OpenAI lanceerde Patch the Planet, onderdeel van zijn nieuwe beveiligingsinitiatief Daybreak, samen met securitybedrijf Trail of Bits. Beveiligingsengineers helpen open-source-onderhouders bugs te vinden en te repareren voordat ze de toch al overbelaste maintainer bereiken (TechCrunch). Goed nieuws als je software op open-source bouwt, wat vrijwel iedereen doet.

En het tokenfeest van begin dit jaar slaat door naar het tegenovergestelde. Waar bedrijven hun mensen eerst aanspoorden om vooral véél AI te gebruiken, knijpen ze nu het gebruik af. Accenture beperkt AI voor routineklusjes. "AI is becoming material to the cost structure," zei Justice Kwak van Accenture (TechCrunch). Het sluit aan op de budgetdiscipline waar we vorige week al over schreven: de rekening is binnen, en bedrijven zoeken de rem.

Wat ik deze week zou regelen

Eén ding bindt de chips en de agents van deze week: de afhankelijkheid kruipt dieper. Niet alleen welk model je gebruikt, maar welke chip eronder ligt, welke regering die chip kan blokkeren, en welke AI er meeleest in je interne kanalen.

Dus drie korte vragen voor maandag, en het zijn er bewust geen tien. Welke van je AI-leveranciers hangt aan hardware of een land dat buiten je controle valt? Als je met agents of computer use wilt experimenteren, draait dat dan in een afgeschermde omgeving, los van je productiedata? En weet je, als je Claude of een vergelijkbaar model in je Slack zet, wie het opgebouwde geheugen beheert?

Wie die drie kan beantwoorden, gebruikt AI zonder zich eraan over te leveren. Dat is het hele spel dit jaar.

Volgende Stap

Deze week laat zien dat AI-keuzes steeds meer governance-keuzes zijn: over afhankelijkheid, data en risico. Wij helpen je die vertalen naar concrete adoptie-stappen die jouw IT-afdeling én je directie kunnen dragen.

→ Plan een AI Strategie Sessie of bekijk onze workshops voor teams.

AI Nieuws Week 26 2026: OpenAI's eigen chip, ASML onder vuur en Mistrals document-AI