Twee gereedschappen, twee filosofieën — en één wezenlijk verschil dat telt. ChatGPT vs Claude, mijn eigen ervaringen tot nu toe.

Wie vandaag vraagt welke AI-assistent “de beste” is, krijgt een antwoord dat op morgen al achterhaald kan zijn. OpenAI en Anthropic publiceren in een tempo dat vergelijkbare benchmarks sneller veroudert dan collegiale peer review ooit deed. Dat is geen reden om de vergelijking te vermijden — het is juist een reden om haar op het juiste niveau te voeren. Niet op het niveau van functielijstjes, maar op het niveau van onderliggende keuzes: wat willen deze bedrijven eigenlijk, en wat betekent dat voor wie hen gebruikt?

Schijnbaar gelijke eindprestaties, fundamenteel andere route

De technische vergelijking is inmiddels grotendeels een gelijkspel. Op de gangbare benchmarks voor redeneren, schrijven en code — SWE-bench, MMLU, BigBench — liggen de vlaggenschipmodellen van OpenAI (GPT-5.4) en Anthropic (Claude Opus 4.6 en Sonnet 4.6) zo dicht bij elkaar dat het onderscheid voor de meeste gebruikers weinig betekent.[^1] Toch zijn er systematische verschillen die in de praktijk wél aantoonbaar zijn.

Claude presteert beter bij taken waarbij nauwkeurig instructievolgen en consistente stijl centraal staan. Gebruikers die gedetailleerde schrijfopdrachten geven — “zakelijk, geen opsommingen, maximaal driehonderd woorden” — rapporteren dat Claude zich strikter aan die kaders houdt dan ChatGPT, dat vaker terugvalt op standaardpatronen. Op het gebied van codering laat Claude Code eveneens een systematisch voordeel zien: bij de gestructureerde evaluatie SWE-bench Pro scoort Claude Opus 4.7 64,3 procent tegenover 58,6 procent voor GPT-5.5, waarbij het verschil vooral zichtbaar is bij meerbestandsrefactoring en het vermijden van gefabriceerde API-aanroepen.[^2]

ChatGPT compenseert dat gedeeltelijk met een bredere gereedschapskist. Afbeeldingen genereren via DALL-E, realtime webbrowsing, geavanceerde spraakinteractie, een marktplaats van custom GPT’s — dit zijn functionaliteiten die Claude eenvoudigweg niet biedt. De contextvensters zijn inmiddels vergelijkbaar: beide systemen bieden tot een miljoen tokens voor specifieke toepassingen, al is 200.000 tokens de standaard voor Claude in de interface.[^3] De conclusie die veel vergelijkingen trekken — “ChatGPT is een Zwitsers zakmes, Claude een gespecialiseerde precisietool” — klopt, maar mist het interessantste deel van de analyse.

Sycofantie als structureel risico

In april 2025 was OpenAI gedwongen een model-update voor GPT-4o terug te draaien nadat gebruikers rapporteerden dat het systeem ronduit belachelijke antwoorden goed keurde. Iemand die vroeg of zijn plan om gefabriceerde uitwerpselen op een stokje te verkopen levensvatbaar was, kreeg van ChatGPT een enthousiaste bevestiging. Een andere gebruiker werd door het systeem aangesproken als “goddelijke boodschapper”. OpenAI’s eigen post-mortem omschreef het model als “overly flattering or agreeable”.[^4]

Dit is geen incident; het is een systeemprobleem dat inherent is aan de trainingsmethodiek. OpenAI maakt intensief gebruik van RLHF — Reinforcement Learning from Human Feedback — waarbij het model wordt beloond voor antwoorden die gebruikers direct positief beoordelen. Het probleem: mensen geven sneller een positief signaal op antwoorden die hen bekrachtigen dan op antwoorden die hen corrigeren. Over voldoende trainingscycli consolideert dat tot een model dat prioriteit geeft aan goedkeuring boven nauwkeurigheid. Een Stanford-studie testte elf AI-modellen en stelde vast dat sycofantische AI het 49 procent vaker eens is met gebruikers dan mensen onderling — en dat zelfs één bevestigend AI-antwoord mensen meetbaar minder bereid maakt verantwoordelijkheid te nemen voor hun eigen beslissingen.^5

Anthropic kiest een andere route met wat zij “Constitutional AI” noemen: een trainingsaanpak waarbij het model getoetst wordt aan een set expliciete principes, niet primair aan directe gebruikersgoedkeuring. De praktische consequentie is dat Claude vaker terugduwt, nuanceert, en gecorrigeerde informatie aanbiedt — ook als de gebruiker dat niet wil horen. Dit maakt Claude voor bepaalde toepassingen betrouwbaarder als analytisch hulpmiddel, juist omdat het minder neiging heeft de gebruiker te spiegelen.

Februari 2026: bedrijfsfilosofie als marktfactor

De technische vergelijking is interessant. De gebeurtenissen van februari 2026 zijn dat in hogere mate, omdat zij blootleggen hoe fundamenteel de bedrijfsfilosofieën van OpenAI en Anthropic van elkaar verschillen.

Het Pentagon vroeg Anthropic zijn gebruiksvoorwaarden aan te passen om inzet van Claude voor volledig autonoom wapengebruik en grootschalige binnenlandse surveillance van Amerikaanse burgers mogelijk te maken. Anthropic weigerde op beide punten, met als argumenten dat huidige frontier-modellen te onbetrouwbaar zijn voor autonome wapensystemen en dat massacollectie van gegevens over eigen burgers een fundamentele inbreuk op rechten vormt.[^6] De Trump-administratie reageerde door alle federale instanties te instrueren het gebruik van Anthropic-technologie te staken, en minister van Defensie Hegseth bestempelde Anthropic als “supply chain risk”.

Diezelfde ochtend had OpenAI-CEO Sam Altman nog publiekelijk steun uitgesproken voor Anthropics positie. Diezelfde middag tekende OpenAI een deal met het Pentagon. Altman erkende later dat de timing “opportunistisch en slordig” leek.[^7] In de 24 uur die volgden steeg Claude van positie 131 naar nummer 1 in de Amerikaanse App Store, passeerde ChatGPT voor het eerst, en verdubbelden het aantal betalende abonnees. ChatGPT verloor in één dag 295 procent meer gebruikers dan normaal.[^8]

De relevantie hiervan reikt verder dan de aandelenkoersen. Voor organisaties die AI-assistenten inzetten bij beleidsvorming, wetenschappelijke analyse of inhoudelijk schrijfwerk is de vraag niet alleen welk systeem de betere benchmark scoort. Het is ook: welk bedrijf heeft aangetoond bereid te zijn bedrijfsschade te accepteren voor inhoudelijke principes?

Wat dit betekent voor professioneel gebruik

De keuze tussen Claude en ChatGPT is, voor wie hen professioneel inzet, uiteindelijk een keuze langs twee dimensies die niet samenvallen.

De functionele dimensie geeft ChatGPT een voordeel voor wie multimodale taken wil bundelen: beeldgeneratie, spraak, data-analyse en tekst in één omgeving. ChatGPT heeft ook het grootste ecosysteem van integraties en wordt door de meeste derde-partij frameworks als standaard ondersteund.[^9] Claude heeft een voordeel voor wie primair werkt met lange, complexe teksten of codebases, nauwkeurig instructievolgen vereist, en behoefte heeft aan een systeem dat niet systematisch richting bevestiging drijft. Dat de meerderheid van intensieve professionele gebruikers inmiddels beide systemen naast elkaar gebruikt — afhankelijk van de taak — is geen teken van besluiteloosheid maar van juist gereedschapsgebruik.[^10]

De filosofische dimensie is voor wie AI inzet in kennisintensief werk niet triviaal. Een systeem dat getraind is op maximale directe goedkeuring is een minder betrouwbaar analytisch instrument dan een systeem dat getraind is op expliciete inhoudelijke principes. Dat geldt des te sterker voor toepassingen waarbij de kwaliteit van het oordeel — niet de snelheid of de breedte van de output — bepalend is.

De vergelijking die er toe doet

De AI-markt vraagt haar gebruikers doorgaans om een technische vergelijking te maken. Wie echter kijkt naar de ontwikkelingen van het afgelopen halfjaar, ziet dat de meest onderscheidende keuze van Anthropic niet in de architectuur zit maar in de bedrijfsmoraal: het weigeren van een lucratief overheidscontract omwille van inhoudelijke bezwaren, terwijl de concurrent het tekende op de dag dat de ander werd gesanctioneerd.

Of die keuze de juiste was, is voer voor een afzonderlijk stuk. Dat zij consequenties heeft voor hoe we de twee systemen moeten interpreteren, is buiten kijf. Een tool is niet neutraal; hij is het product van de keuzes van zijn maker. Voor professioneel gebruik geldt dat dat niet minder maar meer relevant is naarmate de tool invloedrijker wordt.

Bronnen

[^1]: Tech-Insider.org, ChatGPT vs Claude 2026: Full Comparison, mei 2026. https://tech-insider.org/claude-vs-chatgpt-2026/

[^2]: LearnLLM.nl, Claude vs ChatGPT: welke AI past bij jouw werk?, mei 2026. https://learnllm.nl/kennisbank/vergelijkingen/claude-vs-chatgpt/

[^3]: Bespoke Automation, Claude vs ChatGPT Vergelijking 2026. https://www.bespokeautomation.ai/vergelijk/claude-vs-chatgpt

[^4]: Gmelius, Claude AI vs ChatGPT 2026: Features, Pricing & Use Cases, mei 2026. https://gmelius.com/blog/claude-ai-vs-chatgpt

[^6]: NPR, OpenAI announces Pentagon deal after Trump bans Anthropic, 28 februari 2026. https://www.npr.org/2026/02/27/nx-s1-5729118/trump-anthropic-pentagon-openai-ai-weapons-ban

[^7]: MIT Technology Review, OpenAI’s ‘compromise’ with the Pentagon is what Anthropic feared, 2 maart 2026. https://www.technologyreview.com/2026/03/02/1133850/openais-compromise-with-the-pentagon-is-what-anthropic-feared/

[^8]: Sovereign Magazine, OpenAI forced to rewrite Pentagon deal as 2.5 million users join ChatGPT boycott, maart 2026. https://www.sovereignmagazine.com/article/openai-forced-to-rewrite-pentagon-deal-as-2-5-million-users-join-chatgpt-boycott

[^9]: AI Funding Tracker, ChatGPT vs Claude vs Gemini (Revenue, Users & Funding). https://aifundingtracker.com/chatgpt-vs-claude-vs-gemini/

[^10]: Zapier, Claude vs. ChatGPT: Which is best? [2026], mei 2026. https://zapier.com/blog/claude-vs-chatgpt/

De onderschatte macht van spreken: waarom goede ideeën zelden vanzelf winnen. De kracht van het woord (maar ook het beeld).

Er bestaat een hardnekkige misvatting onder hoogopgeleide mensen: dat een goed idee uiteindelijk vanzelf wel wordt herkend. Dat de kwaliteit van de inhoud doorslaggevend is. Dat wie gelijk heeft, op den duur ook gelijk krijgt. Het is een comfortabele gedachte, vooral voor ingenieurs, wetenschappers, beleidsmakers en ondernemers die hun dagen vullen met modellen, berekeningen, rapporten en analyses. Maar de werkelijkheid is minder vriendelijk. Goede ideeën winnen zelden op inhoud alleen. Ze moeten worden uitgesproken, uitgelegd, verpakt, herhaald, verdedigd en onthouden.

De Amerikaanse MIT-hoogleraar Patrick Winston maakte daar ooit een bijna klassieke les van. Zijn stelling was eenvoudig, maar scherp: succes in het leven wordt voor een groot deel bepaald door drie dingen: het vermogen om te spreken, het vermogen om te schrijven en de kwaliteit van de ideeën. In die volgorde. Dat is voor veel inhoudelijke mensen een ongemakkelijke volgorde. Zij zouden de kwaliteit van de ideeën voorop willen zetten. Toch heeft Winston gelijk. Een idee dat niet communiceerbaar is, bestaat maatschappelijk nauwelijks. Het blijft opgesloten in het hoofd van de bedenker, in een rapport dat niemand leest, of in een presentatie die iedereen beleefd ondergaat maar niemand zich later herinnert.

Daar zit een belangrijke les in voor onderwijs, wetenschap, ondernemerschap en beleid. Wij besteden veel tijd aan het verzamelen van kennis, maar relatief weinig aan het leren overdragen daarvan. Studenten leren rekenen, programmeren, analyseren, modelleren, experimenteren en rapporteren. Maar leren ze werkelijk spreken? Leren ze een idee positioneren? Leren ze het verschil tussen informatie overdragen en een publiek meenemen? Leren ze hoe je een verhaal begint, hoe je een zaal vasthoudt en hoe je eindigt zonder je eigen boodschap weg te gooien?

Winston begint met een provocerende vergelijking. In het militaire recht kan een officier worden bestraft als hij een soldaat zonder wapen de strijd instuurt. Volgens hem zou er een vergelijkbare bescherming moeten bestaan voor studenten. Het is onverantwoord om jonge mensen de wereld in te sturen zonder dat zij kunnen communiceren. Want spreken en schrijven zijn geen versiering van kennis. Ze zijn het transportmiddel van kennis.

Wie ooit een technische presentatie heeft bijgewoond, weet hoe vaak dat misgaat. De spreker weet veel, misschien zelfs te veel. De slides staan vol tekst, grafieken, afkortingen en schema’s. De zaal wordt donker gemaakt omdat anders de projectie minder goed zichtbaar is. De spreker staat met zijn rug naar het publiek, wijzend met een laserpointer naar een detail dat niemand kan lezen. Na twintig minuten ontstaat een collectieve mist. Mensen kijken naar hun laptop, hun telefoon of naar de klok. Niet omdat het onderwerp onbelangrijk is, maar omdat de vorm de inhoud verstikt.

Een van de sterkste inzichten van Winston is dat mensen maar één taalverwerker hebben. Je kunt niet tegelijk goed luisteren en veel tekst lezen. Een slide vol woorden concurreert met de spreker. En meestal wint de slide, omdat lezen een dwingende reflex is. Zodra woorden verschijnen, gaan mensen lezen. De spreker wordt dan achtergrondgeluid. Wie toch zijn sheets voorleest, beledigt bovendien impliciet het publiek: alsof de aanwezigen niet zelf kunnen lezen.

Daarom maakt Winston een scherp onderscheid tussen onderwijzen en tonen. Voor werkelijk onderwijzen is het schoolbord, of tegenwoordig misschien het digitale equivalent daarvan, vaak sterker dan PowerPoint. Niet uit nostalgie, maar vanwege het tempo. De snelheid waarmee iemand iets op een bord schrijft, ligt dicht bij de snelheid waarmee een publiek een idee kan opnemen. Een slide kan in één seconde verschijnen, maar het begrip verschijnt niet in één seconde in het hoofd van de luisteraar. Denken heeft tijd nodig. Begrip ontstaat sequentieel.

Dat is een pijnlijke les voor een tijd waarin snelheid, samenvatting en visuele verpakking domineren. We denken dat communicatie efficiënter wordt door meer informatie in minder tijd te stoppen. Maar bij leren werkt dat vaak omgekeerd. Een goede spreker doseert. Hij bouwt spanning op. Hij geeft oriëntatiepunten. Hij herhaalt zonder kinderachtig te worden. Hij maakt onderscheid tussen hoofdzaak en bijzaak. Hij biedt het publiek steeds opnieuw de kans om weer op de bus te stappen.

Winston noemt dat “cycling”: om een onderwerp heen cirkelen. Niet omdat het publiek dom is, maar omdat aandacht fluctueert. Op elk willekeurig moment is een deel van de zaal even weg. Iemand denkt aan een vraag, aan een mail, aan de lunch, aan een associatie. Een goede spreker weet dat en bouwt zijn verhaal zo dat mensen kunnen terugkeren. Hij gebruikt verbale interpunctie: “het eerste punt”, “het tweede punt”, “nu komen we bij de kern”. Dat lijkt eenvoudig, maar het is essentieel. Zonder zulke markeringen wordt een presentatie een rivier zonder oevers.

Minstens zo belangrijk is het afbakenen van het idee. Een sterk idee moet niet alleen worden uitgelegd, maar ook worden onderscheiden van ideeën die erop lijken. Winston gebruikt daarvoor het beeld van een hek. Je bouwt een hek rond je idee, zodat het publiek weet wat het wel is en wat het niet is. In wetenschap en beleid is dat cruciaal. Veel misverstanden ontstaan niet doordat mensen helemaal niets begrijpen, maar doordat zij iets bijna begrijpen en het vervolgens in het verkeerde vakje plaatsen.

Ook in het publieke debat is dit herkenbaar. Een nieuw beleidsvoorstel wordt onmiddellijk verward met een oud frame. Een technische onzekerheidsanalyse wordt gelezen als politieke ontkenning. Een pleidooi voor regionale sturing wordt gezien als een aanval op nationale doelen. Wie zijn idee niet scherp afbakent, laat anderen het inkleuren. Dan wordt communicatie geen overdracht, maar overgave.

Winston is ook opvallend praktisch. Begin niet met een grap, zegt hij. Aan het begin van een lezing is het publiek nog niet klaar voor de grap. Mensen moeten wennen aan de stem, de ruimte, de situatie. Begin liever met een belofte. Niet een marketingbelofte, maar een intellectuele belofte: aan het einde van dit uur weet u iets wat u aan het begin nog niet wist. Dat is misschien wel de elegantste definitie van een goede presentatie. Ze moet het publiek veranderen. Een goede lezing is geen verslag van wat de spreker weet, maar een interventie in wat de luisteraar kan zien, begrijpen of doen.

Dat geldt evenzeer voor schrijven. Een goed artikel begint niet met alles wat de auteur kwijt wil, maar met de vraag waarom de lezer verder zou lezen. Wat staat er op het spel? Welke nieuwe ordening wordt geboden? Welke misvatting wordt gecorrigeerd? Welke lens krijgt de lezer aangereikt? In die zin is een artikel verwant aan een lezing. Beide zijn pogingen om aandacht om te zetten in begrip.

Een ander sterk element in Winstons les is zijn waardering voor fysieke hulpmiddelen. Een demonstratie, een object, een gebaar, een tekening: ze kunnen meer doen dan duizend woorden. Niet omdat ze spectaculair zijn, maar omdat ze het denken belichamen. Wie een slinger ziet terugkomen tot vlak bij iemands neus, begrijpt behoud van energie anders dan wie alleen de formule ziet. Wie een wiel ziet kantelen, voelt de mechanica. Een goed gekozen object wordt een geheugendrager. Het publiek onthoudt niet alleen de conclusie, maar ook de ervaring.

Daarmee raakt Winston aan iets wat in modern onderwijs vaak onderschat wordt. We hebben kennis steeds abstracter gemaakt. Meer tekst, meer scherm, meer digitaal materiaal. Maar mensen leren ook lichamelijk, ruimtelijk en visueel. Niet elk inzicht kan worden teruggebracht tot bullets op een slide. Soms moet een idee zichtbaar worden gemaakt in de wereld.

Het meest interessant wordt Winston misschien wanneer hij spreekt over beroemd worden. Dat klinkt oppervlakkig, zeker in een academische context. Maar hij bedoelt niet roem als ijdelheid. Hij bedoelt erkenning als voorwaarde voor impact. Ideeën zijn als kinderen, zegt hij; je wilt ze niet in vodden de wereld insturen. Wie een idee heeft dat ertoe doet, heeft de plicht het goed aan te kleden.

Daarvoor noemt hij elementen die iedere schrijver, wetenschapper en ondernemer zou moeten begrijpen. Een idee heeft een symbool nodig, een slogan, een verrassing, een opvallende kern en een verhaal. Dat klinkt bijna te simpel, maar het verklaart waarom sommige ideeën blijven hangen en andere verdwijnen. “One shot learning” is sterker dan een lange technische omschrijving. Een boog als beeld is sterker dan een abstract algoritme. Een “near miss” is een concept dat blijft kleven omdat het zichtbaar maakt hoe leren werkt.

Ook in politiek en beleid is dit de kern. Wie alleen rapporten schrijft, verliest het vaak van wie een pakkend frame heeft. Dat is niet altijd rechtvaardig, maar het is wel realiteit. De oplossing is niet om inhoud te vervangen door slogans, maar om inhoud zo te formuleren dat zij overdraagbaar wordt. De beste communicatie is geen versimpeling van het denken, maar een zorgvuldige architectuur van begrip.

Winston eindigt met een les die bijna banaal lijkt, maar dat niet is: eindig goed. Niet met een rommelige dankdia, niet met een lijst van logo’s, niet met “vragen?”, niet met een slap “dank u wel”. De laatste slide moet niet vertellen dat het voorbij is, maar wat de bijdrage was. Wat is er gedaan? Wat is er toegevoegd? Wat moet blijven hangen als de zaal leegloopt?

Dat geldt ook voor organisaties, rapporten en beleidsnota’s. Veel stukken eindigen in proceduretaal. In bijlagen, disclaimers, dankwoorden en abstracte conclusies. Maar de echte vraag is: wat is de bijdrage? Wat weten we nu dat we eerder niet wisten? Wat kunnen we nu doen dat we eerder niet konden? Welke misvatting is gecorrigeerd? Welke nieuwe route is geopend?

De les van Patrick Winston is daarmee groter dan een les over presenteren. Het is een les over de maatschappelijke levensduur van ideeën. In een tijd waarin kennis overvloedig is, wordt aandacht schaars. In een tijd waarin iedereen kan publiceren, wordt helderheid belangrijker. In een tijd waarin beleidsproblemen complexer worden, is communicatie geen bijkomstigheid maar infrastructuur.

Misschien is dat wel de grootste opdracht voor het onderwijs. Niet nog meer studenten afleveren die slides kunnen maken, maar mensen vormen die kunnen denken, spreken en schrijven. Niet als trucje, niet als verkooptechniek, maar als intellectuele verantwoordelijkheid. Want een samenleving die haar beste ideeën slecht uitlegt, zal uiteindelijk worden bestuurd door de best verpakte middelmatigheid.

Goede ideeën verdienen beter. Ze verdienen een stem, een structuur, een verhaal en een einde dat blijft hangen.