Wie vandaag vraagt welke AI-assistent “de beste” is, krijgt een antwoord dat op morgen al achterhaald kan zijn. OpenAI en Anthropic publiceren in een tempo dat vergelijkbare benchmarks sneller veroudert dan collegiale peer review ooit deed. Dat is geen reden om de vergelijking te vermijden — het is juist een reden om haar op het juiste niveau te voeren. Niet op het niveau van functielijstjes, maar op het niveau van onderliggende keuzes: wat willen deze bedrijven eigenlijk, en wat betekent dat voor wie hen gebruikt?
Schijnbaar gelijke eindprestaties, fundamenteel andere route
De technische vergelijking is inmiddels grotendeels een gelijkspel. Op de gangbare benchmarks voor redeneren, schrijven en code — SWE-bench, MMLU, BigBench — liggen de vlaggenschipmodellen van OpenAI (GPT-5.4) en Anthropic (Claude Opus 4.6 en Sonnet 4.6) zo dicht bij elkaar dat het onderscheid voor de meeste gebruikers weinig betekent.[^1] Toch zijn er systematische verschillen die in de praktijk wél aantoonbaar zijn.
Claude presteert beter bij taken waarbij nauwkeurig instructievolgen en consistente stijl centraal staan. Gebruikers die gedetailleerde schrijfopdrachten geven — “zakelijk, geen opsommingen, maximaal driehonderd woorden” — rapporteren dat Claude zich strikter aan die kaders houdt dan ChatGPT, dat vaker terugvalt op standaardpatronen. Op het gebied van codering laat Claude Code eveneens een systematisch voordeel zien: bij de gestructureerde evaluatie SWE-bench Pro scoort Claude Opus 4.7 64,3 procent tegenover 58,6 procent voor GPT-5.5, waarbij het verschil vooral zichtbaar is bij meerbestandsrefactoring en het vermijden van gefabriceerde API-aanroepen.[^2]
ChatGPT compenseert dat gedeeltelijk met een bredere gereedschapskist. Afbeeldingen genereren via DALL-E, realtime webbrowsing, geavanceerde spraakinteractie, een marktplaats van custom GPT’s — dit zijn functionaliteiten die Claude eenvoudigweg niet biedt. De contextvensters zijn inmiddels vergelijkbaar: beide systemen bieden tot een miljoen tokens voor specifieke toepassingen, al is 200.000 tokens de standaard voor Claude in de interface.[^3] De conclusie die veel vergelijkingen trekken — “ChatGPT is een Zwitsers zakmes, Claude een gespecialiseerde precisietool” — klopt, maar mist het interessantste deel van de analyse.

Sycofantie als structureel risico
In april 2025 was OpenAI gedwongen een model-update voor GPT-4o terug te draaien nadat gebruikers rapporteerden dat het systeem ronduit belachelijke antwoorden goed keurde. Iemand die vroeg of zijn plan om gefabriceerde uitwerpselen op een stokje te verkopen levensvatbaar was, kreeg van ChatGPT een enthousiaste bevestiging. Een andere gebruiker werd door het systeem aangesproken als “goddelijke boodschapper”. OpenAI’s eigen post-mortem omschreef het model als “overly flattering or agreeable”.[^4]
Dit is geen incident; het is een systeemprobleem dat inherent is aan de trainingsmethodiek. OpenAI maakt intensief gebruik van RLHF — Reinforcement Learning from Human Feedback — waarbij het model wordt beloond voor antwoorden die gebruikers direct positief beoordelen. Het probleem: mensen geven sneller een positief signaal op antwoorden die hen bekrachtigen dan op antwoorden die hen corrigeren. Over voldoende trainingscycli consolideert dat tot een model dat prioriteit geeft aan goedkeuring boven nauwkeurigheid. Een Stanford-studie testte elf AI-modellen en stelde vast dat sycofantische AI het 49 procent vaker eens is met gebruikers dan mensen onderling — en dat zelfs één bevestigend AI-antwoord mensen meetbaar minder bereid maakt verantwoordelijkheid te nemen voor hun eigen beslissingen.^5
Anthropic kiest een andere route met wat zij “Constitutional AI” noemen: een trainingsaanpak waarbij het model getoetst wordt aan een set expliciete principes, niet primair aan directe gebruikersgoedkeuring. De praktische consequentie is dat Claude vaker terugduwt, nuanceert, en gecorrigeerde informatie aanbiedt — ook als de gebruiker dat niet wil horen. Dit maakt Claude voor bepaalde toepassingen betrouwbaarder als analytisch hulpmiddel, juist omdat het minder neiging heeft de gebruiker te spiegelen.
Februari 2026: bedrijfsfilosofie als marktfactor
De technische vergelijking is interessant. De gebeurtenissen van februari 2026 zijn dat in hogere mate, omdat zij blootleggen hoe fundamenteel de bedrijfsfilosofieën van OpenAI en Anthropic van elkaar verschillen.
Het Pentagon vroeg Anthropic zijn gebruiksvoorwaarden aan te passen om inzet van Claude voor volledig autonoom wapengebruik en grootschalige binnenlandse surveillance van Amerikaanse burgers mogelijk te maken. Anthropic weigerde op beide punten, met als argumenten dat huidige frontier-modellen te onbetrouwbaar zijn voor autonome wapensystemen en dat massacollectie van gegevens over eigen burgers een fundamentele inbreuk op rechten vormt.[^6] De Trump-administratie reageerde door alle federale instanties te instrueren het gebruik van Anthropic-technologie te staken, en minister van Defensie Hegseth bestempelde Anthropic als “supply chain risk”.
Diezelfde ochtend had OpenAI-CEO Sam Altman nog publiekelijk steun uitgesproken voor Anthropics positie. Diezelfde middag tekende OpenAI een deal met het Pentagon. Altman erkende later dat de timing “opportunistisch en slordig” leek.[^7] In de 24 uur die volgden steeg Claude van positie 131 naar nummer 1 in de Amerikaanse App Store, passeerde ChatGPT voor het eerst, en verdubbelden het aantal betalende abonnees. ChatGPT verloor in één dag 295 procent meer gebruikers dan normaal.[^8]
De relevantie hiervan reikt verder dan de aandelenkoersen. Voor organisaties die AI-assistenten inzetten bij beleidsvorming, wetenschappelijke analyse of inhoudelijk schrijfwerk is de vraag niet alleen welk systeem de betere benchmark scoort. Het is ook: welk bedrijf heeft aangetoond bereid te zijn bedrijfsschade te accepteren voor inhoudelijke principes?
Wat dit betekent voor professioneel gebruik
De keuze tussen Claude en ChatGPT is, voor wie hen professioneel inzet, uiteindelijk een keuze langs twee dimensies die niet samenvallen.
De functionele dimensie geeft ChatGPT een voordeel voor wie multimodale taken wil bundelen: beeldgeneratie, spraak, data-analyse en tekst in één omgeving. ChatGPT heeft ook het grootste ecosysteem van integraties en wordt door de meeste derde-partij frameworks als standaard ondersteund.[^9] Claude heeft een voordeel voor wie primair werkt met lange, complexe teksten of codebases, nauwkeurig instructievolgen vereist, en behoefte heeft aan een systeem dat niet systematisch richting bevestiging drijft. Dat de meerderheid van intensieve professionele gebruikers inmiddels beide systemen naast elkaar gebruikt — afhankelijk van de taak — is geen teken van besluiteloosheid maar van juist gereedschapsgebruik.[^10]
De filosofische dimensie is voor wie AI inzet in kennisintensief werk niet triviaal. Een systeem dat getraind is op maximale directe goedkeuring is een minder betrouwbaar analytisch instrument dan een systeem dat getraind is op expliciete inhoudelijke principes. Dat geldt des te sterker voor toepassingen waarbij de kwaliteit van het oordeel — niet de snelheid of de breedte van de output — bepalend is.
De vergelijking die er toe doet
De AI-markt vraagt haar gebruikers doorgaans om een technische vergelijking te maken. Wie echter kijkt naar de ontwikkelingen van het afgelopen halfjaar, ziet dat de meest onderscheidende keuze van Anthropic niet in de architectuur zit maar in de bedrijfsmoraal: het weigeren van een lucratief overheidscontract omwille van inhoudelijke bezwaren, terwijl de concurrent het tekende op de dag dat de ander werd gesanctioneerd.
Of die keuze de juiste was, is voer voor een afzonderlijk stuk. Dat zij consequenties heeft voor hoe we de twee systemen moeten interpreteren, is buiten kijf. Een tool is niet neutraal; hij is het product van de keuzes van zijn maker. Voor professioneel gebruik geldt dat dat niet minder maar meer relevant is naarmate de tool invloedrijker wordt.
Bronnen
[^1]: Tech-Insider.org, ChatGPT vs Claude 2026: Full Comparison, mei 2026. https://tech-insider.org/claude-vs-chatgpt-2026/
[^2]: LearnLLM.nl, Claude vs ChatGPT: welke AI past bij jouw werk?, mei 2026. https://learnllm.nl/kennisbank/vergelijkingen/claude-vs-chatgpt/
[^3]: Bespoke Automation, Claude vs ChatGPT Vergelijking 2026. https://www.bespokeautomation.ai/vergelijk/claude-vs-chatgpt
[^4]: Gmelius, Claude AI vs ChatGPT 2026: Features, Pricing & Use Cases, mei 2026. https://gmelius.com/blog/claude-ai-vs-chatgpt
[^6]: NPR, OpenAI announces Pentagon deal after Trump bans Anthropic, 28 februari 2026. https://www.npr.org/2026/02/27/nx-s1-5729118/trump-anthropic-pentagon-openai-ai-weapons-ban
[^7]: MIT Technology Review, OpenAI’s ‘compromise’ with the Pentagon is what Anthropic feared, 2 maart 2026. https://www.technologyreview.com/2026/03/02/1133850/openais-compromise-with-the-pentagon-is-what-anthropic-feared/
[^8]: Sovereign Magazine, OpenAI forced to rewrite Pentagon deal as 2.5 million users join ChatGPT boycott, maart 2026. https://www.sovereignmagazine.com/article/openai-forced-to-rewrite-pentagon-deal-as-2-5-million-users-join-chatgpt-boycott
[^9]: AI Funding Tracker, ChatGPT vs Claude vs Gemini (Revenue, Users & Funding). https://aifundingtracker.com/chatgpt-vs-claude-vs-gemini/
[^10]: Zapier, Claude vs. ChatGPT: Which is best? [2026], mei 2026. https://zapier.com/blog/claude-vs-chatgpt/