Heb je je ooit afgevraagd hoe vaak je een pak kaarten moet schudden voordat het écht willekeurig is? Of hoe Google precies weet welke webpagina je zoekt, zelfs als miljoenen relevant lijken? De antwoorden op deze schijnbaar uiteenlopende vragen vinden hun oorsprong in een bizarre wiskundige vete, meer dan een eeuw geleden in Rusland, die de weg plaveide voor een van de krachtigste concepten in de moderne wetenschap en technologie: Markovketens. Het verhaal is zo boeiend dat het lijkt alsof het uit een roman komt.
Alles begon in het turbulente Rusland van 1905, een tijd van politieke onrust en diepe verdeeldheid. Zelfs de ogenschijnlijk saaie wereld van de wiskunde bleef niet onaangetast door deze spanningen.
Een Wiskundige Vete en de Vrije Wil
Aan de zijde van de tsaar stond Pavel Nekrasov, bijgenaamd de ‘Tsaar van de Waarschijnlijkheid’. Hij was een diepreligieus man die stelde dat wiskunde gebruikt kon worden om concepten als de vrije wil en de wil van God te verklaren. Zijn intellectuele aartsvijand was Andrey Markov, een atheïst en socialist, bekend als ‘Andrey de Furieuze’. Markov had geen geduld voor onnauwkeurigheid, wat hij Nekrasovs werk vaak vond. Voor hem had wiskunde niets te maken met vrije wil of religie.
De kern van hun conflict lag in een fundamenteel idee van de waarschijnlijkheidsrekening: de Wet van Grote Aantallen. Deze wet stelt dat het gemiddelde resultaat van een reeks onafhankelijke gebeurtenissen, zoals het opgooien van een munt, steeds dichter bij de verwachte waarde komt naarmate je meer herhalingen uitvoert. Neem munt opgooien: na tien keer is de verhouding misschien 60/40, maar na duizend keer zit je waarschijnlijk heel dicht bij 50/50.
Nekrasov, net als Bernoulli die de wet bewees, geloofde dat deze wet alleen gold voor *onafhankelijke* gebeurtenissen. Hij ging echter een stap verder: als je de Wet van Grote Aantallen observeert, dan *moeten* de onderliggende gebeurtenissen wel onafhankelijk zijn. Hij keek naar sociale statistieken, zoals het aantal huwelijken of geboortes in België, en zag dat deze op de lange termijn stabiele gemiddelden vertoonden. Omdat deze cijfers de Wet van Grote Aantallen leken te volgen, concludeerde hij dat de beslissingen (trouwen, kinderen krijgen) onafhankelijk moesten zijn – en dus uitingen van vrije wil. Vrije wil was voor hem meetbaar, wetenschappelijk zelfs.
Markov vond dit absurd. Hij wilde bewijzen dat afhankelijke gebeurtenissen óók de Wet van Grote Aantallen konden volgen. Hij zocht naar een systeem waarin de ene gebeurtenis duidelijk afhing van de vorige. Hij vond dit in tekst, met name in het gedicht “Jevgeni Onegin” van Alexander Poesjkin.
Markov analyseerde 20.000 letters van het gedicht en keek hoe vaak een klinker op een klinker volgde, of een medeklinker op een klinker, enzovoort. Hij toonde aan dat letters *niet* onafhankelijk waren: de kans dat de volgende letter een klinker is, hangt sterk af van of de huidige letter een klinker of een medeklinker is. Vervolgens creëerde hij een voorspellende machine, een ‘keten’ waarin de volgende ’toestand’ (klinker of medeklinker) afhing van de huidige. Na veel stappen zag hij dat de verhouding klinkers/medeklinkers convergeerde naar de oorspronkelijke verhouding.
Andrey Markov had bewezen dat ook afhankelijke gebeurtenissen de Wet van Grote Aantallen konden volgen. Dit betekende dat sociale statistieken helemaal geen vrije wil bewezen. Zijn doorbraak, de Markovketen, liet zien hoe we waarschijnlijkheidsrekening konden toepassen op systemen waar alles met elkaar verbonden is – de echte wereld!
De Monte Carlo Methode en het Manhattan Project
Na Markovs ontdekking raakte de wereld niet meteen in rep en ro. Hijzelf schijnt onverschillig te zijn geweest over de praktische toepassingen van zijn ‘pure analyse’. Maar deze “paar krabbels op een schoolbord” zouden de loop van de geschiedenis veranderen.
Jaren later, tijdens de Tweede Wereldoorlog, werkten topwetenschappers aan het geheime Manhattan Project om de atoombom te ontwikkelen. Een van hen was Stanislaw Ulam. Ulam wilde begrijpen hoe neutronen zich gedragen in een kernbom. Uranium-235, het splijtbare materiaal, was schaars. Hoeveel was er precies nodig om een kettingreactie te veroorzaken?
Toen Ulam herstelde van een ernstige ziekte, doodde hij de tijd met een ogenschijnlijk eenvoudig kaartspel: Solitaire. Hij vroeg zich af wat de kans was om een willekeurig geschud spel te winnen. Het aantal mogelijke kaartarrangementen was astronomisch groot, analytisch oplossen was onbegonnen werk. Zijn inzicht: speel gewoon honderden spellen en tel de winnende.
Terug bij Los Alamos realiseerde Ulam zich dat dit idee ook kon worden toegepast op de neutronen. De interacties van triljoenen neutronen in een kern zijn onmogelijk direct te berekenen. Samen met John von Neumann ontwikkelde hij een methode: de Monte Carlo methode.
Neutronen gedragen zich *niet* onafhankelijk; hun pad hangt af van hun eerdere interacties. Hier kwamen Markovketens om de hoek kijken. Ze modelleerden het neutronengedrag als een keten: een neutron kan verstrooien, absorberen, of een splijting veroorzaken die weer nieuwe neutronen vrijgeeft. Door deze ‘ketens’ honderden keren te simuleren op de eerste elektronische computer, de ENIAC, konden ze de vermenigvuldigingsfactor (k) van de neutronen bepalen. Dit was cruciaal om te berekenen hoeveel uranium nodig was. De naam “Monte Carlo” werd gekozen vanwege de willekeurige simulaties en de hoge inzet, net als in een casino.
Hoe Google Ons het Web Leerde Vinden met PageRank
Na de oorlog verspreidde de Monte Carlo methode zich razendsnel. Maar de volgende revolutionaire toepassing van Markovketens zou een ander deel van ons leven transformeren: het internet.
Toen het internet in de jaren ’90 openbaar werd, ontstond een explosie aan informatie. Hoe vind je nog iets in die zee van webpagina’s? Vroege zoekmachines, zoals Yahoo, sorteerden pagina’s simpelweg op hoe vaak een zoekterm voorkwam. Dit was makkelijk te manipuleren: webpagina’s herhaalden trefwoorden honderden keren, vaak verborgen in witte tekst op een witte achtergrond. Wat ontbrak was een maatstaf voor *kwaliteit*.
Larry Page en Sergey Brin, twee PhD-studenten aan Stanford, zagen dit probleem. Ze bedachten dat links naar een pagina konden worden gezien als ‘aanbevelingen’. Hoe meer aanbevelingen, hoe belangrijker de pagina. Maar niet alle aanbevelingen zijn gelijk. Een link van een belangrijke site weegt zwaarder dan een link van een obscure site.
Ze modelleerden het hele internet als een gigantische Markovketen. Elke webpagina was een ‘staat’, en elke link was een ‘overgang’ naar een andere staat. Stel je voor dat je als een willekeurige surfer over het internet dwaalt. Je begint op een willekeurige pagina en klikt door. De kans dat je op een bepaalde pagina terechtkomt, wordt berekend door de Markovketen. De pagina’s waar de willekeurige surfer het meest belandt, zijn de ‘belangrijkste’. Dit algoritme noemden ze PageRank – een knipoog naar webpagina’s én naar Larry Page zelf.
Om te voorkomen dat de surfer vast kwam te zitten in een ‘doodlopende straat’ van links, introduceerden ze een “dempingsfactor”: 85% van de tijd volg je een link, maar 15% van de tijd spring je naar een willekeurige pagina. Dit zorgde ervoor dat alle pagina’s uiteindelijk bezocht konden worden en het systeem niet te manipuleren was met kunstmatige ‘linkfarms’. Met PageRank had Google een superieure zoekmachine gebouwd, en de rest is geschiedenis.
Van Tekstvoorspelling tot AI: De Erfenis van Markovketens
De invloed van Markovketens strekt zich uit tot in onze modernste technologie. Denk aan tekstvoorspelling in je e-mails of op je smartphone. Claude Shannon, de vader van de informatietheorie, borduurde in de jaren ’40 al voort op Markovs idee van tekstvoorspelling. Hij liet zien dat je steeds betere voorspellingen kunt doen over het volgende woord door meer van de voorgaande woorden in overweging te nemen.
Deze basisprincipes vormen de fundering van hedendaagse Large Language Models (LLM’s), de krachtpatsers achter AI zoals ChatGPT. Ze analyseren enorme hoeveelheden tekst en gebruiken geavanceerde Markovketens (en meer complexe neurale netwerken) om de waarschijnlijkheid van de volgende ’token’ (een letter, woord of leesteken) te voorspellen. Waar eenvoudige Markovketens alleen naar de directe voorganger kijken, gebruiken moderne LLM’s ook ‘aandacht’ (attention) om context over langere afstanden te begrijpen. Zo begrijpt een model dat ‘cel’ in ‘de structuur van de cel’ waarschijnlijk over biologie gaat, niet over een gevangeniscel.
Toch zijn er grenzen aan wat Markovketens – en zelfs hun complexere opvolgers – kunnen modelleren, vooral bij systemen met sterke feedbackloops. Denk aan klimaatverandering: hogere temperaturen leiden tot meer waterdamp, een krachtig broeikasgas, wat weer leidt tot hogere temperaturen. Zo’n positieve feedbackloop maakt voorspellingen enorm complex. Hetzelfde geldt voor LLM’s die hun eigen gegenereerde tekst als trainingsdata krijgen; dit kan leiden tot een “dode, stabiele staat” waarin de modellen steeds hetzelfde produceren.
Maar voor de meeste systemen die afhankelijk zijn van eerdere toestanden, blijft de kracht van Markovketens ongeëvenaard. Het mooie is de ‘geheugenloze eigenschap’: voor veel systemen hoef je niet de hele geschiedenis te kennen. Je hoeft alleen maar naar de *huidige* toestand te kijken om de volgende te voorspellen. Dit vereenvoudigt ongelooflijk complexe problemen, van het voorspellen van het weer tot het bepalen van de verspreiding van een ziekte. En dat allemaal dankzij een ruzie tussen twee Russische wiskundigen.
Veelgestelde Vragen
Wat zijn Markovketens?
Markovketens zijn wiskundige modellen die de waarschijnlijkheid van een reeks gebeurtenissen beschrijven, waarbij de waarschijnlijkheid van elke volgende gebeurtenis alleen afhangt van de *huidige* toestand, en niet van de gebeurtenissen die eraan voorafgingen. Deze eigenschap staat bekend als de “geheugenloze” eigenschap.
Waarvoor wordt de Monte Carlo methode gebruikt?
De Monte Carlo methode is een computationele techniek die gebruikmaakt van willekeurige sampling en Markovketens om complexe problemen op te lossen die analytisch te moeilijk zijn. Het wordt gebruikt in onder andere nucleaire fysica (Manhattan Project), financiële modellering, klimaatwetenschap en simulaties.
Hoe hangt PageRank samen met Markovketens?
Googles PageRank-algoritme modelleert het internet als een gigantische Markovketen. Elke webpagina is een ‘staat’, en links tussen pagina’s zijn ‘overgangen’. Het algoritme simuleert een willekeurige surfer die van pagina naar pagina klikt. De pagina’s waar deze surfer het meest terechtkomt, worden als het belangrijkst beschouwd en krijgen een hogere ranking in de zoekresultaten.


