Hoe sterk is een wereldkampioen
Hoe sterk is een wereldkampioen? door Manuel Nepveu
Lang geleden, toen ik de winsten van een zekere oliemaatschappij stelselmatig zat te verminderen in een laboratorium in Rijswijk, had ik regelmatig heel aardige discussies gedurende de lunchpauzes. Geen gemier over tweede huizen, de opties op Senegalese aardappelen, het belastingklimaat op de Seychellen.
Met één discussiepartner in het bijzonder, waren die gesprekken meer-dan-normaal plezant. Hij had even als ikzelf de neiging zich te vermeien in kwesties die er niet toe doen, geen druppel olie extra opleveren, maar die tenminste het voordeel hebben wel een eenduidig antwoord te bezitten.
Zo ontdekten we ooit in eendrachtige samenwerking en binnen het halve uurtje van een lunchpauze hoe te bewijzen dat er maar vijf Platonische lichamen bestaan, uitgaande van Eulers grootse en meeslepende polyederstelling (H+V=R+2, voor degenen die aan een half woord genoeg hebben)
Een wereldschokkende ontdekking was dat natuurlijk niet, want dat met die Platonische lichamen is vermoedelijk al een kleine 2500 jaar bekend en bewezen is het ook allang. Wij waren dus volsterkt ijdel bezig, ijdel en winderig, winderig en nutteloos, nutteloos en ……o zo stimulerend.
Deze persoon was tevens schaker en speelde in een club die ons eenmaal waarlijk grootmeesterlijke tegenstand bood. Alweer een raakvlak dus.
Tijdens een van de lunchpauzes kwam hij met de nogal voor de hand liggende opmerking dat de wereldkampioen dammen waarschijnlijk minder van het gemiddelde niveau in die tak van denksport verwijderd is dan de wereldkampioen schaken van het gemiddelde niveau van zijn stiel. Immers, er zijn aanzienlijk minder dammers dan schakers en derhalve is de voorwaarde om de sterkste te zijn minder stringent. Ja, logo. Dat is nou nog niet zo spannend.
Maar fysici onder elkaar laten heel gemakkelijk zaken volledig uit de hand lopen en dus kwam binnen de kortste keren de volgende vraag bovenborrelen:
Welke sterkte moet een wereldkampioen minstens bezitten als er N personen in zijn discipline (welke dan ook!) actief zijn?.
Een onschuldige vraag, die geen druppel olie extra oplevert, maar met -naar ik meen- een volstrekt eenduidig antwoord.
De discussie hieromtrent werd gevoerd in de gang bij een van de koffie-automaten, terwijl ik met een been op de grond en met de ander tegen de muur steunde, een gemakkelijke houding als je over belangrijke dingen converseert.
Toen ik mijn bekertje leeg had waren we het er over eens dat dit in principe geen al te lastig probleem kon zijn, maar dat er toch minstens een zakjapanner ingezet moest worden om het antwoord te krijgen. De discussie eindigde met die vaststelling, want ik moest hem ook nog even met een afgebroken stelling helpen en daarna riep de arbeid toch wel weer. Nadien hebben we dit thema niet meer opgenomen.
Recentelijk, en inmiddels een aantal jaren na de bovenvermelde discussie, kwam de vraag weer eens in mijn grijze soep bovendrijven.
Niet helemaal toevallig, denk ik. Bij mijn huidige werkzaamheden staat de waarschijnlijkheids-rekening centraal en met name komen principiële aspecten met betrekking tot kansverdelingen daarbij heftig aan bod en dat is ook bij dit probleempje het geval -al zal ik daar in het volgende verder niet over reppen.
Als we sterkte vereenzelvigen met rating komt de vraag op het volgende neer:
Welke rating moet een wereldkampioen minimaal bezitten?
De ratings van schaakspelers zijn verdeeld volgens een kansverdeling die grafisch weergegeven wordt door de hoed van Napoleon. Men zou die kansverdeling daarom misschien de Napoleontische Verdeling kunnen noemen, maar zo staat hij niet in de literatuur bekend. Meestal wordt hij genoemd naar de Duitse wiskundige Gauss (1777-1855), princeps mathematicorum, eerste der mathematici. Niet dat die de verdeling heeft uitgevonden, maar hij heeft er in zijn wetenschappelijke leven behoorlijk uitbundig mee gespeeld. Ook de namen van de voortreffelijke hugenoot DeMoivre en de niet minder voortreffelijke wis-en sterrenkundige Laplace worden somtijds aan deze verdeling gehangen. Daar is beslist niets op tegen. Tenslotte wordt ook de term “Normale Verdeling” gebruikt voor deze parel. En dat is minder, want een staaltje van taalkundige fantasieloosheid dat wiskundigen onwaardig zou behoren te zijn. In ieder geval is het veelzeggend dat zoveel aanduidingen voor deze verdeling voorkomen. Een aanduiding van zijn belangrijkheid?

Deze ‘hoed van Napoleon’ (Figuur 1) laat zien dat er weinig extreem sterke schakers zijn, maar ook weinig extreem zwakke en dat de massa van de spelers rond een gemiddelde waarde “klontert”.
De mate van klontering wordt aangegeven met de term standaard-deviatie en traditioneel aangegeven met de Griekse letter sigma. In de Gaussische verdeling zit 68% van alle spelers gezellig samengeklonterd binnen één standaard-deviatie rond het gemiddelde; 95% van alle spelers is minder dan twee standaard-deviaties (“twee sigma” in het jargon) van het gemiddelde verwijderd; verder dan drie sigma zitten nog slechts promillen, de ongezelligen, de afwijkenden.
Na deze inleiding over de speelsterkte-verdeling kunnen we verder. Laten we de man of vrouw met de hoogste rating de wereldkampioen noemen. Of de FIDE er zo over denkt is van geen belang; WIJ noemen wereldkampioen de persoon met de hoogste rating.
Laten we aannemen dat deze kampioen een rating heeft ter grootte R. Deze rating is dus bij onze definitie van wereldkampioen de hoogste van alle ratings die door nu bestaande personen op dit moment worden bezeten. Laten we alle schakers op een rij zetten en ze -heel oneerbiedig- een nummer geven. Dan wil het voorgaande zeggen:
Schaker 1 heeft een rating onder de R
en
Schaker 2 heeft een rating onder de R
en
Schaker 3 heeft een rating onder de R
en
.
.
.
en
Schaker 15.774.205 heeft een rating onder de R
en
.
.
De kans dat aan al deze condities tegelijkertijd wordt voldaan kan worden berekend door de individuele kansen te vermenigvuldigen.
En nu komt de Napoleontische Hoed, de Gaussische Verdeling in het spel. Om die individuele kansen te bepalen hebben we de bovenstaande Gaussische Verdeling nodig. De kans om een sterkte onder R te hebben correspondeert met het oppervlak onder de kromme links van R. We moeten dus oppervlakken onder de grafiek van de verdeling kunnen berekenen (en liefst een beetje handig om tijd te besparen).
De rating R van de wereldkampioen zal nu zodanig hoog moeten zijn dat de voorgaande vermenigvuldiging minstens een kans van een half oplevert. Dat betekent dan dat het waarschijnlijker is dat alle voorgaande personen zwakker zijn dan R, dan dat er toch nog grapjassen van die groep hoger komen dan die rating.
De berekening is dus in principe simpel, maar een computer heb je wel nodig, ook al is die in een milli-seconde klaar met zijn opgave. Het resultaat is, dat een totale schaakbevolking van honderd miljoen zielen een wereldkampioen vereist die op z’n minst meer dan 5,3 sigma boven het gemiddelde zit. Hoger stijgen vergroot de “kampioenskansen”, dalen maakt een en ander onwaarschijnlijk.
Trouwens, de schatting van honderd miljoen schaakzielen kon wel eens wat ruim zijn, maar ook als er een factor twee of drie af moet blijft de eis dat 5 sigma boven Jan Schaakmodaal absoluut noodzakelijk is.
Helaas is een toetsen van het bovenstaande aan de situatie in de schaakwereld niet mogelijk, omdat er geen volledige, niet-selectieve internationale lijst bestaat.
De enige mij bekende internationale lijst, de lijst die door de FIDE half-jaarlijks wordt gepubliceerd, bevat alleen spelers die bij binnenkomst daarop een bepaalde (niet lage) minimum-tpr bij elkaar hadden geschaakt. De lijst lijdt dus extreem hevig aan selectie-effecten.
Maar hetzelfde procédé dat we zojuist hebben besproken kunnen we natuurlijk ook volgen ten aanzien van de Nederlandse kampioen. Hierbij mag je hopen over iets betrouwbaarder gegevens te beschikken in de vorm van de KNSB-ratinglijst.

Uit figuur 2 is duidelijk dat de Nederlandse kampioen (per definitie dus weer de man of vrouw met de hoogste rating, niet per se de persoon die daadwerkelijk Nederlands Kampioen is) minstens wel 4 sigma boven het maaiveld moet zitten wil hij een kans hebben van meer dan een half om de rating-sterkste te zijn in een veld van 27.000 clubspelers.
Helaas is echter ook de KNSB-lijst met iets meer dan10.000 opgevoerde schakers nog niet volledig. De mediaan van de lijst ligt bij 1700, zoals met wat “scrollen” snel is vast te stellen. In een symmetrische verdeling zou dit dan ook het gemiddelde zijn. Maar het gemiddelde van alle clubschakers is beslist niet 1700, maar 100-200 punten lager, wegens selectie-effecten die ieder zelf kan bedenken (Hoe vaak gaat U naar een toernooi, meneer-met-een-virtuele-rating-van-1300?).
Een standaard-deviatie van rond 250-300 voor de hele Nederlandse clubschakers-populatie lijkt een goede schatting.
De Nederlands kampioen zou dus minstens 1100 ratingpunten meer moeten hebben dan het gemiddelde en dus hebben we het over een Nederlands kampioen van minstens 2600. Deze schatting kan niet als hopeloos bezijden de waarheid worden afgedaan.
Tot slot kunnen we eens kijken hoe sterk je moet wezen om de rating-sterkste te zijn van een club met 100 leden. In figuur 3 staan de kansen weergegeven. Je moet zeker 2,5 sigma boven het gemiddelde gepeupel uittoornen en dat wijst toch al gauw in de richting van 2150 tot 2200 minimaal. Geheel onverwacht is dit niet en qua orde van grootte klopt het uitstekend met wat we bij Promotie zien.

Het grappige is dat iemand die lid wordt van schaakclub Oegstgeest en een rating heeft van 2350 (ongeveer drie sigma boven gemiddeld) lelijk op zijn neus zal kijken als hij verwacht mocht hebben de sterkste te zijn. Maar -het kan niet genoeg benadrukt worden- we hebben in dit probleem met kansen te maken: een kans van om en nabij de negentig procent zegt dat een bepaalde situatie waarschijnlijk is, niet dat die ook zeker zal optreden.
De voorgaande berekeningen kunnen met al dan niet substantiële aanpassing ook worden doorgevoerd in andere gevallen.
Welke rating moet je minimaal hebben om de rating-sterkste te zijn op een toernooi van 100 man die allemaal een bovengemiddelde rating bezitten?
Welke als je een kwantificeerbaar vermoeden hebt dat er broodspelers aan het toernooi zullen meedoen en je iets weet omtrent de ratingverdeling van zulke spelers?
Deze vragen laat ik hier verder rusten.
Een praktisch toepasbaar nevenresultaat van onze discussie is er achteraf toch:
U kunt te weten komen, waarde lezer, hoe klein de club moet zijn waarvan zelfs U clubkampioen kunt worden!
MN
