Smalltalk

Prüfung der Behauptung die ELO-Formel sei inflationär

shaack - 05. Jun '23
Ich möchte zur Klarstellung der Behauptung von SF @kluger, dass die ELO-Berechnung Inflationär sein (Siehe /forum/topic.html?key=4d4dcc4d6afb458b&sv=10) auf den Wikipedia-Artikel zu ELO verweisen: de.wikipedia.org/wiki/Elo-Zahl#Deflation_und_Inflation

Dort ist erklärt, dass das ELO System sowohl inflationär als auch deflationär sein kann, je nachdem mit welcher ELO neue Spieler einsteigen. Die Annahme, dass "Punkte generiert" werden, ist schlichtweg falsch. Es werden im ELO System, keine Punkte generiert, sondern der Verlierer gibt die Punkte, die der Gewinner bekommt.

Der Wert, mit welcher ELO neue Spieler einsteigen, lässt sich im Fall von chessmail einfach steuern womit einer Inflation oder Deflation entgegengewirkt werden kann.
Alapin2 - 05. Jun '23
... laesst sich einfach steuern...
Ist mir ja eigentlich egal, will hier meinen Spaß haben.
Aber: Demnach muß "Bitcoin" wohl fremdgesteuert gewesen sein.
Das Leben wird in jedem Bereich immer komplizierter.
Es gab vor Jahren Theater mit einem georgischen Großmeister (kann mir die ganzen
-schwilis, - idses und - adses nicht merken), der da auch rumgetrickst hatte.
Deutsche mit etwas Kleingeld konnten in Ungarn auf Turnieren ihre Zahl gegen starke Meister verbessern.
Ganz perfekt geht irgendwie anscheinend nicht, oder?
Alapin2 - 05. Jun '23
PS: Surab Asmaiparaschwili, wer soll sich das merken? War mal in den top ten, sogar Sieg gegen Karpov.
shaack - 05. Jun '23
Der Witz an der ELO Formel ist ja eigentlich, dass die Verbesserung einer Zahl gegen Kleingeld oder durch Manipulation nur temporär sein kann. Die Zahl entspricht über lang immer der Spielstärke, egal mit welchem Wert man einsteigt oder wie man ihn manipuliert. Auch "Bitcoin" würde seine Punkte mit der Zeit wieder verlieren. Da er aber kaum noch spielt wird es das eher nicht und seine Zahl hat aktuell null Aussagekraft und wird ja auch nicht in der Rangliste angezeigt. Wer aber normal spielt, dessen Zahl entspricht seiner Spielstärke (±200 Punkte, wie man im Wikipedia-Artikel nachlesen kann). Es ist nicht so schwer zu verstehen.
shaack - 05. Jun '23
Genauso hat der Ungarische Meister auch nach ein paar Spielen seine Punkte ganz einfach wieder und ein super Geschäft gemacht. Genauso wie der (nicht ganz so schlaue) Punktekäufer seine Punkte sofort wieder verlieren wird, wenn er gegen andere spielt.
japetus1962 - 05. Jun '23
Es gibt auch die wunderbare Option der Freundschaftsspiele, z.b. für Training usw... bei dem das Punktesystem nicht zählt.
toby84 - 05. Jun '23
die durchschnittliche anzahl der punkte pro spieler wird sich wohl vor allem daraus ergeben, welche spieler wieder aus dem system verschwinden. nehmen wir eine startwertung von 1500 an, wird jeder spieler, der am ende eine schwächere wertung hat und dann chessmail verlässt, die durchschnittliche anzahl der punkte erhöhen. bei stärkeren spielern ist es umgekehrt. diese fluktuation lässt sich leicht berechnen über anzahl der punkte aller spieler / anzahl aller spieler. wird dieser wert zu hoch oder zu niedrig, könnte man gegensteuern oder auch einfach den neuen wert verwenden. dann wäre die neue startwertung halt bei 1525 statt bei 1500. oder wenn man das ziel 1500 beibehalten will, lässt man erst mal jeden neuen spieler bei 1475 starten, dann wird der wert recht schnell wieder sinken. letztendlich ist es völlig egal, welchen durchschnittswert man hat. man könnte auch 0 nehmen. ich vermute, dass man das gelassen hat, da negative werte demotivierend wären.
shaack - 05. Jun '23
@toby84 Genau, die 1500 (oder der Mittelwert) ist sozusagen die 0. Ich vermute, man müsste einfach nur den Mittelwert aller Spieler als Startwertung für Neue Spieler nehmen, wenn man das Gesamtsystem möglichst wenig ändern möchte. Falls man eine Inflation bemerkt, kann man den Startwert auf etwas unter den Durchschnitt setzen, bei Deflation umgekehrt. So ist die Idee, und so wird das bei chessmail schon seit Jahren gehandhabt. Resultat ist, die Wertungszahlen sind bei chessmail stabil.
kluger - 06. Jun '23
Ich habe kein Wort zur ELO-Berechnung gesagt, nur dass auf einer wachsenden Schachseite die Summe aller Punkte über alle Spieler (logisch) wächst...und zwar genau um den Betrag der Startwertung eines jeden einzelnen neuen Spielers. Diese Punkte werden in der Regel in der Rangliste nach oben gespült - Prinzip Kapitalismus: die Reichen werden immer reicher, die Armen immer ärmer. Und so wird es mit der Zeit auch kommen, dass Spieler die Rangliste sprengen - und das war meine Frage: was passiert, wenn ein Spieler die 2500 knackt? Oder die 2600? Wird dann der 1. Rang aufgeweicht und seine Spannweite vergrößert? Oder gibt es einen neuen Bereich für den ersten Rang und die darunter liegenden Ränge werden neu definiert? Dass man der FIDE bescheid gibt oder einen Arpad ELO im Grabe umdreht muss sicher nicht sein.
Übrigens bin ich neben dem Threadersteller der einzige, der hier bisher ZHE_Sammler zu Rang 1 gratuliert hat.
Vabanque - 06. Jun '23
Ich kenne die Behauptung, dass Elo-Zahlen inflationär seien, tatsächlich, aber nur in Bezug auf den Vergleich der Top-Spieler der Weltrangliste über die Jahrzehnte hinweg. Fischer hatte eine beste Elo-Zahl von 2785 (1972), Carlsen dagegen von 2882 (2014):

de.wikipedia.org/wiki/Liste_der_Schachspieler_mit_einer_besten..

Nun ist es kaum wahrscheinlich, dass Carlsen wirklich um fast 100 Elo-Punkte besser ist als Fischer. Zudem wären nach der verlinkten Liste sogar 20 Spieler besser als Fischer. Interessanterweise sind das aber alles gegenwärtige Spieler, mit Ausnahme von Kasparov, der schon 1999 eine Elo von 2851 erreicht hat.

Es besteht also durchaus Grund zu der Behauptung, dass sich das Elo-System im Verlauf von den 50 Jahren, die zwischen Fischer und Carlsen liegen, inflationär entwickelt hat.

Nun gilt das aber zunächst nur an der Weltspitze. Im Durchschnittsspielerbereich ist das selbe Phänomen zumindest nach meiner eigenen Turniererfahrung nicht zu beobachten. Zumindest die DWZ-Zahlen (die ja auch auf dem Elo-System beruhen), scheinen im Laufe der Zeit sogar 'härter' geworden zu sein.

Wie steht es nun mit den chessmail-Wertungszahlen? Da sie durch den Gebrauch von Hilfsmitteln m.E. ohnehin stark verzerrt sind, wird es schwer sein, hier ein ähnliches Phänomen herauszulesen bzw. zu widerlegen.

Was die cm-Spitze betrifft, so wird die Luft dort in den letzten Jahren doch eher dünner, glaube ich? Das würde dann aber gegen eine Punkte-Inflation sprechen.
toby84 - 06. Jun '23
"Ich habe kein Wort zur ELO-Berechnung gesagt,"

auf chessmail wird halt das elo-berechnungssystem verwendet. also eigentlich hast du so einiges dazu gesagt 😉

"Prinzip Kapitalismus: die Reichen werden immer reicher, die Armen immer ärmer. "

das prinzip lässt sich hierauf nicht anwenden (wie kommst du überhaupt darauf?). die punkteverteilung im elosystem bildet tatsächlich relativ gut die spielstärkeverhältnisse ab, sonst wäre es auch ziemlich sinnlos. wenn die anzahl der spieler auf die plattform steigt, gibt es naturgemäß eine leicht größere streuung sowohl nach oben als auch nach unten. obwohl das FIDE-elosystem erheblich viel mehr mitglieder hat, hat carlsen die 2900 noch nicht knacken können. es ist also nicht allzu wahrscheinlich, dass irgendwann mehr als 5 spieler gleichzeitig auf chessmail die 2400 überschreiten.

"Ich kenne die Behauptung, dass Elo-Zahlen inflationär seien, tatsächlich, aber nur in Bezug auf den Vergleich der Top-Spieler der Weltrangliste über die Jahrzehnte hinweg."

hier sehe ich zwei möglichkeiten:
1. die anzahl der weltweiten spieler im elo-system wächst.
2. die zahl der relativ starken spieler wächst. so können noch stärkere spieler leichter mehr punkte erhalten. wenn wenige sich zu stark von vielen absetzen, dürfte das einen dämpfenden effekt auf die wertungen der sehr starken spieler haben. das müsste man mal simulieren.
Vabanque - 06. Jun '23
>>2. die zahl der relativ starken spieler wächst. so können noch stärkere spieler leichter mehr punkte erhalten<<

Ja, ich kann mir gut vorstellen, dass das ein Grund sein kann. Es gibt heute weltweit sehr viel mehr Top-Spieler als zu Fischers Zeiten.
mr20 - 06. Jun '23
@kluger:
Der Vergleich mit dem Kapitalismus trifft hier nicht. Die Zahl seiner Punkte haben keinen Einfluss auf die Spielstärke eines Spielers.
Beim Geld ist das anders, wer viel Geld besitzt, tut sich leichter noch mehr Geld zu verdienen - allein durch die Zinsen auf seinem Konto.
Ein Spieler kann seine Punkte nicht "für sich arbeiten lassen".
shaack - 06. Jun '23
Die Gründe für Inflation und Deflation sind in dem Wikipedia Artikel beschrieben. Die Anzahl der Spieler ist nicht relevant, sondern die Eintritts-ELO und Austritts-ELO. Wenn jemand mit weniger Punkten Ein- als Austritt, entfernt er Punkte aus dem System, bei vielen ist das Deflation. Die Anzahl der Spieler erhöht höchstens den Effekt aber führt nicht zwangsläufig zur Inflation. Dass die FIDE eine Inflation hat, heißt, dass sie die Eintritts-ELO nicht richtig festlegen, mehr nicht. Sie haben es diesbezüglich auch schwieriger als chessmail.
toby84 - 06. Jun '23
@shaack: vabanque spricht ja nur von der deflation im top-spieler-bereich. dass das gesamtsystem durch eine erhöhte spielerzahl nicht deflationiert, ist ja klar.
shaack - 06. Jun '23
Ich dachte, dass @kluger das behauptet hätte. Sowas wie, es würden Punkte „nach oben gespült“, das ist nämlich falsch. Wie mr20 richtig schreibt sind Zinsen der Grund für die Inflation bei Geld, damit steuert sie ja auch die Weltbank. Kapitalismus und ELO sind nicht vergleichbar.
toby84 - 06. Jun '23
das sind zwei verschiedene effekte, die hier parallel diskutiert werden:

1. inflation/deflation durch abwanderung starker/schwacher spieler und nicht mehr dazu passender einstiegsspielstärke.

2. punkteverteilung innerhalb des systems.

@kluger hat die behauptung aufgestellt, dass sich die punkte automatisch bei den starken spielern sammeln (das gehöet zu 2, hat also mit deflation erst mal nichts zu tun) und den kapitalismus als beleg gebracht, was unsinn ist. hier gibt es keinerlei vergleichbarkeit. den grund dafür hat mr20 auf den punkt gebracht.
shaack - 06. Jun '23
Richtig, wer behauptet, dass sich Punkte im ELO System bei starken Spielern sammeln, hat es schlichtweg nicht verstanden.
aguirre - 06. Jun '23
Ich habe eine Frage:
Im Tennis bleiben Punkte in der Rangliste nicht auf "Lebenszeit", sie verfallen nach zwei Jahren, bedeutet, ein Tennisspieler der nicht spielt verliert seine Punkte (oder halt schlechter spielt und keine neuen Punlkte holt).
Wie ist das im Schach? Verfallen ELO Punkte (DWZ) nach einer gewissen Zeit automatisch?
Wie ist das auf Chessmail? Wenn Bitcoin nicht mehr spielt, hält er da ewig die Nummer1?
Zumindest bis der nächste Spieler auf die gleiche Idee kommt....
Wäre ein automatischer Punkteverfall nach einer gewissen Zeit eine Lösung und wäre dies leicht zu implementieren?
Danke.
toby84 - 06. Jun '23
um das mal etwas anschaulicher für die mitleser zu gestalten, die sich das weniger gut vorstellen können, will ich ein beispiel geben:

wir erstellen ein brandneues elosystem mit 10 mitspielern und der startwertung 1500. diese spielen einige spiele untereinander und haben schließlich folgende spielstärkeverteilung:

1580
1560
1540
1520
1500
1500
1480
1460
1440
1420

die durchschnittliche spielstärke der spieler beträgt damit weiterhin 1500. die beiden schlechtesten spieler denken sich jetzt: "hm, ich bin in der tabelle ganz weit hinten. offensichtlich ist schach nicht mein spiel" und beenden die mitgliedschaft. nun ist die punkteverteilung:

1580
1560
1540
1520
1500
1500
1480
1460

und die durchschnittliche spielstärke liegt bei 1517,5. das ist deflation.

die punkteverteilung innerhalb des systems sieht etwa so aus:

viele spieler tummeln sich knapp unterhalb der durchschnittsspielstärke in einem relativ dichten pulk. nach oben hin wird die anzahl der entsprechend starken spieler immer dünner, bis hin zu rang 1, wo aktuell nur ein spieler steht. die höchste spielstärke ist deutlich weiter weg vom durchschnittswert als die niedrigste. @kluger hat diese verteilung mit dem kapitalismus assoziiert, weil auch da viele wenig und wenige sehr viel haben. die gründe sind allerdings nicht vergleichbar.

@aguirre: auf chessmail verfallen die punkte nicht, aber man wird in der rangliste nicht mehr angezeigt, wenn man zu wenig spielt.
toby84 - 06. Jun '23
"das ist deflation."

das ist natürlich inflation und nicht deflation. der umgekehrte effekt wäre die deflation.
shaack - 06. Jun '23
@aguirre Ein Punkteverfall ist nicht möglich, Systembedingt. Ungültige Punkte werden nicht in der Rangliste dargestellt. Nur WP von Spielern in der Rangliste haben eine Aussagekraft. Ich werde diese ungültigen Punkte in Zukunft noch klarer kennzeichnen bzw. mehr ausblenden.
smypls - 06. Jun '23
@ shaack

Du schriebst (4. Beitrag) : "Auch "Bitcoin" würde seine Punkte mit der Zeit wieder verlieren. Da er aber kaum noch spielt wird es das eher nicht und seine Zahl hat aktuell null Aussagekraft und wird ja auch nicht in der Rangliste angezeigt."

Das trifft so eben nicht zu. Ich hatte und habe keine Lust, mich an der Diskussion um den extrem hohen Spielpunktewert von lovewithbitcoin zu beteiligen, da das letztlich schnell auf Spekulationen und Unterstellungen hinauslaufen würde.

Jedenfalls ist sein Punktestand nicht zu erklären durch die enorme Anzahl seiner gleichzeitig gespielten Partien, sondern hauptsächlich dadurch, dass er von diesen vielen Partien geschätzt 98% gewonnen hat. Wertungspunkte könnte er nur verlieren, wenn er anfangen würde, Partien zu verlieren. Es gibt aufgrund seiner bisherigen Serie allerdings keinen Grund zu erwarten, dass sich dieser Wert künftig durch eine Reihe von mehreren 100 Niederlagen normalisieren würde.
shaack - 06. Jun '23
@smypls Ja, weil er keine Wertungsspiele gegen Spieler > 2000 macht. Würde er normal gegen andere in >2000 spielen, wären seine Punkte schneller weg, als man Blaubeerkuchen sagen kann. So wie jetzt ist seine Wertung einfach nur ungültig.
toby84 - 06. Jun '23
auch mit 98% gewinnquote kann sein wert nur fallen. jeder sieg bringt ihm 0 punkte, jede niederlage lässt ihn maximal viele punkte verlieren, bis er auf ein normales maß zurückfällt.
kluger - 06. Jun '23
Wertungspartien kann er nur starten, wenn er eingeladen wird, er selbst kann nicht einladen mit Wertung da die Grenze hierfür bei -400 Differenz zu seiner Wertung liegt..und kein weiter Spieler hier weist 3300 Punkte auf. Wie ist es eigentlich mit Turnieren? Da sollte er normal teilnehmen können, oder?
@shaack: ich habe mir nochmal alles durch gelesen. Du schriebst (was mir vorher entging), dass alle Wertungen über 2400 Rang 1 bedeuten ( die 100er Schrittweite entfällt dann wohl). Damit ist meine Frage beantwortet. Danke!
mr20 - 06. Jun '23
@toby84:
Ist das wirklich De/Inflation? In deinem Beispiel ist nach Weggang der schwächeren Spieler die durchschnittlich Stärke der verbleibenden Spieler gestiegen.
Der Wert entspricht also immer noch der Spielstärke.

Von De/Inflation würde ich nur sprechen, wenn die Punkte eines Spielers (längerfristig) steigen oder sinken, obwohl sich seine Spielstärke nicht ändert.

Wenn aber alle Spieler (eines geschlossenen Pools) gemeinsam stärker werden (was man allein wegen der coolen Schachaufgaben in der Lobby annehmen kann), müssten eigentlich mehr Punkte "ausgeschüttet" werden, um die Wertung stabil zu halten.
shaack - 06. Jun '23
@kluger Nein, er kann Wertungsspiele mit beliebigen Spielern starten und beliebig einladen. Er kann nur keine offenen Einladungen mit über -400 Differenz erstellen.
kluger - 06. Jun '23
Ja genau das meinte ich..offene Einladungen.
shaack - 06. Jun '23
@mr20 Die Zahl und die Spielstärke hinter der Zahl sind auch noch zwei verschiedene Dinge. Würden alle Spieler bei chessmail gleichförmig besser werden, bleiben die Zahlen gleich, aber die Zahl bedeutet dann eine höhere Spielstärke.
shaack - 06. Jun '23
@kluger Ich könnte offene Einladungen mit nach unten höheren Differenzen erlauben, bin mir aber nicht sicher, was das für Auswirkungen hätte. Nur wegen LWB mache ich das nicht. Es handelt sich um einen einmaligen Fall, der in 20 Jahren einmal aufgetreten ist. Dafür ändere ich nicht die Offenen Einladungen.
shaack - 06. Jun '23
Gibt es andere Gründe, die Begrenzung der Offenen Einladungen nur nach oben zu machen? In dem Fall könnte man darüber nachdenken. Die Sperre nach oben ist sinnvoll, sie verhindert Offene Einladungen "Spam".
toby84 - 06. Jun '23
würden in diesem system nur noch spieler der spielstärke 1460 bis 1580 einsteigen, würde ich dir recht geben. aber es steigen trotzdem weiterhin spieler aller spielstärken ein, während nur die schwachen wieder aussteigen.

das beispiel auf wikipedia ist vermutlich plausibler. spieler, die aus dem system aussteigen, sind meistens alt und erfahren und deshalb durchschnittlich stärker als spieler, die ins system einsteigen. dadurch werden meist mehr als 1500 punkte pro aussteigendem spieler aus dem system entnommen. das ergebnis ist, dass neu einsteigende spieler dann eine startwertung bekommen, die höher ist als der tatsächliche punktedurchschnitt im system. wer weiß, wie viele ähnliche effekte da mit einfließen. wenn man so ein system lange genug laufen lässt, müsste es sich aber irgendwann stabilisieren. dann hat man halt eine startwertung von 1500 und einen spielerischen schnitt von 1470, dann dürfte sich eigentlich nicht mehr viel ändern, denn die bereits bestehende diskrepanz wirkt einer weiteren verschärfung entgegen.
toby84 - 06. Jun '23
oh sorry, das war für mr20.
underdunk - 06. Jun '23
Also so wie ich das ELO System verstanden habe, werden immer nur Punkte verschoben. Daher würden Punkte nur "nach oben gespült", wenn ein Spieler zu gut eingeschätzt eintritt.

Wenn in der Weltspitze also inzwischen zu hohe Wertungen zu finden sind (im Vergleich zu früher), müsste dies genau daran liegen.
shaack - 06. Jun '23
exakt 👍
toby84 - 06. Jun '23
was die FIDE-elo angeht, gibt es einen ganz konkreten grund für die höheren wertungspunkte, wie ich inzwischen auf der von shaack verlinkten wiki-seite nachgelesen habe:

"Dies war insbesondere früher der Fall, als der Weltschachbund FIDE Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, zuletzt auf 1000.[7] Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Ratings-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten.

...

So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Im Jahr 2000 gab es nur einen Spieler (Kasparow) mit einer Elo-Zahl größer 2800, elf Spieler größer 2700, und etwa 90 erreichten einen Wert über 2600.[8] Im Juli 2010 hatten bereits über 200 aktive Spieler eine Elo-Zahl größer 2600, davon 37 mindestens 2700; drei Spieler hatten sogar eine Elozahl von 2800 oder höher,[9] was 20 Jahre zuvor undenkbar schien. "
toby84 - 06. Jun '23
ich habe jetzt nochmal weiter recherchiert. die ursprüngliche argumentation kommt wohl von:

en.chessbase.com/post/rating-inflation-its-causes-and-poible-c..

zumindest wird diese quelle im englischen wikipedia direkt genannt. die begründung beginnt relativ weit hinten mit "Finally, I would like to explain my current theory as to why there is inflation.". und es leuchtet mir noch immer nicht richtig ein, warum der effekt eine auswirkung auf die höchsten punktzahlen haben soll. der zugrundeliegende spielerpool mit den zugehörigen spielstärken ist doch trotzdem derselbe. die unteren spielstärken wurden nur nicht in die offizielle liste aufgenommen, aber für die berechnungen ist die offizielle liste völlig wurscht. vll kann mir das jemand erklären, der erkennt, was ich hier übersehe. gerne per PN.
odhiambo - 07. Jun '23
m20: "... Wenn aber alle Spieler (eines geschlossenen Pools) gemeinsam stärker werden ..."

Das ist ein interessanter Gedanke, den ich auch schon hatte. Ich bilde mir ein, nach ca. 12 Jahren und >5000 Partien bei Chessmail etwas besser geworden zu sein. Vorher habe ich nur gelegentlich mit Familie/Freunden am Brett gespielt.
Leider kenne ich meine Startspielstärke nicht und möchte auch nicht für alle Partien gewonnene und verlorene Punkte raussuchen und addieren.
Früher konnte man in der Spielinfo die Startwertung beider Spieler sehen, heute leider nicht mehr. Warum wurde das geändert? Könnte man das wieder einführen?
Genau genommen hätte ich gerne meine Wertung, mit der ich im Juli 2011 die Partie gegen Gwendolyn gestartet habe:
/game/9a23cfee57b54d1b

Zurück aber zum Gedanken von SF m20: Ob sich alle Spieler im Pool im Schnitt durch die Mitgliedschaft bei Chessmail verbessert haben, hängt sicher von der Ausgangssituation ab. Hat die Mehrheit vorher so wie ich kaum Schach gespielt, ist das sicher möglich. Ich weiß aber, dass hier einige unter uns ehemalige oder noch aktive Vereinsspieler sind, der eine oder andere mag sogar schon seinen Schachzenit überschritten haben. Daher kann die Entwicklung je nach Zusammensetzung des Ensembles in beide Richtungen gehen.
odhiambo - 07. Jun '23
Sorry, der Schachfreund heißt mr20.
toby84 - 07. Jun '23
wenn alle mitglieder einer wertungsgruppe im laufe der mitgliedschaft gleichmäßig an spielstärke zulegen, lässt sich das über ein relatives berechnungssystem wie elo natürlich nicht abbilden. das resultat so einer verschiebung ist genau das, was ich oben beschrieben habe: die einstiegsspielstärke entspricht nicht mehr der durchschnittsspielstärke der spieler im system. sonst ergibt sich daraus soweit ich sehe kein effekt. die verschiebung sollte genau so lange stattfinden, bis die durchschnittliche spielstärkeverbesserung im laufe der chessmail-mitgliedschaft der differenz zwischen durchschnittlicher spielstärke im system und einstiegsspielstärke entspricht, und dann anhalten. ich sehe darin kein problem. anstatt der verschiebung aktiv entgegenzuwirken, könnte man das einfach laufen lassen und schauen, wo sie endet. das wäre doch durchaus interessant.
underdunk - 07. Jun '23
Wenn man sich einen geschlossenen Pool vorstellt (keine Zu- oder Abgänge) in dem viele Spieler besser würden, unterlägen die ELO Punkte einem Wertegewinn (eine bestimmte ELO Zahl repräsentiert nun eine höhere Spielstärke) verglichen mit der realen Spielstärke. Die Anzahl der ELO Punkte insgesamt bleibt gleich, während die Spielstärke im Ganzen steigt.

Dies ist etwas, das ich tatsächlich erwarten würde, da in der Realität wohl viele Spiele (gerade die jungen) mit der Zeit besser würden. Ausgeglichen würde der Effekt nur durch das Schlechterwerden im Alter. Ich hätte allerdings vermutet, dass ersteres deutlich stärker ist.

Der Effekt müsste auch bei offenen Pools auftreten, wenn eben immer sehr viele Spieler besser würden. Dies widerspricht allerdings der Behauptung oben, dass die Weltspitze inzwischen höhere ELO Werte hat als früher. Wobei der Effekt wohl deutlich geringer ausfällt, da es ja eine Eintrittsschwelle gibt.
brauna - 07. Jun '23
Potzblitz! Erstaunlich, wieviel geistige Ergüsse es zu den "Gummipunkten" gibt!
Letztendlich sind sie ....... wert!
shaack - 07. Jun '23
Für mich z.B. sind die sehr beachtenswert, weil sie eine Grundlage für die Spiele bei chessmail sind. Ohne ein funktionierendes Wertungssystem würde ganz chessmail nicht funktionieren. Ich finde es gut, dass sich auch andere mal mit dem Thema beschäftigen, weil man dadurch auch auf neue Ideen kommt.
ZHE_Sammler - 07. Jun '23
@brauna
Ich finde es nicht sinn und stielvoll immer von Gummipunkten zu sprechen, zumal das auch keine substantielle Aussage ist.
Es verhält sich wie bei einem Blutdruckmessgerät : Das kann ruhig falsch messen wenn es nur immergleich falsch misst und ist damit aussagefähig.
Und die Punkte bei cm geben eine Vergleichsmöglichkeit und für viele sind sie ein Maßstab und werden bewertet.
toby84 - 07. Jun '23
@brauna:
die punkte sind mir völlig egal. es geht mir um die mathematik dahinter, die ist interessant. musst du ja nicht so sehen. dann ignorier doch einfach diese diskussion.

@underdunk:
"Die Anzahl der ELO Punkte insgesamt bleibt gleich, während die Spielstärke im Ganzen steigt."

genau das meine ich: die elo-punkte repräsentieren die globale änderung der stärke nicht, sie bleiben völlig gleich. nur durch die verschiebung der durchschnittlichen spielstärke durch aus- und einsteiger wird der effekt überhaupt bemerkbar. wären immer dieselben spieler im pool, wäre es völlig unsichtbar, wie die absolute gesamtspielstärke im pool sich ändert.

"Dies ist etwas, das ich tatsächlich erwarten würde, da in der Realität wohl viele Spiele (gerade die jungen) mit der Zeit besser würden."

wie gesagt, das ist nicht wirklich der zu erwartende effekt. die anzahl der punkte, die ein durchschnittlicher spieler im laufe seines lebens gewinnt, wird sich nicht von generation zu generation ändern. sie ist gleichbleibend, und deshalb müsste auch die verschiebung der durchschnittlichen punktzahl nach unten an genau diesem punkt aufhören. sprich: gewinnt der durchschnittliche spieler im laufe seines lebens 100 punkte, müsste bei einer startwertung von 1500 irgendwann die durchschnittliche spielerwertung auf 1400 sinken und dort konstant bleiben.
toby84 - 07. Jun '23
man müsste das wirklich mal simulieren, um konkret zu überprüfen, ob das alles so stimmt. so eine simulation müsste doch eigentlich ein ziemlich überschaubarer aufwand sein.
toby84 - 07. Jun '23
ok das ist fast richtig, aber nicht ganz. bei einem spielstärkezuwachs von 100 punkten im laufe des lebens beginnt der spieler mit 1500 punkten bei einer realen spielstärke von 1450, und verlässt den pool am ende mit 1550 punkten. der spielstärkezuwachs verteilt sich also gleichmäßig unter- und oberhalb der 1500. wenn jemand meine beispielrechnung sehen will, einfach per PN fragen, dann schicke ich sie.

ich finde leider nirgendwo, welche startwertung für die FIDE-elo angenommen wird. ich dachte immer, das wäre 1500, aber ich finde beim googeln nirgendwo eine info dazu. vll ist da jemand weniger blind als ich oder googelt besser.
MarkD - 07. Jun '23
Es gibt nach meiner Erinnerung, die Wertung wird anhand des Gegnerdurchschnitts der ersten x Partien und dem erzielten Ergebnis revers berechnet (welche ELO hätte den erzielten Punktewert als Erwartungswert).
shaack - 07. Jun '23
Die erste ELO Zahl wird bei der FIDE nach dem Spiel mit 9 ELO Gegnern ermittelt. Das ist quasi so ähnlich, wie bei chessmail, wo es ja nach 10 Spielen ist. Der Unterschied ist, dass man bei der FIDE Turniere spielen muss. Quelle: sv-unser-fritz.de/2011/06/30/wann-bekomme-ich-die-erste-elo-za..
MarkD - 07. Jun '23
(wenn man nur editieren könnte: "Es gibt nach meiner Erinnerung keinen Anfangswert.")

Zu der allgemeinen Diskussion: ich halte die Argumentation von kluger für plausibel. Meine Begründung ist etwas anders, aber im Grunde hat er Recht.

Spielstärke (DWZ, ELO, Chessmail-Wertung) ist kein absoluter Wert, sondern kann jeweils nur relativ im Hinblick auf die betrachtete Grundgesamtheit (die anwesenden Spieler) gesehen werden. Das führt auch dazu, dass sich die einzelnen Wertungen, die ein Schachspieler so hat, unterscheiden. Mein chessmail-Rating ist etwa 200 Punkte höher als meine DWZ, etwa 100 Punkte höher als meine Betriebsschach-ELO und etwa 100 Punkte niedriger als meine gameknot-Wertung.

Gedankenexperiment: wenn ich nun hier der absolut stärkste Spieler wäre, würde meine Wertung wohl wesentlich höher steigen. Wenn dann immer weitere Spieler hinzu kämen, die fast gleichstark sind, aber doch etwas schwächer (Argument von kluger "wachsende Schachplattform"), könnte ich auch immer weiter Punkte sammeln. Warum nicht auch 3000? Ich bin dann nur der relativ stärkste unter den Anwesenden. Dass ich das nicht bin, ist schon klar, aber irgendjemand hier ist der absolut stärkste Spieler (möglicherweise auch Stockfisch).
toby84 - 07. Jun '23
" wenn ich nun hier der absolut stärkste Spieler wäre, würde meine Wertung wohl wesentlich höher steigen. Wenn dann immer weitere Spieler hinzu kämen, die fast gleichstark sind, aber doch etwas schwächer (Argument von kluger "wachsende Schachplattform"), könnte ich auch immer weiter Punkte sammeln. Warum nicht auch 3000? Ich bin dann nur der relativ stärkste unter den Anwesenden. Dass ich das nicht bin, ist schon klar, aber irgendjemand hier ist der absolut stärkste Spieler (möglicherweise auch Stockfisch)."

klar, das wurde ja schon besprochen; wenn die anzahl der spieler auf der plattform wächst, dehnen sich die grenzen der höchsten und niedrigsten spielerzahl naturgemäß leicht aus. der effekt ist aber sehr gering. deshalb hatte ich das beispiel mit der FIDE-elo genommen. da sind sie erst bei 2800, trotz erheblich viel mehr spielern und trotz inflation aus noch nicht einwandfrei geklärten gründen.

ich schließe für das beispiel mal aus, dass plötzlich nur starke spieler ihren weg auf chessmail finden. ich halte das für kein plausibles szenario.
underdunk - 07. Jun '23
Also so wie ich das verstehe, hat das nichts mit der Spielstärke der neuen Spieler zu tun. Es kann eigentlich nur zu höheren Punkten an der Spitze kommen, wenn neue Spieler zu hoch bewertet eintreten. Sie bringen neue Punkte rein, die sie auf lange Sicht nicht halten können.
shaack - 07. Jun '23
Die Verteilung ist, würde ich sagen, ähnlich der Gauß Verteilung. Je mehr Teilnehmer ein System hat, desto mehr Werte gibt es auch an den Rändern der Gauß Kurve, daher sieht es so aus, als würden die Zahlen an den Rändern höher/niedriger. Die Kurve bleibt gleich, sie hat nur mehr Werte.
toby84 - 07. Jun '23
"Die Kurve bleibt gleich, sie hat nur mehr Werte."

genau so sehe ich das auch. vereinfacht kann man sich ein elosystem mit zwei spielern vorstellen. vermutlich werden sie irgendwann bei 1700 und 1300 punkten oder irgendwo dazwischen landen. das sind schlicht die absoluten grenzen. je mehr spieler sich im zentrum tummeln, desto mehr punkte können an die ränder abgegeben werden. also ja, die anzahl hat einen kleinen effekt auf die ränder.

"Die erste ELO Zahl wird bei der FIDE nach dem Spiel mit 9 ELO Gegnern ermittelt."

was passiert mit den punkten des bereits im system integrierten spielers? bekommt der punkte für einen sieg gegen jemanden ohne elo oder nicht? wie wird das berechnet?

wenn der einstiegswert neuer spieler völlig flexibel ist, funktioniert das system tatsächlich ganz anders als mit einem startwert von 1500. ich hätte vermutet, dass die 1500 quasi ein virtueller startwert wären, aber so gerechnet wird, als hätte der spieler diese zahl. den beschreibungen nach habe ich damit wohl unrecht. dann muss ich meine statistik überdenken.
schach2018 - 07. Jun '23
FIDE // INTERNATIONALE WERTUNGSZAHLEN

"Die Wertungszahlen (Ratings) der FIDE sind ein Gradmesser für die Spielstärke von Schachspielern. Mathematischer Hintergrund ist die Normalverteilung (Gauß'sche Glockenkurve). Untersuchungen von Prof. Arpad Elo führten in den 1970er Jahren dazu, daß die FIDE die Ratingzahlen als Wertungssystem einsetzte. Häufig werden deshalb die Ratingzahlen auch als "Elo-Zahlen" bezeichnet. Die Ratingzahlen der FIDE beginnen bei Zahlen von 1000 (Amateur) und reichen bis zu über 2800. Die FIDE veröffentlichte bis Juli 2009 viermal jährlich neue Weltranglisten, deren Zahlen dann für das nächste Quartal Gültigkeit hatten. Mit den Listen vom September 2009 wurde ein Zweimonatsrhythmus eingeführt. Seit Juli 2012 werden die Listen monatlich veröffentlicht, aber dabei auch ständig aktualisiert und korrigiert."

Quelle:
schachbund.de/fide-rating.html
schach2018 - 07. Jun '23
FIDE-ELO // TABELLEN FÜR DIE RATINGBERECHNUNGEN
Umrechnungstabelle vom Prozentwert p in die Rating-Differenz d(p)

Quelle
schachbund.de/fide-tabellen.html
shaack - 07. Jun '23
Ah, dann sieht es nicht nur zufällig aus wie eine Gauß Kurve sondern es ist so gemacht damit es eine Gaußsche Normalverteilung hat.
shaack - 07. Jun '23
Es ist ja ganz einfach, wenn ein Wert ganz am Rand der Gauß Kurve eine Wahrscheinlichkeit von 0,1 % hat, dann ist das bei 10 Teilnehmern sehr unwahrscheinlich. Bei 100.000 Teilnehmern aber ist es relativ wahrscheinlich, dass es dort einen Wert gibt. Ergo, mehr Werte an den Rändern, die dann auch so aussehen als würden sie weiter nach aussen gehen.
toby84 - 07. Jun '23
wie kann das sein, wenn die werte nur bis 1000 runter, aber bis 2400 hoch gehen? ich habe das so interpretiert, dass in den unteren bereichen ein pulk ist. ich würde eigentlich auch nicht ungeprüft eine normalverteilung erwarten.
shaack - 07. Jun '23
Die unter 1000 werden in der Rangliste nur nicht angezeigt, die Werte der aktiven Spieler gehen bis 800 runter. Damit ist die Mitte 1.600, also alles richtig. Die Verteilung muss eine Gaußsche Normalverteilung sein, weil dies die Grundlage der ELO Berechnung ist. Ich erstelle gleich mal einen Graphen, mal sehen.
underdunk - 07. Jun '23
@shaack: "Die Verteilung ist, würde ich sagen, ähnlich der Gauß Verteilung. Je mehr Teilnehmer ein System hat, desto mehr Werte gibt es auch an den Rändern der Gauß Kurve, daher sieht es so aus, als würden die Zahlen an den Rändern höher/niedriger."

Gaußverteilung ist gesetzt, das hätte ich auch angenommen. Aber eine Änderung an den Rändern kann es nur geben, wenn ein Teilnehmer eintritt, der es am Rand angesiedelt ist.

Ein Beispiel, wir nehmen die Verteilung der Größe von Bäumen. Wenn ein neuer Baum in unsere Beobachtungsreihe aufgenommen wird, ändert dies nur den Rand, wenn der Baum größer als der bislang größte Baum ist.

Was hier aber passiert ist, dass neue Teilnehmer die Kurve verändern, dadurch, dass sie z.B. falsch eingestuft wurden, oder sich ihre Stärke ändert. Das hängt damit zusammen, dass das Rechnungssystem die Punkte in der Gruppe zwar ihre Spielstärke nach verteilt, es aber kein Absolutmaß ist.

2000 ELO Punkte heute sind nicht zwingend mit 2000 ELO Punkten früher oder in der Zukunft vergleichbar. Der Meter mit dem man den Baum misst hingegen schon.
shaack - 07. Jun '23
Merkwürdig, es ist eigentlich keine richtige Gauß Verteilung, sie ist leicht nach unten verschoben.
/downloads/wertungsverteilung_chessmail_2023-06-07.png

Jemand eine Idee?
shaack - 07. Jun '23
Hier der Graph nochmal in detaillierter:
/downloads/wertungsverteilung_chessmail_2023-06-07_2.png

Bemerkenswert auch die Häufung im oberen Bereich.
Feyerabend - 07. Jun '23
Die Verteilung sieht do aus als wenn der durchschnittliche Default Einstiegswert bei 1500 Punkten liegt. Durch die (ersten 10) und weiteren Spiele ergibt sich die Gaus-ähnliche Verteilungsgrafik.

Es fällt auch auf, dass es mehr Punkte im System als durchschnittlich 1500 gibt.
Das könnte daran liegen, daß mehr Personen unter 1500 Punkten, CM verlassen als die darüber.
(Gründe könnte es viele geben: Schach mal ausprobieren, Frust bei zu vielen verlorenen Spielen, etc. Gute Spieler sind motiviert dabei zu bleiben etc.).
Feyerabend - 07. Jun '23
Meine Kommentar hatte ich zur ersten Grafik geschrieben.
Die zweite könnte man auch anders interpretieren.
toby84 - 07. Jun '23
naja die häufung in der spitze könnte man ja schon den spielern zuordnen, die hier klassisches fernschach mit entsprechender unterstützung spielen. wenn man die weglässt, sieht das bild schon anders aus.

wobei man sagen muss, dass wir hier eine verteilung haben, die gezielt in normalformähnliche gestalt gepresst wird. eine normalverteilung würde ich dann erwarten, wenn training keinerlei effekt hätte. aber training hat einen effekt und wird ausgeübt, und ich wage zu bezweifeln, dass das training normalverteilt ausgeübt wird.

"Es fällt auch auf, dass es mehr Punkte im System als durchschnittlich 1500 gibt.
Das könnte daran liegen, daß mehr Personen unter 1500 Punkten, CM verlassen als die darüber.
(Gründe könnte es viele geben: Schach mal ausprobieren, Frust bei zu vielen verlorenen Spielen, etc. Gute Spieler sind motiviert dabei zu bleiben etc.)."

das wäre mal interessant zu überprüfen. lässt sich herausfinden, wie stark die aussteiger durchschnittlich sind?

es ist außerdem noch die frage offen, ob spieler mit wertungszahl eine punkteänderung erfahren, wenn sie gegen spieler ohne wertung spielen.
shaack - 07. Jun '23
Die Startwertung bei chessmail liegt bei 1600. Wertungen mit unter 10 Spielen sind nicht im Graph enthalten.
shaack - 07. Jun '23
Der Mittelwert aller Wertungen aktiver Spieler:innen ist 1.597.
toby84 - 07. Jun '23
"Die Startwertung bei chessmail liegt bei 1600. Wertungen mit unter 10 Spielen sind nicht im Graph enthalten."

aha, also doch eine versteckte virtuelle wertung? demnach ändern sich auch in den spielen zur spielstärkeklärung schon die punktzahlen der gegner und die anzahl der punkte im system hängt nicht davon ab, mit wievielen punkten ein neuer spieler einsteigt. das ist eine wichtige information.

"Der Mittelwert aller Wertungen aktiver Spieler:innen ist 1.597."

da hast du aber sauber gegen alle störeinflüsse gearbeitet 😁 darf man erfahren, wie oft und wie du korrigierend eingreifst?
shaack - 07. Jun '23
Die ersten 10 Spiele müssen aus der Statistik ausgenommen werden, sonst hätten wir einen wahnsinnigen Peak bei 1600, der keinen Sinn machen würde. Daher lässt die FIDE ja auch erstmal 9 Spiele spielen. Zur Korrektur: Ich kann bei neuen Spielern die Wertungszahl anpassen, bevor sie das erste Mal angezeigt wird, um dem System Punkte zuzufügen oder zu entnehmen, und um damit den Mittelwert bei 1600 zu halten. Dieser Wert ist schon lange konstant bei +50, damit ändert sich der Mittelwert vielleicht im Monat um 0,1 - 0,5 Punkte oder so. Die Effekte sind alle extrem langsam.
Feyerabend - 07. Jun '23
Interessant, dass der Mittelwert 1597 ist. Damit kann jede Person zumindest mal einordnen ob man über- oder unterdurchschnittlich spielstark ist.

Die erste, gröbere Grafik hatte bei 1500 den Peak (möglicherweise weil die Intervalle z.B. 1500 - 1599 sind?).
shaack - 07. Jun '23
Ja genau, die Intervalle der ersten Grafik sind 1500-1599, die der zweiten 1500-1509, etc..
toby84 - 07. Jun '23
@shaack:
ok danke, das ist eine sehr hilfreiche ausführung. damit sollte ich mein beispiel entsprechend anpassen können. das werde ich später tun.
shaack - 07. Jun '23
Bei Lichess sieht es anscheinend so ähnlich aus: i.redd.it/vv0vn00gdhn71.png
toby84 - 07. Jun '23
so jetzt habe ich es bei mir umgebaut. die ursprüngliche fassung war:

neue spieler beginnen immer mit durchschnittlich 100 punkten (willkürlicher wert, der einfachheit halber gewählt). nach 4 zyklen mit spielstärkenerhöhung um jeweils 20 punkte und nach jedem zyklus jeweils entsprechender wertungsanpassung aller spieler fliegen die erfahrensten spieler am ende raus (also im prinzip habe ich hier 5 "generationen). sprich man sammelt im laufe seiner karriere 80 punkte und scheidet dann aus dem system aus. das ergebnis war:

die neu einsteigenden spieler fangen zwar mit 100 punkten an, fallen aber sofort ab auf 60, was ihrer realen spielstärke entspricht. die verlorenen 40 punkte zum durchschnitt werden im system aufgeteilt und kompensieren die 40 punkte über durchschnitt, die von den ausscheidenden spielern mitgenommen werden.

das neue system nach shaack:
zuerst wird die reale spielstärke berechnet, die sich bei 60 befindet. der startwert des spielers wird aber auf 100 gesetzt, die 40 punkte pro neueinsteiger werden also künstlich ins system gepumpt. das system bleibt genau dann stabil, wenn die ausscheidenden spieler ebensoviele pluspunkte wieder aus dem system mitnehmen.

was schließen wir daraus?
ich nehme an, dass die anzahl der einsteigenden und aussteigenden spieler relativ konstant bleibt. basierend auf dieser annahme muss jeder spieler, der ins system eintritt, so viele überschüssige punkte mitbringen, wie von einem einzigen durchschnittlichen ausscheidenden spieler aus dem system entfernt werden. da shaack 50 punkte ins system pumpt, haben wir es also tatsächlich mit spielern zu tun, die sich im laufe ihrer chessmailkarriere um durchschnittlich 100 punkte verbessern. sie beginnen 50 punkte unter durchschnitt (was ihrer realen anfangswertung entspricht) und verlassen chessmail mit etwa 50 punkten über durchschnittlicher spielstärke, was dann ihrer realen endspielstärke entspricht.
shaack - 07. Jun '23
LWB hat ja vor ein paar Wochen quasi 2.500 Punkte aus dem System entfernt. Dazu braucht man dann 50 neue Spieler, die jeweils 50 gepushte Punkte mitbringen und die längere Zeit dabei bleiben um diese Punkte auch wieder an das System abzugeben um das auszugleichen. Um mal ein extremes Beispiel zu bringen.
shaack - 07. Jun '23
2.500 Punkte aus dem System zu entfernen bedeutet, dass jeder Spieler 0,5-1 Punkte verliert. Also kaum zu bemerken bei einer Schwankungsbreite bzw. Genauigkeit von ±200 Punkten der ELO-Zahl.
Feyerabend - 07. Jun '23
Gibt es eigentlich einen Zusammenhang zwischen Wertungspunkten und Standardabweichung?
shaack - 07. Jun '23
Standardabweichung wird doch Gauß-Verteilung und auch Normalverteilung genannt, oder?
toby84 - 07. Jun '23
die normalverteilung wird über den erwartungswert und die standardabweichung definiert. man könnte sagen, die standardabweichung beschreibt dabei die streuung.

aber was genau ist gemeint mit der frage "Gibt es eigentlich einen Zusammenhang zwischen Wertungspunkten und Standardabweichung?"?
shaack - 07. Jun '23
"Alles ist verflochten." -- Dirk Gently

Alles hat einen Zusammenhang, also, Ja!
niclas - 07. Jun '23
Ich bin spiele in Deutschland in Baden Württemberg (schachverband Württemberg in Bezirk Unterland )aktiv Schach in einem Verein. Neben Saionspiele nehme abzu auch bei Turnier Teil die ausgewertet werden Dwz und teilweise Dwz und Elo). Ich habe eine Elozahl. Würde es Sinn elozahl bei Mitgliedern von chessmail zu berücksichtigen (die elozahl haben)?
Feyerabend - 07. Jun '23
Ich kenne die Standartabweichung bei IQ Werten.
Deren Durchschnitt aller Menschen liegt bei 100 (Wertungszahlen bei CM 1600).
Eine Standartabweichung sind 15 IQ Punkte (bei CM schätze ich auf ca 100 Punkte).
Zwischen IQ 85 und 115 (also eine Standartabweichung nach oben oder unten) liegen 2/3 aller Menschen (oder 1/3 oberhalb und 1/3 unterhalb).
Jede weitere Standartabweichung besagt, dass wieder 2/3 der Menschen in dem Intervall liegen.
Mit dem System lässt sich recht anschaulich verstehen wie weit Leute vom Durchschnitt entfernt sind bzw. wie außergewöhnlich Werte z.B von IQ 200 sind.
shaack - 08. Jun '23 Bearbeitet
Ich glaube, das ist alles nach derselben Gauß-Verteilung z.B. IQ Verteilung, Wertungszahlen, Körpergröße, Würfe beim Dart, Augenzahl mehrerer Würfel.
toby84 - 08. Jun '23
also erst mal ist die elo-zahl ja nur ein versuch, die spielstärkezahlen in ein korsett zu zwängen, das einer normalverteilung ähnelt. dass das nicht wirklich funktioniert, sieht man doch schon im link mit dem graphen, den shaack geteilt hat. trotzdem kann man ja die werte anschauen, die einer standardabweichung in der normalverteilung entsprechen würden. dafür schaut man sich an, bei welchen werten man
0,27%, 4,55%, 31,73%, 50%, 68,27%, 95,45%, 99,73% aller mitglieder findet. dann hast du eine quasi-standardabweichung. bei normalverteilung wären diese abstände alle identisch. hier werden sie es nicht sein.
toby84 - 08. Jun '23 Bearbeitet
"Ich habe eine Elozahl. Würde es Sinn elozahl bei Mitgliedern von chessmail zu berücksichtigen (die elozahl haben)?"

da sehe ich einige gründe, die dagegen sprechen:
1. es sind vermutlich einfach zu wenige, die eine elozahl haben. ich habe z.b. keine
2. das ließe sich bestenfalls als momentaufnahme basteln. man hätte plötzlich eine mischung aus zwei wertungssystemen, die aus unterschiedlichen spielerpools gefüttert werden. die kombination könnte die durchschnittliche wertung pro spieler von der 1600 wegschieben, weil man aus dem zweiten pool ja nur eine mehr oder weniger zufällige teilmenge betrachtet. man müsste also neu mitteln und die angepassten, auf 1600 gemittelten werte angeben.
3. wie gestern schon ausführlich diskutiert wurde, müssen 1600 FIDE-elo nicht notwendigerweise 1600 chessmail-elo entsprechen. elo ist eine relative vergleichszahl, und ohne weiteres lässt sie sich nur in einem einzelnen geschlossenen elo-system vergleichen. wenn ausnahmslos alle spieler auf chessmail eine FIDE-elo hätten, wäre das nicht so schlimm. jeder einzelne ohne FIDE-elo würde allerdings das bild verzerren.
4. das alte thema: das wäre eine vermischung von nahschach- und fernschachspielstärke. da müsste man sich schon fragen, was diese aussagen würde. vermutlich nicht sonderlich viel.

bearbeitet: RS-korrektur

jetzt versuche ich, weiterzuschlafen. gute nacht.
toby84 - 09. Jun '23 Bearbeitet
so ich habe jetzt endlich einen artikeln gefunden, der auf andere weise beschreibt, wie es zur elo-inflation in höheren FIDE-spielstärken kommen kann.

de.chessbase.com/post/die-elo-inflation-verstehen

der chessbase-artikel findet einen S-förmigen anstieg der spielstärke. die zeitpunkte der elo-erweiterungen haben dabei keinen einfluss auf die entwicklung, was der obigen theorie widerspricht.

das fazit des artikels ist: die spieler heute sind tatsächlich stärker als die spieler von früher. das darf gerne diskutiert werden 😉

und noch ein punkt zur normalverteilung:
ich habe mir jetzt mal angeschaut, wo ihr die behauptung her habt, dass die spielstärken aller spieler normalverteilt wären: die normalverteilung in der elo-berechnung bezieht sich auf die gewinnwahrscheinlichkeit pro spiel, die normalverteilt angenommen wird. über die globale spielstärkeverteilungen lässt sich damit überhaupt keine aussage treffen.

bearbeitung: denkfehler korrigiert 😉
mr20 - 09. Jun '23
Interessanter Artikel.
Er macht deutlich, dass man die Entwicklung differenziert betrachten muss.
Spitzenspieler profitieren noch stärker von den Erfahrungen der Vergangenheit und den neuen Methoden und Techniken als Hobbyspieler. Dadurch erreichen sie ein höheres Niveau als Spitzen vergangener Epochen.
Ich halte das für sehr plausibel. Einem heutigen Ingenieur ist es auch möglich wesentlich bessere Autos zu entwerfen, als dies in den 1970er oder 1920er oder gar 1880er möglich war. Nicht, weil die Menschen so viel klüger geworden sind, sondern weil mehr Erfahrungen, Methoden, Werkzeuge zur Verfügung stehen.
Wer, wie ein Hobbyspieler, diese Errungenschaften nicht ausschöpfen kann, erreicht auch kaum ein höheres Niveau als seine Vorfahren.
Dieser Beitrag kann nicht mehr kommentiert werden