Smalltalk

Sandbagging, epic_fail und Rangliste

shaack - 17. Mai '16
Hallo, also epic_fail hat gezeigt, dass es mit "Sandbagging" ( de.wikipedia.org/wiki/Sandbagging) möglich ist, sich auf die Spitze der Rangliste zu katapultieren. Das mag der eine als unsportlich ansehen und der andere als einen Hinweis auf Verbesserungsmöglichkeiten des Systems. Im Prinzip ein interessanter Test, der wirklich nicht viel mit Sportlichkeit zu tun hat aber auch nicht so einfach durchzuführen ist.

Die Hauptfrage, die sich mir nun stellt ist, was könnte man an der Wertungsberechnung verändern um so etwas zu verhindern?
Vabanque - 17. Mai '16
Tja, es hätte z.B. wohl nicht geklappt, wenn nicht die Wertung des Gegners zu Anfang, sondern zu Ende der Partie maßgeblich gewesen wäre. Denn nach einer Reihe von gewonnenen Partien hätte Ulenspiegel dann schon so wenig Punkte gehabt, dass für epic_fail nichts mehr zu holen gewesen wäre.
Belian - 17. Mai '16
das ist eine gute idee! der direkte punkteabstand zum ende des spiels könnnte entscheiden. allerdings birgt es das risiko das man taktisch agiert und partien früher beendet um punkte zu sparen.

ich weiss es nicht shaak
shaack - 17. Mai '16
Ja, richtig. Die Wertungsberechnung zum Ende des Spiels wurde damals in chessmail Version 1 so durchgeführt. Der Grund, warum sie jetzt zum Anfang des Spiels durchgeführt wird ist, dass damals der Vorwurf kam, es würden Spiele absichtlich verzögert, um mehr Punkte rauszuschlagen. Wenn jemand zum Beispiel sah, dass der Gegner in einem anderen Spiel am verlieren ist, wurde dann gewartet, bis das Spiel verloren ist. Eine Berechnung zum Anfang der Partie zeigt von Anfang an klar, um welche Punkte es geht.
cutter - 18. Mai '16
Bei Wikipedia kann man lesen, dass viele Veranstalter Sandbagging organisatorisch ahnden. Das finde ich besser, als die Regeln zu ändern, die mit gutem Grund so gemacht wurden, wie sie jetzt sind.
Grüße cutter
Belian - 18. Mai '16
die einzige möglichkeit die ich sehe ist...

das nur turnierspiele gewertet werden, die kann man schlecht oder nur in ganz geringem maße beeinflussen und es fördert die aktivität in turnieren.

die CL ist ein event und könnte m.e. als F spiele durchgeführt werden. es geht hier ums prestige!

von mir aus setz bei der endgültigen entscheidung alles auf 0
shaack - 18. Mai '16
Eine weitere Möglichkeit wäre eventuell der Wechsel von der ELO Formel zur Glicko-2 Formel zur Wertungsberechnung. glicko.net/glicko.html

"[..] to provide some advice on choosing the system parameter tau when the application of the rating system could involve large collections of extremely improbable game outcomes."

Ich muss aber zugeben, dass ich diese Berechnung noch nicht ganz verstehe und sie sicher komplizierter ist, als die jetzige.
hanjoheyer - 18. Mai '16
Vielleicht ist das Problem lösbar unter der Annahme, dass ein Spieler kaum in der Lage ist, in einer Woche mehr als 20 oder 30 Punkte wirklich besser zu werden. Bei cm-Wert-Schwankungen größer 20 oder 30 Punkten pro Woche könnte die (neu festzulegende) Regel greifen, dass man pro Woche höchstens 20 oder 30 Punkte hinzugewinnen (oder verlieren) kann.
MarkD - 18. Mai '16
Um zu verhindern, dass ein Spieler mit zwei Accounts vom gleichen Rechner spielt, könnte man die IP-Adresse des Rechners beim Spieler speichern und Partien von einer IP-Adresse verbieten. Problematisch bei z.B. innerfamiliären Spielen und natürlich umgehbar.

Ansonsten kann man natürlich ganz einfach die Zahl der gleichzeitigen Partien zwischen zwei Spielern (Turnierpartien ausgenommen) z.B. auf vier begrenzen, um den Effekt zu verringern.
macmoldis - 18. Mai '16
aber klar ist er in der Lage soviel Punkte in der Woche zu holen, rein zufällig drei Spiele gegen gleichstarke an einem Tag beendet und die auch noch gewonnen macht 30 Punkte an einem Tag ... nichts ist unmöglich

Punkte und Ränge werden eh überbewertet


zum Thema Wertung am Ende oder zu Beginn des Spiels:
zum Ende ist wohl etwas ehrlicher und fairer und macht o.g. "Sandbagging" auf Dauer wertlos. Man sollte abwägen welche Manipulation wie oft nun vorkommt und wie die Auswirkungen auf die Chessmailwertung insgesamt sind.
Der eine oder andere Spieler, der sich hochpuscht und alle regen sich drüber auf (es gibt soviele wachsame Augen hier) oder aber mal ein paar Spiele wegen ein paar Punkten etwas länger gespielt ... Peanuts ... alles überbewertet
macmoldis - 18. Mai '16
gleiche IP, gleiche Rechner kann man finden klar,
kann man auch umgehen und kann auch ganz legal/regulär passieren

begrenzen der Partien zwischen zwei Spielern ist auch nicht so, einfach hintereinander gespielt ... wer wirklich manipulieren will, hat mit beidem kein Problem ... shaack müßte höchstens bei Aufdeckung von Manipulationen als Strafrichter tätig werden, aber ob das wirklich Sinn macht und gewollt ist?
shaack - 18. Mai '16
Richtig, in großen Firmen haben auch mal 2.000 Leute die gleiche IP, mit einem normalen DSL-Anschluss hat man jeden Tag eine andere, die am nächsten Tag ein anderer hat. Das ist aber auch egal, das mit der IP ist nicht der richte Weg. Ein guter Weg wäre, dass die Wertungsänderung bei unplausiblen Spielausgängen geringer ausfällt. Wie gesagt Glicko-2 könnte es bringen.
h2m2 - 18. Mai '16
"glicko-2"

hier ein link zur aktuellen Diskussion:
chess.com/article/view/chess-ratings---how-they-work?page=1

Sieht eigentlich vielversprechend aus und wäre es wert, einmal in einem automatisch erstellten chessmail-Turnier versuchsweise auszuprobieren. Die notwendigen software-Anteile stehen dankenswerter Weise ja auch zur freien Verfügung.

Fehlt "nur" noch ihre Implementierung unter chessmail ...
Doublehunter - 18. Mai '16
Vielleicht wäre eine Begrenzung auf 4 W-Spiele unter einander ein kleiner erster Schritt. Turniere ausgenommen. Dann die Möglichkeit nehmen, nach 8 F Spielen über 2000 Punkte zu haben. Enginepartien mit zu werten, ist vielleicht nicht ganz so gut. Auf jeden Fall sollten solche ermauschelten Punkte abgezogen werden. Egal wie sie berechnet wurden.
Grüesli Doublehunter
alms - 18. Mai '16
Der Betreiber hat hier ein Wertungssystem installiert, um den Nutzern die Orientierung zu erleichtern. Jeder soll sich darauf verlassen können, dass die Wertzahl des Spielpartners ungefähr dessen Spielstärke entspricht. Damit ist m.E. zugleich gesagt, dass das Wertungssystem nicht manipuliert werden soll. Wer sich auf dieser Plattform bewegt, sollte sich an die Regeln halten.

Vorliegend gab es entweder einen Doppelaccount oder eine Absprache zwischen zwei Spielern. Beides ist unzulässig. Der bzw. die Nutzer sollten m.E. einfach gesperrt werden, schon aus Gründen der Abschreckung. Es ist richtig, dass nicht jede Manipulation erkannt werden kann. Das bedeutet aber nicht, dass erkannte Sanktionen sanktionsfrei bleiben müssen.

Mich wundert ein bisschen, dass der Club von epic_fail nichts zu unternehmen scheint. Oder übersehe ich da etwas?
eika13 - 18. Mai '16
@ alms

Ja. Colorado77 hatte um Geduld gebeten.
hanjoheyer - 18. Mai '16
Was Epic Fail und Ulenspiegel gemacht haben, ist durchaus eine Eulenspiegelei, die den Verdacht nahelegt, dass hier bewusst die cm-Wert-Berechnung durch den Kakao gezogen werden sollte. Aber die Sache war nicht verboten; eine Sperrung beider Spieler halte ich deshalb für unangebracht.
ABER: Die cm-Wert-Berechnung muss vor künftigem Missbrauch geschützt werden. Sonst komme auch ich noch auf die Idee, meinen 1700er Wert künstlich auf 2800 hochzupuschen. Wie es geht, wissen wir ja nun.

Es wurden mehrere Vorschläge gemacht: Statt des Anfangswertes den aktuellen Wert zu nehmen bei der Berechnung des neuen Wertes nach Beendigung eines Spieles. Shaack hat hierzu angemerkt, dass auch diese Methode, die in Version 1 von Chessmail verwendet wurde, missbraucht wurde.

Ich denke, zwei gute Möglichkeiten bleiben übrig:
1. Man darf gegen ein anderes Mitglied nur höchstens 4 Spiele gleichzeitig spielen - außer in Turnieren.
2. Wer innerhalb von sieben Tagen nach der bestehenden Formel mehr als 30 Punkte gewinnen oder verloren hat, dessen cm-Wert wird auf +- 30 Punkte festgelegt, da es nicht zu erwarten ist, dass ein Spieler binnen einer Woche wirklich mehr als 30 Punkte besser wird.

Ich denke, dass Pkt. 2. die zuverlässigere Methode darstellt, um diese großen Schwankungen, die mit der realen Spielstärke nichts zu tun haben können, zu verhindern.
Belian - 18. Mai '16
Hmm...Also nur mal laut gedacht
Wenn ich auf eine Spielerstatistik schau steht da "die Statistik der letzten 30 Spiele" in Prozent, schön aufgelistet in grün, weiss und rot!
Spiel 31 kippt weg und verschwindet im Nirvana!
Was wenn man das mit der Wertung auch so macht!? Sie Punkte der letzten 3-4 Monate. Die Punkte die ein Spieler davor bekommen hat fallen weg. Das verhindert auch das Spieler einen Wert erreichen und sich darauf unendlich ausruhen. Sie müssen aktiv bleiben um ihren Wert zu halten! So ähnlich geht des doch auch mit der Inaktivität momentan...spielen sie zu lange nicht, erscheinen sie nicht mehr im Ranking...Dann müsste das auch gehen oder?

Rob
eika13 - 18. Mai '16
@hanjoheyer
Partie gehen (zumindest bei mir) in aller Regel über Monate.
Wenn durch Zufall nun mehrere Gegner innerhalb einer Woche aufgeben,
dann würde ich doch durch die Anwendung von Punkt 2. zu Unrecht bestraft.
Ich fand Cutters Vorschlag gut dieses Sandbagging in den Nutzungsbedingungen zu verbieten und dann in jedem einzelnen Fall zu ahnden.
Um shaack davon (weil dies ja sicher mannuell gemacht werden müßte) zu entlasten
könnte er z.B. 3 Spieler benennen welche solche an sie herrangetragenen Fälle prüfen und shaack dann das Ergebnis nur noch umsetzt.
Belian - 18. Mai '16
Spieler X erreicht 2000 Punkte erspielt im Folgemonat 200 und verliert sich den wegfallenden 80 Punkte und hat somit 2120 usw.

Man müsste nur sehen wie man das mit der Urlaubsregelung koppelt.

Dadurch wird auch verhindert das Top Spieler nur noch F spiele spielen.

Und wie im vorliegenden Fall sind die Punkte nach 3-4 Monaten wieder weg
hanjoheyer - 18. Mai '16
@ eika13: Wir müssen unterscheiden zwischen einer reinen Erfolgszahl und einer Spielstärkezahl.

Eine Spielstärkezahl sollte wenig schwanken. Bei Spielern, die noch lernen, sollte die Zahl langsam steigen; bei älteren Semestern sollte sie langsam abfallen. Bei ehrgeizigen jungen Schachspielern kann die Spielstärke auch schon mal rasant ansteigen. Aber trotzdem sind 30 Punkte Zuwachs pro Woche m.E. ausreichend, um diesen Leistungszuwachs als Zahl abzubilden.

Was du meinst, ist wohl eher eine Erfolgszahl: Pro gewonnenes Spiel gibt es zB 10 Punkte hinzu. Bei 10 gewonnenen Spielen dann eben 100 Punkte. Das ist schön, aber es zeigt nicht den echten Stärkezuwachs.

Es stellt sich jetzt die Frage, wie man die aktuellen Spielerfolgszahlen umwandelt in Spielstärkezahlen, die der cm-Wert ja eigentlich sein will. Welchen Wert wollen wir denn wirklich haben?

Wollen wir, dass die echte Spielstärke möglichst realistisch abgebildet wird, sollte eine "Bremse" eingebaut werden, da Lernerfolge, die mehr als 30 Punkte pro Woche entsprechen, allzu unwahrscheinlich sind.
shaack - 18. Mai '16
Ich habe jetzt die Wertungszahl von epic_fail wieder auf der Wert 2205 gesetzt, den er vor der Aktion hatte. Unabhängig davon, dass eine Lösung für solche Probleme auch für die Zukunft gefunden werden muss.
Belian - 18. Mai '16
Klingt gut
pirc_ - 18. Mai '16
das wertungssystem soll, so wie ich es verstehe, die vergleichbarkeit der einzelnen spieler vermitteln. dies ist meines erachtens eh nicht gegeben, da es hier 3 spielertypen gibt: 1. spieler die mit reinem hirnschmalz spielen 2. spieler die in bücher und Datenbanken schauen und 3. enginenutzer. also wie will man da die spieler vergleichen? ich finde von daher die rangliste per se nicht gut und bin Anhänger von F-spielen. (ich selbst nutze übrigens sehr gerne bücher und Datenbanken)
nichts desto trotz wäre eine einfache lösung: man wertet spiele gegen den selben gegner maximal zweimal im Monat! so kann man sich nicht selbst oder gegenseitig hochpushen!!
was wäre denn gewesen, wenn epic mit mir 20 spiele gestartet hätte?
ich hätte wahrscheinlich auch fast alle verloren, da er klar besser spielt, aber das wäre doch dann völlig legal gewesen und keinesfalls verwerflich.

@alms: warum der club von epic_fail nicht reagiert, ist doch ganz allein deren ding...da sollten sich andere clubs einfach raushalten.
alms - 18. Mai '16
> @alms: warum der club von epic_fail nicht reagiert, ist doch ganz allein deren ding...da sollten sich andere clubs einfach raushalten.

Ich bin ja auch kein Club, sondern ein einfacher Nutzer. Ich spreche da nur für mich. Es ging um die Frage von shaack, was man angesichts dieses "Falles" unternehmen könnte. Ein Gedanke wäre ja, dass die Clubs ein bisschen darauf achten, wie sich "ihre" Leute benehmen. Aber richtig, dass soll jeder Club selbst entscheiden, klar.
Rurouni - 18. Mai '16
Das wichtigste ist aber, dass die anfangswertung deutlich runtergesetzt werden muss, da mann nicht nach 10 gewonnenen spielen gegen Gegner von schnitt 1700 auf einmal 2300 oder 2100 Wertung bekommt, das ist einfach nicht fair gegenüber den anderen.

Eine weitere Möglichkeit wäre, wer alles gewinnt startet mit 1800, wer nur die hälfte der Punkte holt beginnt mit 1500 oder 1600 und wer alles verliert beginnt mit 1300 oder 1400. Das aber dann fest. Nur eine Möglichkeit...
Hasenrat - 18. Mai '16
Meiner Ansicht nach wäre es völlig ausreichend, dass es unmöglich wäre mehr als eine Doppelpartie gegen ein und denselben Gegner gleichzeitig zu spielen. Da gibt es auch keinen vernünftigen Grund für, da mehr als zwei zu starten.
pirc_ - 18. Mai '16
doch: bei clubinternen turnieren bei uns treffe ich öfters auf die selben gegner.
vielleicht: nicht mehr als 2 w-partien.
skofi - 18. Mai '16
Du findest auf allen Fernschachservern Mitglieder, die sich nicht an die Netiquette halten.
Wir könnten zunächst mal 'Die chessmail Nutzungsbedingungen' erweitern. Hier steht u.a. geschrieben:

3. Verhalten und Ausschluss von Nutzern
Der Nutzer erklärt sich damit einverstanden, jede Form von Beleidigung, Belästigung, Bedrohung oder Schädigung eines anderen Nutzers oder irgendeiner anderen Person über chessmail zu unterlassen.
Wir behalten uns vor, ohne Angabe von Gründen:
Beiträge aus dem Forum zu löschen,
Spiele zu beenden und zu löschen,
Accounts von der Nutzung des chessmail-Forums auszuschliessen und
Personen von der Nutzung von chessmail auszuschliessen
Es kann jeder Account für das chessmail-Forum oder chessmail gesperrt und gelöscht werden, deren Besitzer im Forum persönliche Angriffe ausführt oder in irgendeiner Weise gegen die chessmail-Nutzungsbedingungen verstößt.

Eine Erweiterung um den Begriff 'Sandbagging' lässt die Möglichkeit zu, eine Person (oder auch zwei) von chessmail auszuschliessen.

Das Wertungssystem würde ich nicht groß verändern wollen. Wir sollten jedoch die aktuellen Wertungszahlen zum Ende einer Partie zur Berechnung der 'neuen WZ' heranziehen. So ist dann die in der Spielinfo ersichtliche Wertungszahlenberechnung nur ein Schätzwert.
Einzelne Spiele werden manchmal erst nach Monaten, oder gar Jahren beendet. Bis dahin kann sich die eigene WZ, wie auch die des Mitstreiters erheblich verändert haben.

Von der Einführung einer Erfolgszahl, oder gar einer Beschränkung der Wertungszahlberechnung bei gleichen Gegnern halte ich persönlich Abstand.
Ich habe seit 1.1.2016 bis dato etwa 75 Spiele beendet und meine WZ hat sich um lediglich knapp 30 Punkte verbessert. Das lag allerdings an der Qualität meines Gegenübers.
Ich spiele hier mehrere Turniere gleichzeitig. Da kann es schonmal passieren, dass ich mehr als 2 Spiele gegen den gleichen Spieler absolvieren muss. Mich dafür zu bestrafen, dass ich ein aktiver Spieler bin, kann nicht im Sinne des Schachsports sein.

Ich empfehle also:

1. die Erweiterung der Netiquette um den Begriff 'Sandbagging'
2. die aktuellen Wertungszahlen bei Beendigung einer Partie zur Berechnung der 'Neuen' nehmen

und vielleicht sogar:

3. die Anzahl der Einladungen für ein 'freies Spiel' gegen einen einzelnen Spieler auf 2 begrenzen.

Gruß Jürgen
Beule - 18. Mai '16
wir hatten diese Diskussion ja schon sehr oft hier. Es gab auch immer wieder Leute, die damit beweissen wollten, das das Wertungssystem nicht perfekt ist (was es wahrscheinlich auch nicht gibt, weil jedes System irgendwie angreifbar sein wird).

Was mich persönlich etwas nervt ist, das die Leute, die das System durch solcherlei Vorgehen testen, selber noch nie einen Verbesserungsvorschlag gemacht haben. Frei nach dem Motto: "mosern kann ich über Mißstände richtig gut, aber eine Alternative kenne ich auch nicht"....gibt es irL leider auch zu oft...

Gruß
Andi (der selber leider auch keine Lösung parat hat) ;-)
hanjoheyer - 18. Mai '16
Ich hatte bereits angesprochen, dass wir uns entscheiden müssen, ob wir eine reine, sich mitunter schnell verändernde Erflolgszahl wollen oder eine Spielstärkezahl, die sich nur langsam verändert. Letztere steht hier genaugenommen gar nicht zur Diskussion. Die Erfolgszahl kann stark von der echten Spielstärke abweichen. Sie dient weniger, als eine Spielstärkezahl der Findung eines gleichstarken Gegners, aber sie ist ein stärkerer Motivator, was nicht zu verachten ist.
Ich selbst freue mich jedenfalls, wenn ich nach einem Spiel 10 Punkte gewonnen habe. Ich kämpfe darum, endlich 1800 Punkte zu erreichen. Ich war schon ein paar mal nahe dran, fiel jedoch wieder ab. Eigentlich möchte ich, dass das System so bleibt, wie es ist: MIT seinen großen Schwankungen, die NICHT die echte Spielstärke anzeigt.

Also sollte m.E. nur diese Systemschwäche, wie sie Epic Fail aufzeigte, künftig unterbunden werden. In seinem Fall war die Schwankung nach oben allzu krass. Epic Fail deswegen zu kritisieren, halte ich für unangebracht, weil sein Verhalten völlig legal war. Die Aufgabe aller Spiele vor seiner Aktion war vllt. nicht ganz fair, aber er hat ja vielen eine Freude mit seinen Geschenken gemacht.
Die Aktion mit Ulenspiegel zeigte dann eindeutig, dass das cm-Regelwerk eine Kontrolle braucht, damit solche Ausreißer nicht wieder passieren können.

Was müsste getan werden, wenn ich als echter 1700er jetzt unbedingt einen Elo von 3000 haben wollte, alle Spiele aufgäbe, 30 weitere Spiele gegen schlechter Bewertete begänne und aufgäbe, bis ich einen Elo von 1000 hätte, dann 100 neue Spieler gegen 1200er begänne und alles gewönne? Ich hätte dann einen Elo von 1000 + 100 x 20 = 3000 und wäre der Superweltmeister?
Hier würde die Begrenzung von Spielen gegen einunddenselben Gegner (wie bei Ulenspiegel) auf 2 oder 4 per Monat wirkungslos. Auch die anderen Vorschläge würden nicht funktionieren. Hier würde nur eines helfen: Dass die Elo- oder cm- Zahl ganz einfach solche Schwankungen nicht machen KANN! Das Programm wird einfach dahingehend geändert, dass ab einer Verschlechterung oder Verbesserung der Zahl nach heutiger Berechnungsmethode um mehr als 70 Punkte die Woche (10 Punkte täglich) auf diese maximale Veränderung beschränkt wird.
Würde ich alle aktuellen Spiele aufgeben, würde ich 70 Punkte verlieren. Ich müsste einen Riesenaufwand treiben, um bis zum Elo 1000 zu kommen und hätte keine Chance, die angestrebten 3000 zu erreichen, weil ich bloß 70 Punkte pro Woche mich verbessern könnte.
h2m2 - 18. Mai '16
glicko-2 :: eine mögliche Alternative zum Bewertungssystem ?

glicko.net/glicko.html

Hat jemand Interesse, diese Alternative gemeinsam mit mir einmal auszutesten und sie software-technisch zu realisieren? An einem konkreten chessmail-Turnier-Beispiel?

Würde mich über eine Meldung freuen.

bw h2m2
shaack - 18. Mai '16
Wahrscheinlich würde es im ersten Schritt reichen, das theoretisch mit dem herunterladbaren Excel-Plugin zu testen.
shaack - 18. Mai '16
Ich denke allerdings auch, dass das die sinnvollste Möglichkeit ist, da dieses Wertungssystem mehrere Vorteile gegenüber ELO bietet.
h2m2 - 18. Mai '16
ein erster Test in der html/javascript - Variante verlief schon erfolgreich.

Um "alles noch für chessmail-like" auszubereiten, da ist noch ne-menge-masse zu tun.

Die PHP-Variante sieht auch sehr stabil aus.
shaack - 18. Mai '16
Es gibt auch noch eine Java-Variante: github.com/goochjs/glicko2
die die richtige für chessmail wäre. Allerdings kann man bei der Implementierung einiges falsch machen, so dass man sie erst einmal prüfen müsste. Wahrscheinlich wäre das einfachste, sie mit der PHP Variante zu vergleichen und rauszufinden, ob sie die gleichen Ergebnisse liefern.
shaack - 18. Mai '16
Die JavaScript Variante kann man für LiveChess einsetzen, das basiert auf JavaScript.
Belian - 18. Mai '16
Das liest sich doch gut , was denkst du...müssen/sollen wir alle neu anfangen oder lässt sich das erneut umrechnen? Ich habe jetzt nicht alles gelesen , wie sieht die Wertungszahl im Vergleich zur DWZ oder CM Wertung aus? Ausgangswert 2000
h2m2 - 18. Mai '16
Soweit ist dieses alternative System glicko2 verstanden habe, berücksichtigt es im Gegensatz zum ELO-System die Häufigkeit bereits gespielter Partien und vergleicht diese mit denen des/der Partiegegner(s). Daraus ergibt sich dann die jeweils neue alternative Wertungszahl eines Spielers.

Wenn ich das richtig sehe, ist das tatsächlich sehr interessant - und es würde bedeuten, dass die Rangliste von Spielern sehr schnell "durcheinander gewirbelt" werden kann.

Beton-Top-20-Platzinhaber z.B., wie bisher bei chessmail "üblich", hätten da unter Umständen schnell das "Nachsehen"...

siehe auch: glicko.net/glicko/glicko.pdf (Seite 1, Abschnitt 2)
h2m2 - 18. Mai '16
@shaack

ad PHP-Variante:
da es sich hier bei um eine PHP.class handelt, macht der Einsatz Sinn. Komplex wird es allerdings, die Verbindung zur chessmail.DataBase zu erstellen, denn "ohne sie" geht ja nichts.

Daher ja auch im Fragenkatalog der Wunsch nach einem download von Partie-Datensätzen. Dann könnte man bswp. in Eigenregie eine solche Anwendung realisieren - zu welchen Sinn und Zweck auch immer.
gammapappa - 18. Mai '16
Je länger die Disskusion dauert, um so kompliziertere Varianten werden hier ins Spiel gebracht.
Als ich 2007 bei cm eingestiegen bin gab es die Wertung abhängig von der Punktzahl am Ende des Spiels. Das war die perfekte einfache Variante. Es gab zwar kleine taktische Plänkeleien mit dem Hinauszögern von Partien, aber die machten sogar Spaß und waren wirklich nicht der Rede wert hinsichtlich Manipulation.
Diese Variante in Verbindung mit der alten Rangliste waren meiner Meinung optimal und ausreichend auch hinsichtlich der immer wieder geäußerten Meinung, dass die Rangfolge eigentlich nebensächlich ist.
Man sollte nicht immer die bewährten Methoden in Frage stellen.
Das mit den neuen Rängen und Adelstiteln finde ich auch, wie schon jemand geäußert hat, eher peinlich.
osna79 - 24. Mai '16
Moinsen,
>> Als ich 2007 bei cm eingestiegen bin gab es die Wertung abhängig von der
>> Punktzahl am Ende des Spiels. Das war die perfekte einfache Variante.
Der Meinung bin ich allerdings auch!
Ich kenne diese Variante noch von meiner ehemaligen Seite 'kingchess' her und dort hatte sie sich IMHO bewährt ...
Dann kommt für die Berechnung zumindest der aktuelle Spielstand zum Tragen.

Ich habe auch schon mal zwei Spiele gegen einen nominell deutlich stärkeren (Rating ca. +300) Spieler verloren, der aber zu dem Zeitpunkt länger pausiert hatte und beim Rating deutlich unter mir lag (ca. -200).
Da haben mich die sicherlich verdiensten Niederlagen aber mal richtig Ratingpunkte gekostet ....... :-(

Ergo: eine Berechnung mit aktuellen Werten würde IMHO für deutlich mehr Gerechtigkeit sorgen, zumal sich manche Partien ja auch noch ewig hinziehen !!

Gruß Klaus
shaack - 24. Mai '16
Vor 12 jahren:
/forum/topic.html?key=50fe733787d4efa23&sv=3
Es war nicht perfekt, es gab regelmäßig Beschwerden über taktische Spielverzögerungen.
hanjoheyer - 24. Mai '16
Ich denke, wir können das System lassen wie es ist. Nehmen wir an, dass aufgrund der Berechnungsart ein Spieler zu hoch bewertet ist, dann wird er bei Siegen weniger Punkte hinzugewinnen, bis er seine reale Spielstärke in der cm-Zahl wiederfindet. Das heutige System erscheint mir jedoch etwas besser, als das alte, da es keine Spielverzögerungen provoziert, wie Shaack berichtet.

Die Adelstitel und die Unterteilung in 12 Kategorien gefallen mir zwar nicht, aber sie stören auch nicht. Mir würde die vorherige Rangliste, erweitert um die Plätze ab Platz 2000, am besten gefallen.
osna79 - 24. Mai '16
Moinsen,

ob die alte Regelung wirklich taktische Spielverzögerungen provoziert, sei mal dahin gestellt ....
So profitieren halt Spieler (wie ja auch in den ersten Posts hier beschrieben) IMHO überproportional, wenn sie länger pausieren.
Zudem fiel mir bei meinen Partien schon desöfteren auf, das die verteilten Ratingpunkte nicht immer im Verhältnis zu den jeweils aktuellen Werten stehen.

Letztlich ist es mir egal ..... allerdings gerecht finde ich es nicht!!

Theoretisch könnte ma ja auch einen Mittelwert bilden aus Rating beim Start und bei Spielende. Da sich hier häufiger Partien über etliche Monate hinziehen, wäre dass dann vlt. die Möglichkeit, die erwähnten Nachteile (Spielverzögerungen etc.), abzumildern rsp. zu vermeiden ...

Wie ist das es beim Nahschach? Welcher Wert wird da zu Berechnung herangezogen?

Gruß Klaus
Doublehunter - 24. Mai '16
1) Als Grundlage, die diese Aktion erst einmal möglich machte war, dass jemand innert nur 8(F)+2(E) Partien eine Wertungszahl von mehr als 2000 Punkte bekam. Wie geht so etwas? Gerecht ist das auf keinen Fall. Der sollte nach 10 Partien (ohne E) max. 1700 haben.
2) Ausschliessen, dass man untereinander nicht mehr als 6(?) Wertungspartien machen kann. Ausgenommen die Turnierpartien, dass sollte dann weiterhin gehen. F Partien können aber weiterhin miteinander gehen.
3) Wenn ein anderes Wertungssystem eingeführt wird (am Ende der Partie messen) dann die Gesamtbedenkzeit einführen. Mit der könnten die Bedenken der Spielverzögerung etwas gelindert werden.
4) In den Nutzungsbedingungen verankern, dass es nicht rechtens ist, sich hochzumogeln.

Man kann die Rangliste erst einmal so lassen. Da eine genaue Platzierungsanzeige für jeden CM-ler nicht geht, ist diese Variante als Übergangslösung vollkommen ausreichend.

Vielleicht wäre es dann möglich sich den beiden meistgewollten Wünschen zu widmen. Die grosse schweigende Mehrheit möchte nicht zu lange eine Partie spielen/ auf den nächsten Zug warten, oder warten das ein Turnier weitergeht.
Mit einer einstellbaren Gesamtbedenkzeit und der Möglichkeit von Eventualzügen wird durchaus auch der Wunsch von mehr zu spielenden Turnieren (nicht wartend) ein wenig erfüllt.
Grüesli Doublehunter
Arcachon - 24. Mai '16
Das einzige Wertungssystem, das alle Stärkekriterien eines Spielers miteinander verknüpft ist Glicko 2 und wenn man dessen komplizierte Implementierung scheut zumindest Glicko 1. Der einzige Schachverband der dieses System anwendet ist der Australische. Private Webseiten, wie auch CM hier fangen fast ausschließlich mit ELO oder auch einem Eigenbau an und auch wenn die Unzulänglichkeit dieses Systems nach Jahren klar wird scheut man die Umstellung auf ein gerechteres und korrekteres System.
Für alle, die Glicko 1+2 nicht kennen oder nur oberflächlich hier eine kurze Zusammenfassung der wichtigsten Unterschiede zu ELO:

Die Besonderheit des Systems liegt in der Einführung der RD (ratings deviation). Diese Variable erlaubt es die Abweichung der aktuellen Wertungszahl von der tatsächlichen (aber unbekannten) Spielstärke eines Spielers abzuschätzen. Hat ein Spieler zB eine Wertungszahl von 1500 und eine RD von 50, liegt seine tatsächliche Spielstärke mit einer Wahrscheinlichkeit von 95 % im Bereich von 1400 bis 1600. Wenn ein Spieler spielt, sinkt sein RD, da seine Wertungszahl mit jedem Spiel genauer wird. Spielt er nicht, steigt diese wieder langsam über die Zeit an. Außerdem bewirkt ein hoher RD, dass sich seine Wertungszahl in größeren Intervallen ändert. Dies bedeutet konkret, dass ein Spieler mit einer hohen RD (wenn er auf einer Webseite beginnt zu spielen) nicht in der Rankingliste auftaucht, da seine aktuelle Spielstärke von der tatsächlichen sehr starkt abweicht.

Durch die RD wird auch sichergestellt, dass sich die Wertungszahl eines aktiven Spielers, der gegen einen neuen oder inaktiven Spieler spielt, nur geringfügig ändert. Dies ist sinnvoll, da die Stärke des neuen oder inaktiven Spielers nicht genau genug bekannt ist und das Resultat daher nicht viel über die tatsächliche Stärke des aktiven Spielers aussagt.
Über die RD – Höhe die den Ausschlag dafür gibt, dass ein Spieler in der offiziellen Rankingliste auftaucht entscheidet der Administrator.
Darüberhinaus ist in Glicko 2 auch eine Rating Volatility vorgesehen die eine Variable hinsichtlich der langfristigen Zuverlässigkeit der Spielstärkezahl eines Spielers ist. Dies betrifft die Dauer die zwischen dem letzten Spiel eines Spielers liegt und seinem Neustart. Dies bedeutet dass wenn ein Spieler vor längerer Zeit mit einer Spielstärke von 2000 aufhörte und dann wieder anfängt zu spielen seine Wertungszahl sinkt und die RD nach oben schnellt.
Es kommt natürlich vor und das ist die Regel, dass bei einer nur geringen Partienzahl durch die RD nach 10 Partien ein Spieler ein sehr hohe Wertungszahl erhält, die aber nach den Glicko-System nichts über seine wahre Spielstärke aussagt. Erst wenn die RD unter – sagen wir mal - den Wert von 150 fällt taucht der betreffende Spieler überhaupt erst in der Ratingliste auf, dann aber dürfte sich in Abhängigkeit von der RD seine zu diesem Zeitpunkt aktuelle Spielstärke auch seiner tatsächsächlich zuverlässig angenähert haben.
Curius - 24. Mai '16
Danke Arcachon, das ist wirklich eine gut verständliche Erklärung gewesen!

Glicko scheint also schon ein gutes Bild von der Realität abbilden zu können, aber für jemanden der eben nicht gerade eine so gute Erklärung gelesen hat dürfte es wohl dennoch etwas undurchsichtig sein, oder? (Auch für die, die nicht so gut deutsch sprechen; ich erinnere mich noch an eine Dame aus Bulgarien, die völlig aufgelöst war, als Shaack die 250 Punkte Wertungszahlanpassung gemacht hat! Mit Glicko hätte man das nach jedem Urlaub...).
Arcachon - 24. Mai '16
Die Rating Volatility tritt erst nach einer längeren Zeitspanne in Erscheinung (hängt von der Entscheidung des Admins ab) von sagen wir mal einem Jahr. Der Urlaub spielt hierfür keine Rolle. Und dies auch nur wenn nach Glicko 2 die Spielstärke berechnet wird. In Glicko 1 gibts keine RV.
Dieser Beitrag kann nicht mehr kommentiert werden