Vorheriger Post: Tichu & Statistik Pt.1.2: Bomben und Schupfstrategie

Motivation

Große Tichu’s sind die wohl undynamischste Spielmechanik, die Tichu zu bieten hat: Es gab noch keine Kommunikation mit einer anderen Person in dieser Runde. Bis auf seine eigenen 8 hat man hat keine Ahnung, wie die Kartenverteilung der anderen Spieler aussieht.

Menschliche Kommunikation ist damit nicht gemeint, diese ist bei Tichu ja ohnehin verboten. Vielmehr Kommunikation durch Schupfen, spielen und legen von Karten usw. Damit erhält man alles Informationen über die Kartenverteilung in der Runde.

Ein großes Tichu anzusagen ist bei weitem keine statische/fixe Entscheidung, die man bei gegebenen 8 immer gleich beantwortet. Wichtige Faktoren, die in eine solche Entscheidung mit einfließen, sind: Wie ist der Punktestand? Wie viele Runden sind noch zu spielen? Wie gut spielt mein Partner? Wie gut spielen meine Gegner?

Ist nur noch wenig Zeit im Spiel und/oder spielt der Partner schlecht, so kann dies für eine etwas liberalere große Tichuansagestrategie sprechen. Ist nur noch eine Runde im Spiel, so liefert auch der nächste Post eine genauere Antwort.

Sind noch viele Runden im Spiel, liefern wir in diesem Post eine undynamische Antwort, die sich mit etwas Eigenarbeit aber dynamisch im Kontext interpretieren lässt und den erwarteten Rundengewinn maximiert.

Eine klassische Milchmädchenrechnung, mit der neue Spieler zum (großen) Tichu Ansagen ermutigt werden, ist in etwa:

Wenn du dein (großes) Tichu mit mehr als 50% Wahrscheinlichkeit gewinst, lohnt es sich im Schnitt schon.

Leider könnte diese Aussage nicht weiter von der Realität entfernt sein. Was dabei nämlich vergessen wird, ist das man mit guten Karten auch OHNE große Tichuansage oder kleine Tichuansage Punkte auf den Gegner gutmachen kann (Opportunitätskosten). Genau dies ist Bestandteil der Analyse dieses Kapitels und der des nächsten Kapitels. Wir unterteilen die ersten 8 Karten vereinfachend in 80 verschiedene Kategorien und vergleichen den erwarteten relativen Rundengewinn auf dem Datensatz in denen diese Hand mit einem großen Tichu angesagt wurde mit dem erwarteten relativen Gewinn, wenn damit kein großes Tichu angesagt wurde.

Es ist daher vereinfachend, das wir die (56 über 8) = 1420494075 verschiedenen GT Starthände auf 80 reduzieren. Für deine deutliche größere Kategorienzahl wäre auch auf diesem Datensatz keine statistische Signifikanz gegeben.

Die Kategorien

Gezählt werden die Anzahl Asse (0-4) und die 4 Sonderkarten Mahjong, Drache, Phönix und Hund. Für die Asse gibt es 5 verschiedene Möglichkeiten, und für die Sonderkarten gibt es $2^4 = 16$ Möglichkeiten. Insgesamt erhält man $5 \cdot 16 =80$ verschiedene Kategorien. In folgender Tabelle listen wir sie auf, zusammen mit ihrerer theoretischen Wahrscheinlichkeit, unter den ersten 8 vorliegend zu sein, zusätzlich zu der der Wahrscheinlichkeit, dass ein großes Tichu angesagt wurde, wenn diese Kategorie unter den ersten 8 vorliegt und der GT Success Rate. Wenn auf dem Datensatz bei gegebener Kategorie seltener als 300-mal ein großes Tichu angesagt wurde, wird der demtentsprechende Wert mit “-“ berichtet.

Mit 0 Assen und keiner Sonderkarte ist die Call Rate also 0.89%(*)/1.57%(**) und die Erfolgsrate auch niedrig: 36.76%(*)/ 34.53%(**). Mit 0 Assen und Drache + Phönix steigt die Call Rate bereits auf 51.54%(*)/ 82.57%(**) und die Erfolgsrate auf 75.29%(*)/ 74.45%(**).

Methodik

Sei eine der 80 fixen Kategorien fix gegeben, im Folgenden als $k \in \text{Kategorie}$ bezeichnet. Wir berechnen die Differenz aus

  1. \[E(\text{relativer Rundengewinn} | \text{k unter ersten 8, Spieler hat GT angesagt})\]
  2. \[E(\text{relativer Rundengewinn} | \text{k unter ersten 8, Spieler hat kein GT angesagt})\]

Kritik

Die oben genannten Karten bieten sicherlich die größte Basis für ein erfolgreiches großes Tichu, da unter den ersten 8 auch noch nicht so wahnnsinnig viele Kombinationen gebaut werden können. Trotzdem werden alle anderen Karten (Beikarten) vernachlässigt. Wenn wir den Erwartungswert oben durch die direkten Vorkomnisse auf dem Datensatz schätzen, hat dies einen nachteiligen Effekt: Man kann davon ausgehen, dass viele GT’s auch nur aufgrund guter Beikarten angesagt (und gewonnen) werden. Wird nicht angesagt, sind die Beikarten also tendenziell auch schlechter, was auch Auswirkungen auf die finale Hand haben kann. Da wir die erwarteten Rundengewinne aber voneinander abziehen, werden GT’s mit dieser Analyse leicht bevorteiligt dargestellt.

Leichte Verbesserung der Kritik

Wir verringern den oben angesprochenen Effekt, indem wir für jede der 80 Kategorien unter den ersten 8 die theoretische Übergangswahrscheinlichkeit zu denselben Kategorien für die ersten 14 Karten der Hand berechnen. Beispielsweise ist die Wahrscheinlichkeit, wenn man unter den ersten 8 0 Asse und keine Sonderkarte hat, immerhin noch 0.483%, unter den ersten 14 2 Asse und Drache zu haben. Die Übergangswahrscheinlichkeit einer Kategorie $k$ unter den ersten 8 zu $k’$ unter den ersten 14 wird im Folgenden immer als $ \text{Pr}(\text{k’ unter ersten 14} | \text{k unter ersten 8})$ bezeichnet. Eine vollständige Liste der Übergangswahrscheinlichkeiten findest du hier. Viele Gewichte sind hierbei natürlich auch 0, da die Kategorie unter den ersten 8 in der Kategorie der ersten 14 enthalten sein oder gleich sein muss.

Eine Kategorie $k’$ ist in der Kategorie $k$ enthalten, symbolisch $k’ < k$, wenn $k’ \neq k$, und: $\text{Anzahl Asse von } k’ \leq \text{Anzahl Asse von }k$, $ \text{Anzahl Drache von }k’ \leq \text{Anzahl Drache von }k$, usw.

Darauf hin schätzen wir \(E(\text{relativer Rundengewinn} | \text{k unter ersten 8, Spieler hat kein GT angesagt})\) durch die Äquivalenz:

\(\begin{eqnarray} E(\text{relativer Rundengewinn} | \text{k unter ersten 8, Spieler hat kein GT angesagt}) = \\ \sum_{k' \in \text{Kategorie}} E(\text{relativer Rundengewinn} | \text{k' unter ersten 14, k unter ersten 8, Spieler hat kein GT angesagt}) \cdot \text{Pr}(\text{k' unter ersten 14} | \text{k unter ersten 8}). \end{eqnarray}\) Wir nehmen vereinfachend an, dass \(\begin{eqnarray} E(\text{relativer Rundengewinn} | \text{k' unter ersten 14, k unter ersten 8, Spieler hat kein GT angesagt}) = \\ E(\text{relativer Rundengewinn} | \text{k' unter ersten 14, Spieler hat kein GT angesagt}) \end{eqnarray}\) gilt. Letzten Erwartungswert können wir durch alle Vorkomnisse auf dem Datensatz schätzen.

Das verbessert die Kritik in dem Sinne, dass die Runden mit schlechten Beikarten, bei denen ein GT abgelehnt wurde, weniger stark ins Gewicht fallen. Stattdessen werden nämlich alle Runden in denen kein großtes Tichu angesagt wurde, mithilfte von Gewichtung, zur Berechnung der Opportunitätskosten herangezogen, und nicht nur solche, bei denen die Kategorie unter den ersten 8 abgelehnt wurde. Zusätzlich liegen zur Berechnung der Erwartungswerte für die Kategorien unter den ersten 14 insgesamt mehr Daten vor.

Analog funktioniert diese Rechnung für den Fall, dass ein GT angesagt wurde, worauf wir diese Äquivalenz auch anwenden.

GT’s bleiben bei dieser Analyse dennoch leicht im Vorteil, weil diese trotzdem mit tendenziell guten Beikarten angesagt werden.

Exakte Methodik

Zusammenfassend berechnen wir also für $k \in \text{Kategorie}$ einmal

  1. Den erwarteten relativen Rundengewinn bei GT Ansage, gegeben dass die fixe Kategorie unter den ersten 8 vorliegt (geschätzt mithilfe der Äquivalenz): $ \sum_{k’ \in \text{Kategorie}} E(\text{relativer Rundengewinn} | \text{k’ unter ersten 14, Spieler hat GT angesagt}) \cdot \text{Pr}(\text{k’ unter ersten 14} | \text{k unter ersten 8}): $ 2.Den erwarteten relativen Rundengewinn bei Nicht- GT Ansage, gegeben dass die fixe Kategorie unter den ersten 8 vorliegt (geschätzt mithilfe der Äquivalenz): $ \sum_{k’ \in \text{Kategorie}} E(\text{relativer Rundengewinn} | \text{k’ unter ersten 14, Spieler hat kein GT angesagt}) \cdot \text{Pr}(\text{k’ unter ersten 14} | \text{k unter ersten 8}). $

Ist der in 1. berechnete Wert größer als der 2. so “lohnt” es sich ein GT anzusagen. Andersrum lohnt es sich nicht, wenn der in 2. berechnete Wert größer ist als der in 1. berechnete Wert. Wir berichten die Differenz aus 1. und 2. Das erlaubt es mit Erfahrung, den gegebenen Wert dynamisch zu beurteilen: Wir können die Kritik miteinbeziehen (dass GT’s überschätzt werden), in dem wir GT’s also leicht schlechter einschätzen, als sie durch den Wert angegeben werden, aber wir können auch unsere Risikobereitschaft miteinbeziehen sowie gute oder schlechte Beikarten mental zu dem Wert draufaddieren oder abziehen.

Es kommt vor, dass wir $ E(\text{relativer Rundengewinn} | \text{k’ unter ersten 14, Spieler hat kein GT angesagt}) $ oder $ E(\text{relativer Rundengewinn} | \text{k’ unter ersten 14, Spieler hat GT angesagt}) $ nicht schätzen wollen, weil für die Kategorie $k’$ dafür weniger als 300 Vorkommnisse auf dem Datensatz vorliegen.

Anstatt dafür aber keinen Wert zu berichten, ersetzen wir für diese Kategorien den Wert durch den höchsten Wert einer Kategorie, die in $k’$ enthalten ist. Das basiert auf der Annahme, dass eine Kategorie mindestens so gut ist, wie alle darin enthaltenen Kategorien (es ist nicht schlecht, ein Ass, Drache, Phönix, Mahjong oder Hund, mehr zu haben). Solche Werte werden in der folgenden Tabelle darüber hinaus fett markiert sein, damit man dies erkennt. Wir berichten in einer Tabelle, die du hier findest, für jede Kategorie $ E(\text{relativer Rundengewinn} | \text{k’ unter ersten 14, Spieler hat GT angesagt}) $, die theoretische Wahrscheinlichkeit, unter den ersten 14 vorliegend zu sein, und $ E(\text{relativer Rundengewinn} | \text{k’ unter ersten 14, Spieler hat kein GT angesagt}) $. In der sechsten und achten Spalte sind alle “korrigierten” Werte fett markiert.

Die theoretischen Übergangswahrscheinlichkeit $ \text{Pr}(\text{k’ unter ersten 14} | \text{k unter ersten 8})$ , liegen immer vor.

Nun sind wir endlich in der Lage, unsere Analyse auszuführen.

Wir berichten die Opportunitätskosten 1. - 2.. Hier sind alle Kategorien fett markiert, bei denen der Wert bei der Schätzung von 1. oder 2. mindestens 20% (gemessen an $ \text{Pr}(\text{k’ unter ersten 14} | \text{k unter ersten 8}) $ ) aller Erwartungswerte korrigiert wurden. Diese sind also nur eine grobe Schätzung und sollten mit Bedacht gesehen werden.

Es lohnt sich beispielsweise stets, mit beiden Phönix und Drache anzusagen, egal wie viele Asse man dazu sieht. Mit 1em Ass + Drache ist auf dem gefiltereten Datensatz kein Gewinn mehr zu erkennen. Gegen schlechtere Spieler lohnt es sich aber noch. Ab zwei Assen lohnt es sich auch mit nur einem Joker anzusagen.
Den Hund unter den ersten 8 zu haben, ist auffälligerweise tatsächlich oft ein Argument GEGEN ein großes Tichu, da sich die Opportunitsäkosten verringern. Wir untersuchen in einer weiteren Tabelle, ob dies durch die Verringerung von 1. oder von 2. bedingt ist.

Vergleicht man 1A 1Dr mit 1A 1Dr 1Do, so verliert man sowohl bei 1. als auch bei 2. etwas an erwartetem Rundengewinn. Bei 2. aber deutlich weniger, als beim GT. Eine mögliche Erklärung für den Punkteverlust ist die verringerte Doppelsiegquote, siehe Tichu & Statistik Pt.4: Schupfkarten.

Verschiedene Strategien im Vergleich

Wir vergleichen verschiedene GT-Ansage Strategien bezgl. ihrer GT Call Rate %:

  • Strategie 1: Ansage bei Ass+Ph/Dr oder Ph+Dr.
  • Strategie 2: Ansage bei Ass+Ph/Dr+1/Do oder Ph+Dr+1/Do.
  • Strategie 3: Ansage bei 2Ass+Ph/Dr oder Ass+Ph+Dr
  • Strategie 4: Ansage bei $1 \cdot \text{Asse} + 2. \cdot \text{Dr} + 1.9 \cdot \text{Ph} + 0.05 \cdot \text{Kings} + 0.1 \cdot (\text{Dog} + \text{Mah}) \ge 3$.
  • Strategie 5: Ansagen bei Opportunitätskosten $\ge 0$.
  • Strategie 6: Ansagen bei Opportunitätskosten $\ge 5$.
  • Strategie 7: Ansagen bei Opportunitätskosten $\ge 10$.
  • Strategie 8: Ansagen bei Opportunitätskosten $\ge 15$.
  • Strategie 9: Ansagen bei Opportunitätskosten $\ge 20$.
  • Strategie 10: Ansagen bei Opportunitätskosten $\ge -5$.
  • Strategie 11: Ansagen bei Opportunitätskosten $\ge -10$.
Situation GT Call Rate (*) GT Call Rate (**)
Strategie 1 12.69% Wahrscheinlichkeit ist exakt.
Strategie 2 2.79% Wahrscheinlichkeit ist exakt.
Strategie 3 2.62% Wahrscheinlichkeit ist exakt.
Strategie 4 9.12% Wahrscheinlichkeit ist exakt.
Strategie 5 14.23% 7.69%
Strategie 6 12.28% 4.22%
Strategie 7 12.22% 3.57%
Strategie 8 8.23% 2.84%
Strategie 9 4.28% 2.03%
Strategie 10 20.28% 8.71%
Strategie 11 26.38% 12.23%

Fazit

Wir haben in diesem Post die GT Ansage Strategie, gegeben einer fixen Kategorie unter den ersten 8, auf ihreren erwarteten Punktegewinn untersucht. Zwischen dem gefilterten und dem ungefilterten Datensatz sind größere Unterschiede zu erkennen. Gegen und mit “schlechteren” Spielern haben GT’s eine größere Daseinsberechtigung. Obwohl GT’s in der Analyse leicht bevorteiligt werden, erreicht die Ansagestrategie 5, die nur bei nicht-negativen Opportunitätskosten ansagt, eine Call Rate von “nur” 7.69% auf dem gefilterten Datensatz. Das ist deutlich geringer, als die tatsächlich auf dem Datensatz vorliegende GT Call Rate. GT’s haben aber auch abseits von der Maximierung des erwarteten Punktegewinn ihre Daseinsberechtigung, nämlich als Aufholmittel bei Rückstand. Zum Extremfall wird das in der letzten Runde eines Spiels. Eine Analyse dafür ist Bestandteil des nächsten Posts.


Nächster Post: Tichu & Statistik Pt.2.2: Große Tichus bei Rückstand in der letzten Runde