Kapitel 1. Wahrscheinlichkeit

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Die Grundlage der Bayes'schen Statistik ist das Bayes'sche Theorem, und die Grundlage des Bayes'schen Theorems ist die bedingte Wahrscheinlichkeit.

In diesem Kapitel beginnen wir mit der bedingten Wahrscheinlichkeit, leiten den Satz von Bayes her und demonstrieren ihn anhand eines echten Datensatzes. Im nächsten Kapitel werden wir den Satz von Bayes anwenden, um Probleme im Zusammenhang mit der bedingten Wahrscheinlichkeitsrechnung zu lösen. In den folgenden Kapiteln werden wir den Übergang vom Bayes'schen Satz zur Bayes'schen Statistik vollziehen und den Unterschied erklären.

Linda die Bankerin

Zur Einführung in die bedingte Wahrscheinlichkeit verwende ich ein Beispielaus einem berühmten Experiment von Tversky und Kahneman, die die folgende Frage gestellt haben:

Linda ist 31 Jahre alt, ledig, freimütig und sehr intelligent. Sie hat Philosophie studiert. Als Studentin beschäftigte sie sich intensiv mit Fragen der Diskriminierung und sozialen Gerechtigkeit und nahm auch an Anti-Atomkraft-Demonstrationen teil. Was ist wahrscheinlicher?

  1. Linda ist eine Bankangestellte.

  2. Linda ist Bankangestellte und in der feministischen Bewegung aktiv.

Viele wählen die zweite Antwort, vermutlich weil sie besser zur Beschreibung passt. Es scheint untypisch zu sein, wenn Lindanur eine Bankangestellte ist; es scheint stimmiger, wenn sie auch eine Feministin ist.

Aber die zweite Antwort kann nicht "wahrscheinlicher" sein, wie die Frage lautet. Nehmen wir an, wir finden 1.000 Menschen, auf die Lindas Beschreibung passt, und 10 von ihnen arbeiten als Bankangestellte. Wie viele von ihnen sind auch Feministinnen? Im besten Fall sind alle 10 von ihnen Feministinnen; in diesem Fall sind die beiden Optionen gleichwahrscheinlich. Wenn es weniger als 10 sind, ist die zweite Option unwahrscheinlicher, aber es gibt keine Möglichkeit, dass die zweite Option wahrscheinlicher ist.

Wenn du dazu neigst, die zweite Option zu wählen, bist du in guter Gesellschaft. Der BiologeStephen J. Gould schrieb:

Ich mag dieses Beispiel besonders gerne, weil ich weiß, dass die [zweite] Aussage am unwahrscheinlichsten ist, aber ein kleiner Homunkulus in meinem Kopf springt weiter auf und ab und schreit mich an: "Aber sie kann doch nicht nur eine Bankangestellte sein; lies die Beschreibung."

Wenn der kleine Mensch in deinem Kopf immer noch unglücklich ist, hilft dir vielleicht dieses Kapitel.

Wahrscheinlichkeit

An dieser Stelle sollte ich eine Definition von "Wahrscheinlichkeit" geben, aber daserweist sich als überraschend schwierig. Damit wir nicht von vornherein feststecken, verwenden wir zunächst eine einfache Definition, die wir später verfeinern: EineWahrscheinlichkeit ist ein Bruchteil einer endlichen Menge.

Wenn wir zum Beispiel 1.000 Personen befragen und 20 von ihnen Bankangestellte sind, beträgt der Anteil derer, die als Bankangestellte arbeiten, 0,02 oder 2 %. Wenn wir eine Person aus dieser Grundgesamtheit zufällig auswählen, beträgt die Wahrscheinlichkeit, dass sie ein Bankangestellter ist, 2 %. Mit "zufällig" meine ich, dass jede Person imDatensatz die gleiche Chance hat, ausgewählt zu werden.

Mit dieser Definition und einem geeigneten Datensatz können wir die Wahrscheinlichkeiten durch Auszählen berechnen. Zur Veranschaulichung verwende ich Daten aus dem General Social Survey (GSS).

Ich verwende Pandas, um die Daten zu lesen und sie in einemDataFrame zu speichern.

import pandas as pd

gss = pd.read_csv('gss_bayes.csv', index_col=0)
gss.head()
Jahr Alter Sex polviews partyid indus10
caseid
1 1974 21.0 1 4.0 2.0 4970.0
2 1974 41.0 1 5.0 0.0 9160.0
5 1974 58.0 2 6.0 1.0 2670.0
6 1974 30.0 1 5.0 4.0 6870.0
7 1974 48.0 1 5.0 4.0 7860.0

Die DataFrame hat eine Zeile für jede befragte Person und eine Spalte für jede Variable, die ich ausgewählt habe.

Die Spalten sind

  • caseid: Befragten-ID (das ist der Index der Tabelle).

  • year: Jahr, in dem der Befragte befragt wurde.

  • age: Alter des Befragten bei der Befragung.

  • sex: Männlich oder weiblich.

  • polviews: Die politischen Ansichten reichen von liberal bis konservativ.

  • partyid: Politische Parteizugehörigkeit: Demokraten, Republikaner oder Unabhängige.

  • indus10: Code fürdie Branche, in der der Befragte arbeitet.

Schauen wir uns diese Variablen genauer an, beginnend mitindus10.

Anteil der Banker

Der Code für "Bankwesen und verwandte Tätigkeiten" ist 6870, also können wir Banker so auswählen:

banker = (gss['indus10'] == 6870)
banker.head()
caseid
1    False
2    False
5    False
6     True
7    False
Name: indus10, dtype: bool

Das Ergebnis ist ein Pandas Series, das die booleschen Werte Trueund False enthält.

Wenn wir die Funktion sum auf diese Series anwenden, behandelt sie True als 1 undFalse als 0, sodass die Summe die Anzahl der Banker ist:

banker.sum()
728

In diesem Datensatz gibt es 728 Banker.

Um den Anteil der Banker zu berechnen, können wir die Funktion mean verwenden, die den Anteil der True Werte in der Series berechnet:

banker.mean()
0.014769730168391155

Etwa 1,5 % der Befragten arbeiten im Bankwesen. Wenn wir also eine zufällige Person aus dem Datensatz auswählen, liegt die Wahrscheinlichkeit, dass sie ein Banker ist, bei etwa 1,5 %.

Die Wahrscheinlichkeitsfunktion

Ich füge den Code aus dem vorherigen Abschnitt in eine Funktionein, die einen booleschen Wert Series annimmt und eine Wahrscheinlichkeit zurückgibt:

def prob(A):
    """Computes the probability of a proposition, A."""
    return A.mean()

So können wir den Anteil der Banker berechnen:

prob(banker)
0.014769730168391155

Schauen wir uns nun eine andere Variable in diesem Datensatz an. Die Werte der Spalte sex sind wie folgt kodiert:

1    Male
2    Female

Wir können also eine boolesche Series erstellen, die für weibliche Befragte True und ansonsten False lautet:

female = (gss['sex'] == 2)

Und verwende sie, um den Anteil der Befragten zu berechnen, die Frauen sind:

prob(female)
0.5378575776019476

Der Anteil der Frauen in diesem Datensatz ist höher als in der erwachsenen US-Bevölkerung, weil das GSS keine Personen erfasst, die in Einrichtungen wie Gefängnissen und Militärunterkünften leben, und diese Bevölkerungsgruppen sind wahrscheinlich eher männlich.

Politische Ansichten und Parteien

Die anderen Variablen, die wir betrachten, sind polviews, die die politischen Ansichten der Befragten beschreibt, und partyid, die ihre Zugehörigkeit zu einer politischen Partei beschreibt.

Die Werte von polviews sind auf einer Sieben-Punkte-Skala:

1   Extremely liberal
2   Liberal
3   Slightly liberal
4   Moderate
5   Slightly conservative
6   Conservative
7   Extremely conservative

Ich definiere liberal als True für alle, deren Antwort "Extrem liberal", "Liberal" oder "Leicht liberal" lautet:

liberal = (gss['polviews'] <= 3)

Hier ist der Anteil der Befragten, die nach dieser Definition liberal sind:

prob(liberal)
0.27374721038750255

Wenn wir eine zufällige Person aus diesem Datensatz auswählen, liegt die Wahrscheinlichkeit, dass sie liberal ist, bei etwa 27 %.

Die Werte von partyid werden wie folgt kodiert:

0   Strong democrat
1   Not strong democrat
2   Independent, near democrat
3   Independent
4   Independent, near republican
5   Not strong republican
6   Strong republican
7   Other party

Ich definiere democrat so, dass die Befragten, die "Starke Demokraten" oder "Nicht starke Demokraten" gewählt haben, dazu gehören:

democrat = (gss['partyid'] <= 1)

Und hier ist der Anteil der Befragten, die nach dieser Definition Demokraten sind:

prob(democrat)
0.3662609048488537

Konjunktion

Nachdem wir nun eine Definition der Wahrscheinlichkeit und eine Funktion, die sie berechnet, haben, können wir zur Konjunktion übergehen.

"Konjunktion" ist ein anderer Name für die logische Operation and. Wenn du zwei Sätze hast, Aund B, ist die Konjunktion A and B True , wenn sowohl A als auch BTrue sind, und sonst False.

Wenn wir zwei boolesche Series haben, können wir den & Operator verwenden, um ihre Konjunktion zu berechnen. Wir haben zum Beispiel bereits die Wahrscheinlichkeit berechnet, dass ein Befragter ein Banker ist:

prob(banker)
0.014769730168391155

Und die Wahrscheinlichkeit, dass sie eine Demokratin oder ein Demokrat sind:

prob(democrat)
0.3662609048488537

Jetzt können wir die Wahrscheinlichkeit berechnen, dass ein Befragter ein Banker und ein Demokrat ist:

prob(banker & democrat)
0.004686548995739501

Wie zu erwarten, ist prob(banker & democrat) weniger alsprob(banker), denn nicht alle Banker sind Demokraten.

Wir gehen davon aus, dass die Konjunktion kommutativ ist, d.h. A & B sollte gleichwie B & A sein. Um das zu überprüfen, können wir auchprob(democrat & banker) berechnen:

prob(democrat & banker)
0.004686548995739501

Wie erwartet, sind sie gleich.

Bedingte Wahrscheinlichkeit

Die bedingte Wahrscheinlichkeit ist eine Wahrscheinlichkeit, die von einer Bedingung abhängt,aber das ist vielleicht nicht die hilfreichste Definition. Hier sind einige Beispiele:

  • Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter ein Demokrat ist, wenn er liberal ist?

  • Wie hoch ist die Wahrscheinlichkeit, dass eine befragte Person weiblich ist, wenn sie eine Bankangestellte ist?

  • Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter liberal ist, wenn er weiblich ist?

Beginnen wir mit der ersten Frage, die wir wie folgt interpretieren können: "Wie hoch ist der Anteil der Demokraten an allen Befragten, die liberal sind?"

Wir können diese Wahrscheinlichkeit in zwei Schritten berechnen:

  1. Wähle alle Befragten aus, die liberal sind.

  2. Berechne den Anteil der ausgewählten Befragten, die Demokraten sind.

Um liberale Befragte auszuwählen, können wir den Klammeroperator [] wie folgt verwenden:

selected = democrat[liberal]

selected enthält die Werte von democrat für liberale Befragte.prob(selected) ist also der Anteil der Liberalen, die Demokraten sind:

prob(selected)
0.5206403320240125

Etwas mehr als die Hälfte der Liberalen sind Demokraten. Wenn dieses Ergebnis niedriger ist, als du erwartet hast, solltest du daran denken:

  1. Wir haben eine etwas strenge Definition von "Demokraten" verwendet, die Unabhängige ausschließt, die den Demokraten "zuneigen".

  2. Der Datensatz umfasst Befragte, die bis ins Jahr 1974 zurückgehen. Zu Beginn dieses Zeitraums gab es im Vergleich zu heute weniger Übereinstimmung zwischen politischen Ansichten und Parteizugehörigkeit.

Versuchen wir es mit dem zweiten Beispiel: "Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter weiblich ist, wenn er ein Banker ist?" Wir können das so interpretieren: "Wie hoch ist der Anteil der Frauen unter allen Befragten, die Banker sind?"

Auch hier verwenden wir den Klammeroperator, um nur die Banker auszuwählen, und prob, um den Anteil der Frauen zu berechnen:

selected = female[banker]
prob(selected)
0.7706043956043956

Etwa 77% der Banker in diesem Datensatz sind weiblich.

Lasst uns diese Berechnung in eine Funktion verpacken. Ich definiere conditional , um zwei boolesche Series, proposition undgiven zu nehmen und die bedingte Wahrscheinlichkeit von propositionin Abhängigkeit von given zu berechnen:

def conditional(proposition, given):
    return prob(proposition[given])

Wir können conditional verwenden, um die Wahrscheinlichkeit zu berechnen, dass ein Befragter liberal ist, wenn er weiblich ist:

conditional(liberal, given=female)
0.27581004111500884

Etwa 28% der weiblichen Befragten sind liberal.

Ich habe das Schlüsselwort given zusammen mit dem Parameter female eingefügt, um diesen Ausdruck lesbarer zu machen.

Bedingte Wahrscheinlichkeit ist nicht kommutativ

Wir haben gesehen, dass die Konjunktion kommutativ ist; das heißt, prob(A & B) ist immer gleich prob(B & A).

Aber die bedingte Wahrscheinlichkeit ist nicht kommutativ; das heißt,conditional(A, B) ist nicht dasselbe wie conditional(B, A).

Das sollte klar sein, wenn wir uns ein Beispiel ansehen. Zuvor haben wir die Wahrscheinlichkeit berechnet, dass ein Befragter weiblich ist, wenn er Banker ist.

conditional(female, given=banker)
0.7706043956043956

Das Ergebnis zeigt, dass die Mehrheit der Banker weiblich ist. Das ist nicht dasselbe wie die Wahrscheinlichkeit, dass ein Befragter ein Banker ist, wenn er weiblich ist:

conditional(banker, given=female)
0.02116102749801969

Nur etwa 2 % der weiblichen Befragten sind Banker.

Ich hoffe, dieses Beispiel macht deutlich, dass die bedingte Wahrscheinlichkeit nicht kommutativ ist, und vielleicht war es dir auch schon klar. Trotzdem ist es ein häufiger Fehler, conditional(A, B) und conditional(B, A) zu verwechseln. Wir werden später einige Beispiele sehen.

Bedingung und Konjunktion

Wir können bedingte Wahrscheinlichkeiten und Konjunktionen kombinieren. Zum Beispiel:Hier ist die Wahrscheinlichkeit, dass ein Befragter weiblich ist, wenn er ein liberaler Demokrat ist:

conditional(female, given=liberal & democrat)
0.576085409252669

Etwa 57% der liberalen Demokraten sind weiblich.

Und hier ist die Wahrscheinlichkeit, dass es sich um eine liberale Frau handelt, da sie eine Bankerin ist:

conditional(liberal & female, given=banker)
0.17307692307692307

Etwa 17% der Banker sind liberale Frauen.

Wahrscheinlichkeitsgesetze

In den nächsten Abschnitten werden wir drei Beziehungen zwischen Konjunktion und bedingter Wahrscheinlichkeit herleiten:

  • Theorem 1: Eine Konjunktion verwenden, um eine bedingte Wahrscheinlichkeit zu berechnen.

  • Theorem 2: Die Verwendung einer bedingten Wahrscheinlichkeit zur Berechnung einer Konjunktion.

  • Theorem 3: Mit conditional(A, B) kannst du conditional(B, A) berechnen.

Theorem 3 ist auch als Bayes'sches Theorem bekannt.

Ich schreibe diese Theoreme in der mathematischen Notation der Wahrscheinlichkeit:

  • P ( A ) ist die Wahrscheinlichkeit des Satzes A .

  • P ( A und B ) ist die Wahrscheinlichkeit, dass die Konjunktion von A und B d.h. die Wahrscheinlichkeit, dass beide wahr sind.

  • P ( A | B ) ist die bedingte Wahrscheinlichkeit von A unter der Voraussetzung, dass B wahr ist. Die vertikale Linie zwischen A und B wird als "gegeben" bezeichnet.

Damit sind wir bereit für Theorem 1.

Theorem 1

Wie hoch ist der Anteil der weiblichen Bankangestellten? Wir haben bereits eine Möglichkeit gesehen, die Antwort zu berechnen:

  1. Benutze den Klammeroperator, um die Banker auszuwählen, dann

  2. Benutze mean, um den Anteil der weiblichen Bankangestellten zu berechnen.

Wir können diese Schritte wie folgt schreiben:

female[banker].mean()
0.7706043956043956

Oder wir können die Funktion conditional verwenden, die das Gleiche tut:

conditional(female, given=banker)
0.7706043956043956

Es gibt aber auch eine andere Möglichkeit, diese bedingte Wahrscheinlichkeit zu berechnen, indem du das Verhältnis zweier Wahrscheinlichkeiten berechnest:

  1. Der Anteil der Befragten, die Bankerinnen sind, und

  2. Der Anteil der Befragten, die Banker sind.

Mit anderen Worten: Wie hoch ist der Anteil der weiblichen Bankangestellten an der Gesamtzahl der Bankangestellten? So berechnen wir dieses Verhältnis:

prob(female & banker) / prob(banker)
0.7706043956043956

Das Ergebnis ist dasselbe. Dieses Beispiel zeigt eine allgemeine Regel, die mit der bedingten Wahrscheinlichkeit und der Konjunktion verbindet. So sieht sie in mathematischer Notation aus:

P ( A | B ) = P(A und B) P(B)

Und das ist Theorem 1.

Theorem 2

Wenn wir mit Theorem 1 beginnen und beide Seiten multiplizieren mit P ( B ) erhalten wir Theorem 2:

P ( A und B ) = P ( B ) P ( A | B )

Diese Formel schlägt eine zweite Möglichkeit vor, eine Konjunktion zu berechnen: Anstatt den & Operator zu verwenden, können wir das Produkt zweier Wahrscheinlichkeiten berechnen.

Schauen wir, ob es für liberal und democrat funktioniert. Hier ist das Ergebnis für &:

prob(liberal & democrat)
0.1425238385067965

Und hier ist das Ergebnis mit Theorem 2:

prob(democrat) * conditional(liberal, democrat)
0.1425238385067965

Sie sind identisch.

Theorem 3

Wir haben festgestellt, dass die Konjunktion kommutativ ist. In der mathematischen Notation bedeutet das:

P ( A und B ) = P ( B und A )

Wenn wir Theorem 2 auf beide Seiten anwenden, erhalten wir:

P ( B ) P ( A | B ) = P ( A ) P ( B | A )

Hier ist eine Möglichkeit, das zu interpretieren: Wenn du prüfen willst A und B prüfen willst, kannst du das in beliebiger Reihenfolge tun:

  1. Du kannst überprüfen B zuerst, dann A unter der Bedingung von B , oder

  2. Du kannst prüfen A zuerst, dann B unter der Bedingung von A .

Wenn wir durch dividieren durch P ( B ) , erhalten wir Theorem 3:

P ( A | B ) = P(A)P(B|A) P(B)

Und das, meine Freunde, ist das Bayes'sche Theorem.

Um zu sehen, wie das funktioniert, berechnen wir den Anteil der Banker, die liberal sind, indem wir zunächst conditional verwenden:

conditional(liberal, given=banker)
0.2239010989010989

Nutze nun das Theorem von Bayes:

prob(liberal) * conditional(banker, liberal) / prob(banker)
0.2239010989010989

Sie sind identisch.

Das Gesetz der Gesamtwahrscheinlichkeit

Zusätzlich zu diesen drei Theoremen brauchen wir noch eine weitere Sache, um Bayes'sche Statistik zu betreiben: das Gesetz der Gesamtwahrscheinlichkeit. Hier ist eine Form des Gesetzes, ausgedrückt in mathematischer Notation:

P ( A ) = P ( B 1 und A ) + P ( B 2 und A )

Mit anderen Worten, die Gesamtwahrscheinlichkeit von A ist die Summe von zwei Möglichkeiten: entweder B 1 und A sind wahr oder B 2 und A wahr sind. Aber dieses Gesetz gilt nur, wenn B 1 und B 2 sind:

  • sich gegenseitig ausschließen, was bedeutet, dass nur eine der beiden Aussagen wahr sein kann, und

  • Kollektiv erschöpfend, was bedeutet, dass eine von ihnen wahr sein muss.

Verwenden wir dieses Gesetz zum Beispiel, um die Wahrscheinlichkeit zu berechnen, dass ein Befragter ein Banker ist. Wir können sie direkt wie folgt berechnen:

prob(banker)
0.014769730168391155

Bestätigen wir also, dass wir dasselbe Ergebnis erhalten, wenn wir männliche und weibliche Banker getrennt berechnen.

In diesem Datensatz werden alle Befragten als männlich oder weiblich bezeichnet. Kürzlich kündigte das GSS Board of Overseers an, dass sie die Umfrage um inklusiveregeschlechtsspezifische Fragen erweitern werden (du kannst mehr über dieses Thema und ihre Entscheidung unterhttps://oreil.ly/onK2P lesen).

Wir haben bereits eine Boolesche Series, die True für weibliche Befragte ist. Hier ist das ergänzende Series für männliche Befragte:

male = (gss['sex'] == 1)

Jetzt können wir die Gesamtwahrscheinlichkeit von banker wie folgt berechnen:

prob(male & banker) + prob(female & banker)
0.014769730168391155

Da male und female sich gegenseitig ausschließen und kollektiv erschöpfend (MECE) sind, erhalten wir das gleiche Ergebnis, wenn wir die Wahrscheinlichkeit von banker direkt berechnen.

Unter Anwendung von Theorem 2 können wir das Gesetz der Gesamtwahrscheinlichkeit auch so schreiben:

P ( A ) = P ( B 1 ) P ( A | B 1 ) + P ( B 2 ) P ( A | B 2 )

Und wir können es mit demselben Beispiel testen:

(prob(male) * conditional(banker, given=male) +
prob(female) * conditional(banker, given=female))
0.014769730168391153

Wenn es mehr als zwei Bedingungen gibt, ist es übersichtlicher, das Gesetz der Gesamtwahrscheinlichkeit als Summation zu schreiben:

P ( A ) = i P ( B i ) P ( A | B i )

Dies gilt wiederum, solange die Bedingungen B i sich gegenseitig ausschließen und gemeinsam erschöpfend sind. Betrachten wir als Beispiel polviews, das sieben verschiedene Werte hat:

B = gss['polviews']
B.value_counts().sort_index()
1.0     1442
2.0     5808
3.0     6243
4.0    18943
5.0     7940
6.0     7319
7.0     1595
Name: polviews, dtype: int64

Auf dieser Skala steht 4.0 für "moderat". Wir können also die Wahrscheinlichkeit eines moderaten Bankers wie folgt berechnen:

i = 4
prob(B==i) * conditional(banker, B==i)
0.005822682085615744

Und wir können sum und einenGeneratorausdruck verwenden, um die Summierung zu berechnen:

sum(prob(B==i) * conditional(banker, B==i)
    for i in range(1, 8))
0.014769730168391157

Das Ergebnis ist das gleiche.

In diesem Beispiel ist die Anwendung des Gesetzes der Gesamtwahrscheinlichkeit viel aufwändiger als die direkte Berechnung der Wahrscheinlichkeit, aber sie wird sich als nützlich erweisen, das verspreche ich.

Zusammenfassung

Hier ist, was wir bis jetzt haben:

Theorem 1 gibt uns eine Möglichkeit, eine bedingte Wahrscheinlichkeit mithilfe einer Konjunktion zu berechnen:

P ( A | B ) = P(A und B) P(B)

Theorem 2 gibt uns eine Möglichkeit, eine Konjunktion mithilfe einer bedingten Wahrscheinlichkeit zu berechnen:

P ( A und B ) = P ( B ) P ( A | B )

Theorem 3, auch bekannt als Bayes-Theorem, gibt uns einen Weg, um von P ( A | B ) zu P ( B | A ) oder andersherum:

P ( A | B ) = P(A)P(B|A) P(B)

Das Gesetz der Gesamtwahrscheinlichkeit bietet eine Möglichkeit, Wahrscheinlichkeiten zu berechnen, indem man die Teile zusammenzählt:

P ( A ) = i P ( B i ) P ( A | B i )

An dieser Stelle könntest du fragen: "Na und?" Wenn wir alle Daten haben, können wir jede beliebige Wahrscheinlichkeit, jede Konjunktion oder jede bedingte Wahrscheinlichkeit berechnen, indem wir einfach zählen. Wir müssen diese Formeln nicht verwenden.

Und du hast Recht, wenn wir alle Daten haben. Aber oft haben wir das nicht, und in diesem Fall können diese Formeln sehr nützlich sein - vor allem der Satz von Bayes. Im nächsten Kapitel werden wir sehen, wie.

Übungen

Beispiel 1-1.

Lass uns die Werkzeuge in diesem Kapitel nutzen, um eine Variante des Linda-Problems zu lösen.

Linda ist 31 Jahre alt, ledig, freimütig und sehr intelligent. Sie hat Philosophie studiert. Als Studentin beschäftigte sie sich intensiv mit Fragen der Diskriminierung und sozialen Gerechtigkeit und nahm auch an Anti-Atomkraft-Demonstrationen teil. Was ist wahrscheinlicher?

  1. Linda ist eine Bankerin.

  2. Linda ist Bankerin und bezeichnet sich selbst als liberale Demokratin.

Um diese Frage zu beantworten, berechne

  • Die Wahrscheinlichkeit, dass Linda eine weibliche Bankangestellte ist,

  • Die Wahrscheinlichkeit, dass Linda eine liberale Bankerin ist, und

  • Die Wahrscheinlichkeit, dass Linda eine liberale Bankerin und eine Demokratin ist.

Beispiel 1-2.

Benutze conditional, um die folgenden Wahrscheinlichkeiten zu berechnen:

  • Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter liberal ist, wenn er ein Demokrat ist?

  • Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter ein Demokrat ist, wenn er liberal ist?

Überlege dir genau, in welcher Reihenfolge du die Argumente anconditional übergibst.

Beispiel 1-3.

Es gibt einberühmtes Zitat über junge Menschen, alte Menschen, Liberale und Konservative, das in etwa so lautet:

Wenn du mit 25 kein Liberaler bist, hast du kein Herz. Wenn du mit 35 kein Konservativer bist, hast du kein Hirn.

Unabhängig davon, ob du dieser Aussage zustimmst oder nicht, lassen sich daraus einige Wahrscheinlichkeiten ableiten, die wir als Übung berechnen können. Anstatt die Altersangaben 25 und 35 zu verwenden, definieren wir young und old als unter 30 oder über 65 Jahre:

young = (gss['age'] < 30)
prob(young)
0.19435991073240008
old = (gss['age'] >= 65)
prob(old)
0.17328058429701765

Für diese Schwellenwerte habe ich runde Zahlen in der Nähe des 20. und 80. Perzentils gewählt. Je nachdem, wie alt du bist, kannst du mit diesen Definitionen von "jung" und "alt" einverstanden sein oder auch nicht.

Ich definiere conservative als jemanden, dessen politische Ansichten "konservativ", "leicht konservativ" oder "extrem konservativ" sind.

conservative = (gss['polviews'] >= 5)
prob(conservative)
0.3419354838709677

Benutze prob und conditional, um die folgenden Wahrscheinlichkeiten zu berechnen:

  • Wie hoch ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Befragter ein junger Liberaler ist?

  • Wie hoch ist die Wahrscheinlichkeit, dass ein junger Mensch liberal ist?

  • Welcher Anteil der Befragten sind alte Konservative?

  • Welcher Anteil der Konservativen ist alt?

Überlege bei jeder Aussage, ob sie eine Konjunktion, eine bedingte Wahrscheinlichkeit oder beides ausdrückt.

Bei den bedingten Wahrscheinlichkeiten musst du auf die Reihenfolge der Argumente achten. Wenn deine Antwort auf die letzte Frage größer als 30 % ist, hast du es falsch herum gemacht!

Get Think Bayes, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.