Kapitel 1. Wahrscheinlichkeit
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Grundlage der Bayes'schen Statistik ist das Bayes'sche Theorem, und die Grundlage des Bayes'schen Theorems ist die bedingte Wahrscheinlichkeit.
In diesem Kapitel beginnen wir mit der bedingten Wahrscheinlichkeit, leiten den Satz von Bayes her und demonstrieren ihn anhand eines echten Datensatzes. Im nächsten Kapitel werden wir den Satz von Bayes anwenden, um Probleme im Zusammenhang mit der bedingten Wahrscheinlichkeitsrechnung zu lösen. In den folgenden Kapiteln werden wir den Übergang vom Bayes'schen Satz zur Bayes'schen Statistik vollziehen und den Unterschied erklären.
Linda die Bankerin
Zur Einführung in die bedingte Wahrscheinlichkeit verwende ich ein Beispielaus einem berühmten Experiment von Tversky und Kahneman, die die folgende Frage gestellt haben:
Linda ist 31 Jahre alt, ledig, freimütig und sehr intelligent. Sie hat Philosophie studiert. Als Studentin beschäftigte sie sich intensiv mit Fragen der Diskriminierung und sozialen Gerechtigkeit und nahm auch an Anti-Atomkraft-Demonstrationen teil. Was ist wahrscheinlicher?
Linda ist eine Bankangestellte.
Linda ist Bankangestellte und in der feministischen Bewegung aktiv.
Viele wählen die zweite Antwort, vermutlich weil sie besser zur Beschreibung passt. Es scheint untypisch zu sein, wenn Lindanur eine Bankangestellte ist; es scheint stimmiger, wenn sie auch eine Feministin ist.
Aber die zweite Antwort kann nicht "wahrscheinlicher" sein, wie die Frage lautet. Nehmen wir an, wir finden 1.000 Menschen, auf die Lindas Beschreibung passt, und 10 von ihnen arbeiten als Bankangestellte. Wie viele von ihnen sind auch Feministinnen? Im besten Fall sind alle 10 von ihnen Feministinnen; in diesem Fall sind die beiden Optionen gleichwahrscheinlich. Wenn es weniger als 10 sind, ist die zweite Option unwahrscheinlicher, aber es gibt keine Möglichkeit, dass die zweite Option wahrscheinlicher ist.
Wenn du dazu neigst, die zweite Option zu wählen, bist du in guter Gesellschaft. Der BiologeStephen J. Gould schrieb:
Ich mag dieses Beispiel besonders gerne, weil ich weiß, dass die [zweite] Aussage am unwahrscheinlichsten ist, aber ein kleiner Homunkulus in meinem Kopf springt weiter auf und ab und schreit mich an: "Aber sie kann doch nicht nur eine Bankangestellte sein; lies die Beschreibung."
Wenn der kleine Mensch in deinem Kopf immer noch unglücklich ist, hilft dir vielleicht dieses Kapitel.
Wahrscheinlichkeit
An dieser Stelle sollte ich eine Definition von "Wahrscheinlichkeit" geben, aber daserweist sich als überraschend schwierig. Damit wir nicht von vornherein feststecken, verwenden wir zunächst eine einfache Definition, die wir später verfeinern: EineWahrscheinlichkeit ist ein Bruchteil einer endlichen Menge.
Wenn wir zum Beispiel 1.000 Personen befragen und 20 von ihnen Bankangestellte sind, beträgt der Anteil derer, die als Bankangestellte arbeiten, 0,02 oder 2 %. Wenn wir eine Person aus dieser Grundgesamtheit zufällig auswählen, beträgt die Wahrscheinlichkeit, dass sie ein Bankangestellter ist, 2 %. Mit "zufällig" meine ich, dass jede Person imDatensatz die gleiche Chance hat, ausgewählt zu werden.
Mit dieser Definition und einem geeigneten Datensatz können wir die Wahrscheinlichkeiten durch Auszählen berechnen. Zur Veranschaulichung verwende ich Daten aus dem General Social Survey (GSS).
Ich verwende Pandas, um die Daten zu lesen und sie in einemDataFrame
zu speichern.
import
pandas
as
pd
gss
=
pd
.
read_csv
(
'gss_bayes.csv'
,
index_col
=
0
)
gss
.
head
()
Jahr | Alter | Sex | polviews | partyid | indus10 | |
---|---|---|---|---|---|---|
caseid | ||||||
1 | 1974 | 21.0 | 1 | 4.0 | 2.0 | 4970.0 |
2 | 1974 | 41.0 | 1 | 5.0 | 0.0 | 9160.0 |
5 | 1974 | 58.0 | 2 | 6.0 | 1.0 | 2670.0 |
6 | 1974 | 30.0 | 1 | 5.0 | 4.0 | 6870.0 |
7 | 1974 | 48.0 | 1 | 5.0 | 4.0 | 7860.0 |
Die DataFrame
hat eine Zeile für jede befragte Person und eine Spalte für jede Variable, die ich ausgewählt habe.
Die Spalten sind
-
caseid
: Befragten-ID (das ist der Index der Tabelle). -
year
: Jahr, in dem der Befragte befragt wurde. -
age
: Alter des Befragten bei der Befragung. -
sex
: Männlich oder weiblich. -
polviews
: Die politischen Ansichten reichen von liberal bis konservativ. -
partyid
: Politische Parteizugehörigkeit: Demokraten, Republikaner oder Unabhängige.
Schauen wir uns diese Variablen genauer an, beginnend mitindus10
.
Anteil der Banker
Der Code für "Bankwesen und verwandte Tätigkeiten" ist 6870, also können wir Banker so auswählen:
banker
=
(
gss
[
'indus10'
]
==
6870
)
banker
.
head
()
caseid 1 False 2 False 5 False 6 True 7 False Name: indus10, dtype: bool
Das Ergebnis ist ein Pandas Series
, das die booleschen Werte True
und False
enthält.
Wenn wir die Funktion sum
auf diese Series
anwenden, behandelt sie True
als 1 undFalse
als 0, sodass die Summe die Anzahl der Banker ist:
banker
.
sum
()
728
In diesem Datensatz gibt es 728 Banker.
Um den Anteil der Banker zu berechnen, können wir die Funktion mean
verwenden, die den Anteil der True
Werte in der Series
berechnet:
banker
.
mean
()
0.014769730168391155
Etwa 1,5 % der Befragten arbeiten im Bankwesen. Wenn wir also eine zufällige Person aus dem Datensatz auswählen, liegt die Wahrscheinlichkeit, dass sie ein Banker ist, bei etwa 1,5 %.
Die Wahrscheinlichkeitsfunktion
Ich füge den Code aus dem vorherigen Abschnitt in eine Funktionein, die einen booleschen Wert Series
annimmt und eine Wahrscheinlichkeit zurückgibt:
def
prob
(
A
):
"""Computes the probability of a proposition, A."""
return
A
.
mean
()
So können wir den Anteil der Banker berechnen:
prob
(
banker
)
0.014769730168391155
Schauen wir uns nun eine andere Variable in diesem Datensatz an. Die Werte der Spalte sex
sind wie folgt kodiert:
1 Male 2 Female
Wir können also eine boolesche Series
erstellen, die für weibliche Befragte True
und ansonsten False
lautet:
female
=
(
gss
[
'sex'
]
==
2
)
Und verwende sie, um den Anteil der Befragten zu berechnen, die Frauen sind:
prob
(
female
)
0.5378575776019476
Der Anteil der Frauen in diesem Datensatz ist höher als in der erwachsenen US-Bevölkerung, weil das GSS keine Personen erfasst, die in Einrichtungen wie Gefängnissen und Militärunterkünften leben, und diese Bevölkerungsgruppen sind wahrscheinlich eher männlich.
Politische Ansichten und Parteien
Die anderen Variablen, die wir betrachten, sind polviews
, die die politischen Ansichten der Befragten beschreibt, und partyid
, die ihre Zugehörigkeit zu einer politischen Partei beschreibt.
Die Werte von polviews
sind auf einer Sieben-Punkte-Skala:
1 Extremely liberal 2 Liberal 3 Slightly liberal 4 Moderate 5 Slightly conservative 6 Conservative 7 Extremely conservative
Ich definiere liberal
als True
für alle, deren Antwort "Extrem liberal", "Liberal" oder "Leicht liberal" lautet:
liberal
=
(
gss
[
'polviews'
]
<=
3
)
Hier ist der Anteil der Befragten, die nach dieser Definition liberal sind:
prob
(
liberal
)
0.27374721038750255
Wenn wir eine zufällige Person aus diesem Datensatz auswählen, liegt die Wahrscheinlichkeit, dass sie liberal ist, bei etwa 27 %.
Die Werte von partyid
werden wie folgt kodiert:
0 Strong democrat 1 Not strong democrat 2 Independent, near democrat 3 Independent 4 Independent, near republican 5 Not strong republican 6 Strong republican 7 Other party
Ich definiere democrat
so, dass die Befragten, die "Starke Demokraten" oder "Nicht starke Demokraten" gewählt haben, dazu gehören:
democrat
=
(
gss
[
'partyid'
]
<=
1
)
Und hier ist der Anteil der Befragten, die nach dieser Definition Demokraten sind:
prob
(
democrat
)
0.3662609048488537
Konjunktion
Nachdem wir nun eine Definition der Wahrscheinlichkeit und eine Funktion, die sie berechnet, haben, können wir zur Konjunktion übergehen.
"Konjunktion" ist ein anderer Name für die logische Operation and
. Wenn du zwei Sätze hast, A
und B
, ist die Konjunktion A and B
True
, wenn sowohl A
als auch B
True
sind, und sonst False
.
Wenn wir zwei boolesche Series
haben, können wir den &
Operator verwenden, um ihre Konjunktion zu berechnen. Wir haben zum Beispiel bereits die Wahrscheinlichkeit berechnet, dass ein Befragter ein Banker ist:
prob
(
banker
)
0.014769730168391155
Und die Wahrscheinlichkeit, dass sie eine Demokratin oder ein Demokrat sind:
prob
(
democrat
)
0.3662609048488537
Jetzt können wir die Wahrscheinlichkeit berechnen, dass ein Befragter ein Banker und ein Demokrat ist:
prob
(
banker
&
democrat
)
0.004686548995739501
Wie zu erwarten, ist prob(banker & democrat)
weniger alsprob(banker)
, denn nicht alle Banker sind Demokraten.
Wir gehen davon aus, dass die Konjunktion kommutativ ist, d.h. A & B
sollte gleichwie B & A
sein. Um das zu überprüfen, können wir auchprob(democrat & banker)
berechnen:
prob
(
democrat
&
banker
)
0.004686548995739501
Wie erwartet, sind sie gleich.
Bedingte Wahrscheinlichkeit
Die bedingte Wahrscheinlichkeit ist eine Wahrscheinlichkeit, die von einer Bedingung abhängt,aber das ist vielleicht nicht die hilfreichste Definition. Hier sind einige Beispiele:
-
Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter ein Demokrat ist, wenn er liberal ist?
-
Wie hoch ist die Wahrscheinlichkeit, dass eine befragte Person weiblich ist, wenn sie eine Bankangestellte ist?
-
Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter liberal ist, wenn er weiblich ist?
Beginnen wir mit der ersten Frage, die wir wie folgt interpretieren können: "Wie hoch ist der Anteil der Demokraten an allen Befragten, die liberal sind?"
Wir können diese Wahrscheinlichkeit in zwei Schritten berechnen:
-
Wähle alle Befragten aus, die liberal sind.
-
Berechne den Anteil der ausgewählten Befragten, die Demokraten sind.
Um liberale Befragte auszuwählen, können wir den Klammeroperator []
wie folgt verwenden:
selected
=
democrat
[
liberal
]
selected
enthält die Werte von democrat
für liberale Befragte.prob(selected)
ist also der Anteil der Liberalen, die Demokraten sind:
prob
(
selected
)
0.5206403320240125
Etwas mehr als die Hälfte der Liberalen sind Demokraten. Wenn dieses Ergebnis niedriger ist, als du erwartet hast, solltest du daran denken:
-
Wir haben eine etwas strenge Definition von "Demokraten" verwendet, die Unabhängige ausschließt, die den Demokraten "zuneigen".
-
Der Datensatz umfasst Befragte, die bis ins Jahr 1974 zurückgehen. Zu Beginn dieses Zeitraums gab es im Vergleich zu heute weniger Übereinstimmung zwischen politischen Ansichten und Parteizugehörigkeit.
Versuchen wir es mit dem zweiten Beispiel: "Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter weiblich ist, wenn er ein Banker ist?" Wir können das so interpretieren: "Wie hoch ist der Anteil der Frauen unter allen Befragten, die Banker sind?"
Auch hier verwenden wir den Klammeroperator, um nur die Banker auszuwählen, und prob
, um den Anteil der Frauen zu berechnen:
selected
=
female
[
banker
]
prob
(
selected
)
0.7706043956043956
Etwa 77% der Banker in diesem Datensatz sind weiblich.
Lasst uns diese Berechnung in eine Funktion verpacken. Ich definiere conditional
, um zwei boolesche Series
, proposition
undgiven
zu nehmen und die bedingte Wahrscheinlichkeit von proposition
in Abhängigkeit von given
zu berechnen:
def
conditional
(
proposition
,
given
):
return
prob
(
proposition
[
given
])
Wir können conditional
verwenden, um die Wahrscheinlichkeit zu berechnen, dass ein Befragter liberal ist, wenn er weiblich ist:
conditional
(
liberal
,
given
=
female
)
0.27581004111500884
Etwa 28% der weiblichen Befragten sind liberal.
Ich habe das Schlüsselwort given
zusammen mit dem Parameter female
eingefügt, um diesen Ausdruck lesbarer zu machen.
Bedingte Wahrscheinlichkeit ist nicht kommutativ
Wir haben gesehen, dass die Konjunktion kommutativ ist; das heißt, prob(A & B)
ist immer gleich prob(B & A)
.
Aber die bedingte Wahrscheinlichkeit ist nicht kommutativ; das heißt,conditional(A, B)
ist nicht dasselbe wie conditional(B, A)
.
Das sollte klar sein, wenn wir uns ein Beispiel ansehen. Zuvor haben wir die Wahrscheinlichkeit berechnet, dass ein Befragter weiblich ist, wenn er Banker ist.
conditional
(
female
,
given
=
banker
)
0.7706043956043956
Das Ergebnis zeigt, dass die Mehrheit der Banker weiblich ist. Das ist nicht dasselbe wie die Wahrscheinlichkeit, dass ein Befragter ein Banker ist, wenn er weiblich ist:
conditional
(
banker
,
given
=
female
)
0.02116102749801969
Nur etwa 2 % der weiblichen Befragten sind Banker.
Ich hoffe, dieses Beispiel macht deutlich, dass die bedingte Wahrscheinlichkeit nicht kommutativ ist, und vielleicht war es dir auch schon klar. Trotzdem ist es ein häufiger Fehler, conditional(A, B)
und conditional(B, A)
zu verwechseln. Wir werden später einige Beispiele sehen.
Bedingung und Konjunktion
Wir können bedingte Wahrscheinlichkeiten und Konjunktionen kombinieren. Zum Beispiel:Hier ist die Wahrscheinlichkeit, dass ein Befragter weiblich ist, wenn er ein liberaler Demokrat ist:
conditional
(
female
,
given
=
liberal
&
democrat
)
0.576085409252669
Etwa 57% der liberalen Demokraten sind weiblich.
Und hier ist die Wahrscheinlichkeit, dass es sich um eine liberale Frau handelt, da sie eine Bankerin ist:
conditional
(
liberal
&
female
,
given
=
banker
)
0.17307692307692307
Etwa 17% der Banker sind liberale Frauen.
Wahrscheinlichkeitsgesetze
In den nächsten Abschnitten werden wir drei Beziehungen zwischen Konjunktion und bedingter Wahrscheinlichkeit herleiten:
-
Theorem 1: Eine Konjunktion verwenden, um eine bedingte Wahrscheinlichkeit zu berechnen.
-
Theorem 2: Die Verwendung einer bedingten Wahrscheinlichkeit zur Berechnung einer Konjunktion.
-
Theorem 3: Mit
conditional(A, B)
kannst duconditional(B, A)
berechnen.
Theorem 3 ist auch als Bayes'sches Theorem bekannt.
Ich schreibe diese Theoreme in der mathematischen Notation der Wahrscheinlichkeit:
-
ist die Wahrscheinlichkeit, dass die Konjunktion von und d.h. die Wahrscheinlichkeit, dass beide wahr sind.
-
ist die bedingte Wahrscheinlichkeit von unter der Voraussetzung, dass wahr ist. Die vertikale Linie zwischen und wird als "gegeben" bezeichnet.
Damit sind wir bereit für Theorem 1.
Theorem 1
Wie hoch ist der Anteil der weiblichen Bankangestellten? Wir haben bereits eine Möglichkeit gesehen, die Antwort zu berechnen:
-
Benutze den Klammeroperator, um die Banker auszuwählen, dann
-
Benutze
mean
, um den Anteil der weiblichen Bankangestellten zu berechnen.
Wir können diese Schritte wie folgt schreiben:
female
[
banker
]
.
mean
()
0.7706043956043956
Oder wir können die Funktion conditional
verwenden, die das Gleiche tut:
conditional
(
female
,
given
=
banker
)
0.7706043956043956
Es gibt aber auch eine andere Möglichkeit, diese bedingte Wahrscheinlichkeit zu berechnen, indem du das Verhältnis zweier Wahrscheinlichkeiten berechnest:
-
Der Anteil der Befragten, die Bankerinnen sind, und
-
Der Anteil der Befragten, die Banker sind.
Mit anderen Worten: Wie hoch ist der Anteil der weiblichen Bankangestellten an der Gesamtzahl der Bankangestellten? So berechnen wir dieses Verhältnis:
prob
(
female
&
banker
)
/
prob
(
banker
)
0.7706043956043956
Das Ergebnis ist dasselbe. Dieses Beispiel zeigt eine allgemeine Regel, die mit der bedingten Wahrscheinlichkeit und der Konjunktion verbindet. So sieht sie in mathematischer Notation aus:
Und das ist Theorem 1.
Theorem 2
Wenn wir mit Theorem 1 beginnen und beide Seiten multiplizieren miterhalten wir Theorem 2:
Diese Formel schlägt eine zweite Möglichkeit vor, eine Konjunktion zu berechnen: Anstatt den &
Operator zu verwenden, können wir das Produkt zweier Wahrscheinlichkeiten berechnen.
Schauen wir, ob es für liberal
und democrat
funktioniert. Hier ist das Ergebnis für &
:
prob
(
liberal
&
democrat
)
0.1425238385067965
Und hier ist das Ergebnis mit Theorem 2:
prob
(
democrat
)
*
conditional
(
liberal
,
democrat
)
0.1425238385067965
Sie sind identisch.
Theorem 3
Wir haben festgestellt, dass die Konjunktion kommutativ ist. In der mathematischen Notation bedeutet das:
Wenn wir Theorem 2 auf beide Seiten anwenden, erhalten wir:
Hier ist eine Möglichkeit, das zu interpretieren: Wenn du prüfen willst und prüfen willst, kannst du das in beliebiger Reihenfolge tun:
-
Du kannst überprüfen zuerst, dann unter der Bedingung von , oder
-
Du kannst prüfen zuerst, dann unter der Bedingung von .
Wenn wir durch dividieren durch , erhalten wir Theorem 3:
Und das, meine Freunde, ist das Bayes'sche Theorem.
Um zu sehen, wie das funktioniert, berechnen wir den Anteil der Banker, die liberal sind, indem wir zunächst conditional
verwenden:
conditional
(
liberal
,
given
=
banker
)
0.2239010989010989
Nutze nun das Theorem von Bayes:
prob
(
liberal
)
*
conditional
(
banker
,
liberal
)
/
prob
(
banker
)
0.2239010989010989
Sie sind identisch.
Das Gesetz der Gesamtwahrscheinlichkeit
Zusätzlich zu diesen drei Theoremen brauchen wir noch eine weitere Sache, um Bayes'sche Statistik zu betreiben: das Gesetz der Gesamtwahrscheinlichkeit. Hier ist eine Form des Gesetzes, ausgedrückt in mathematischer Notation:
Mit anderen Worten, die Gesamtwahrscheinlichkeit von ist die Summe von zwei Möglichkeiten: entweder und sind wahr oder und wahr sind. Aber dieses Gesetz gilt nur, wenn und sind:
-
sich gegenseitig ausschließen, was bedeutet, dass nur eine der beiden Aussagen wahr sein kann, und
-
Kollektiv erschöpfend, was bedeutet, dass eine von ihnen wahr sein muss.
Verwenden wir dieses Gesetz zum Beispiel, um die Wahrscheinlichkeit zu berechnen, dass ein Befragter ein Banker ist. Wir können sie direkt wie folgt berechnen:
prob
(
banker
)
0.014769730168391155
Bestätigen wir also, dass wir dasselbe Ergebnis erhalten, wenn wir männliche und weibliche Banker getrennt berechnen.
In diesem Datensatz werden alle Befragten als männlich oder weiblich bezeichnet. Kürzlich kündigte das GSS Board of Overseers an, dass sie die Umfrage um inklusiveregeschlechtsspezifische Fragen erweitern werden (du kannst mehr über dieses Thema und ihre Entscheidung unterhttps://oreil.ly/onK2P lesen).
Wir haben bereits eine Boolesche Series
, die True
für weibliche Befragte ist. Hier ist das ergänzende Series
für männliche Befragte:
male
=
(
gss
[
'sex'
]
==
1
)
Jetzt können wir die Gesamtwahrscheinlichkeit von banker
wie folgt berechnen:
prob
(
male
&
banker
)
+
prob
(
female
&
banker
)
0.014769730168391155
Da male
und female
sich gegenseitig ausschließen und kollektiv erschöpfend (MECE) sind, erhalten wir das gleiche Ergebnis, wenn wir die Wahrscheinlichkeit von banker
direkt berechnen.
Unter Anwendung von Theorem 2 können wir das Gesetz der Gesamtwahrscheinlichkeit auch so schreiben:
Und wir können es mit demselben Beispiel testen:
(
prob
(
male
)
*
conditional
(
banker
,
given
=
male
)
+
prob
(
female
)
*
conditional
(
banker
,
given
=
female
))
0.014769730168391153
Wenn es mehr als zwei Bedingungen gibt, ist es übersichtlicher, das Gesetz der Gesamtwahrscheinlichkeit als Summation zu schreiben:
Dies gilt wiederum, solange die Bedingungen sich gegenseitig ausschließen und gemeinsam erschöpfend sind. Betrachten wir als Beispiel polviews
, das sieben verschiedene Werte hat:
B
=
gss
[
'polviews'
]
B
.
value_counts
()
.
sort_index
()
1.0 1442 2.0 5808 3.0 6243 4.0 18943 5.0 7940 6.0 7319 7.0 1595 Name: polviews, dtype: int64
Auf dieser Skala steht 4.0
für "moderat". Wir können also die Wahrscheinlichkeit eines moderaten Bankers wie folgt berechnen:
i
=
4
prob
(
B
==
i
)
*
conditional
(
banker
,
B
==
i
)
0.005822682085615744
Und wir können sum
und einenGeneratorausdruck verwenden, um die Summierung zu berechnen:
sum
(
prob
(
B
==
i
)
*
conditional
(
banker
,
B
==
i
)
for
i
in
range
(
1
,
8
))
0.014769730168391157
Das Ergebnis ist das gleiche.
In diesem Beispiel ist die Anwendung des Gesetzes der Gesamtwahrscheinlichkeit viel aufwändiger als die direkte Berechnung der Wahrscheinlichkeit, aber sie wird sich als nützlich erweisen, das verspreche ich.
Zusammenfassung
Hier ist, was wir bis jetzt haben:
Theorem 1 gibt uns eine Möglichkeit, eine bedingte Wahrscheinlichkeit mithilfe einer Konjunktion zu berechnen:
Theorem 2 gibt uns eine Möglichkeit, eine Konjunktion mithilfe einer bedingten Wahrscheinlichkeit zu berechnen:
Theorem 3, auch bekannt als Bayes-Theorem, gibt uns einen Weg, um von zu oder andersherum:
Das Gesetz der Gesamtwahrscheinlichkeit bietet eine Möglichkeit, Wahrscheinlichkeiten zu berechnen, indem man die Teile zusammenzählt:
An dieser Stelle könntest du fragen: "Na und?" Wenn wir alle Daten haben, können wir jede beliebige Wahrscheinlichkeit, jede Konjunktion oder jede bedingte Wahrscheinlichkeit berechnen, indem wir einfach zählen. Wir müssen diese Formeln nicht verwenden.
Und du hast Recht, wenn wir alle Daten haben. Aber oft haben wir das nicht, und in diesem Fall können diese Formeln sehr nützlich sein - vor allem der Satz von Bayes. Im nächsten Kapitel werden wir sehen, wie.
Übungen
Beispiel 1-1.
Lass uns die Werkzeuge in diesem Kapitel nutzen, um eine Variante des Linda-Problems zu lösen.
Linda ist 31 Jahre alt, ledig, freimütig und sehr intelligent. Sie hat Philosophie studiert. Als Studentin beschäftigte sie sich intensiv mit Fragen der Diskriminierung und sozialen Gerechtigkeit und nahm auch an Anti-Atomkraft-Demonstrationen teil. Was ist wahrscheinlicher?
Linda ist eine Bankerin.
Linda ist Bankerin und bezeichnet sich selbst als liberale Demokratin.
Um diese Frage zu beantworten, berechne
-
Die Wahrscheinlichkeit, dass Linda eine weibliche Bankangestellte ist,
-
Die Wahrscheinlichkeit, dass Linda eine liberale Bankerin ist, und
-
Die Wahrscheinlichkeit, dass Linda eine liberale Bankerin und eine Demokratin ist.
Beispiel 1-2.
Benutze conditional
, um die folgenden Wahrscheinlichkeiten zu berechnen:
-
Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter liberal ist, wenn er ein Demokrat ist?
-
Wie hoch ist die Wahrscheinlichkeit, dass ein Befragter ein Demokrat ist, wenn er liberal ist?
Überlege dir genau, in welcher Reihenfolge du die Argumente anconditional
übergibst.
Beispiel 1-3.
Es gibt einberühmtes Zitat über junge Menschen, alte Menschen, Liberale und Konservative, das in etwa so lautet:
Wenn du mit 25 kein Liberaler bist, hast du kein Herz. Wenn du mit 35 kein Konservativer bist, hast du kein Hirn.
Unabhängig davon, ob du dieser Aussage zustimmst oder nicht, lassen sich daraus einige Wahrscheinlichkeiten ableiten, die wir als Übung berechnen können. Anstatt die Altersangaben 25 und 35 zu verwenden, definieren wir young
und old
als unter 30 oder über 65 Jahre:
young
=
(
gss
[
'age'
]
<
30
)
prob
(
young
)
0.19435991073240008
old
=
(
gss
[
'age'
]
>=
65
)
prob
(
old
)
0.17328058429701765
Für diese Schwellenwerte habe ich runde Zahlen in der Nähe des 20. und 80. Perzentils gewählt. Je nachdem, wie alt du bist, kannst du mit diesen Definitionen von "jung" und "alt" einverstanden sein oder auch nicht.
Ich definiere conservative
als jemanden, dessen politische Ansichten "konservativ", "leicht konservativ" oder "extrem konservativ" sind.
conservative
=
(
gss
[
'polviews'
]
>=
5
)
prob
(
conservative
)
0.3419354838709677
Benutze prob
und conditional
, um die folgenden Wahrscheinlichkeiten zu berechnen:
-
Wie hoch ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Befragter ein junger Liberaler ist?
-
Wie hoch ist die Wahrscheinlichkeit, dass ein junger Mensch liberal ist?
-
Welcher Anteil der Befragten sind alte Konservative?
-
Welcher Anteil der Konservativen ist alt?
Überlege bei jeder Aussage, ob sie eine Konjunktion, eine bedingte Wahrscheinlichkeit oder beides ausdrückt.
Bei den bedingten Wahrscheinlichkeiten musst du auf die Reihenfolge der Argumente achten. Wenn deine Antwort auf die letzte Frage größer als 30 % ist, hast du es falsch herum gemacht!
Get Think Bayes, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.