Das Simpsons-Paradox in der Zielgruppenanalyse

entrepreneur-1428452_640Nehmen wir an, wir wären Chefredakteure einer Fachzeitschrift für Angestellte einer bestimmten Branche und erhielten folgendes Umfrageergebnis: Je höher die Kaufkraft unserer Kunden, desto höher ist die Beliebtheit unsere Zeitschrift. Der erste Gedanke wäre womöglich, Inhalte zukünftig an den Interessen der oberen Gehaltsstufen der Branche auszurichten. Ein gravierender Fehler. 

Grafik 1 zeigt links den Zusammenhang zwischen Kaufkraft und Beliebtheit. Rechts sehen wir aber schon, dass der Zusammenhang auflöst bis umkehrt, wenn wir uns nur auf die höheren Einkommen konzentrieren.

grafik1a

Grafik 1

Färben wir die unterschiedlichen Gehaltsgruppen ein, entsteht ein ganz anderer Eindruck (Grafik 2). Je weniger  die Kunden innerhalb einer Gehaltsklasse verdienen, desto mehr mögen sie unser Blatt. Scheinbar wird unsere Zeitschrift lieber von den Beschäftigten am unteren Ende der jeweiligen Gehaltsgruppe gelesen. Möglicherweise ist unser Blatt besonders bei Berufseinsteigern beliebt, die entsprechend ihres Ausbildungsgrades in die jeweilige Gehaltsstufe einsteigen. In diesem Falle könnten wir mit einer Spezialisierung auf Berufseinsteigerthemen die Leserbindung stärken oder unsere Inhalte zukünftig auch an Berufserfahrene richten, um unseren Leserkreis zu erweitern. Möglicherweise adressiert unser Blatt aus ganz anderen Gründen einfach nur ein jüngeres Publikum. Dann wären natürlich andere Strategien angezeigt.

grafik2

Grafik 2

Das Phänomen, dass sich ein  statistischer Zusammenhang umkehrt, wenn man Untergruppen bildet, nennt man Simpsons-Paradox, nach seinem Entdecker Edward Hugh Simpson. In diesem Beispiel war der Gedanke, höhere Gehaltsklassen würden unsere Zeitschrift lieber lesen, relativ einfach in Grafik 1 als Fehlschluss zu entdecken. Es ist also sinnvoll, sich nicht nur über eine Korrelation zu informieren, sondern auch die Streuung der Punktwolke anzusehen. Eine starke Streuung verweist schon eher auf einen Kandidat für das Simpsons-Paradox. Aber auch bei geringerer Streuung als in unserem Beispiel, besteht die Möglichkeit, wie dieser Fall zeigt. Da wir es mit zwei metrischen Ausprägungen zu tun hatten, brauchten wir nur beobachten, wie sich y ändert, wenn wir x verschieben. Schwieriger zu entdecken wird das Simpsons-Paradox, wenn x nominalskaliert ist, also wenn es sich um Klassen handelt wie Geschlecht, Familienstand, Nationalität usw. Dazu mehr im nächsten Blogartikel.

gorillaÄhnliche Effekte sind überall denkbar. Wir brauchen nur einmal hypothetisch eine entsprechende Korrelation zwischen Testosteronspiegel und Aggressivität anzunehmen: je mehr Testosteron, desto angriffslustiger. Dieser Zusammenhang könnte sich bei entsprechender Datenlage aber auflösen oder umkehren, wenn wir die Personen mit den höchsten Testosteronwerten in weiser Personalentscheidung als eine Arbeitsgruppe zusammenstellten. Innerhalb dieser Gruppe wären vielleicht gerade die Kollegen mit viel Testosteron die friedlichen. Oder wenn der Hormonspiegelunterschied zwischen Männern und Frauen in etwa einer Gruppierung der Grafik 2 ohne die grünen Punkte folgte. Dann wären jeweils Frauen und Männer mit viel Testosteron im Blut friedlicher als ihre Geschlechtsgenossinnen und -genossen, obwohl zuvor ein positiver Zusammenhang zwischen Hormon und Aggression gemessen wurde. Beide  Beispiele sind rein hypothetisch. Sie sollen nur zeigen, dass eine Korrelation einen zweiten, dritten und vierten Blick benötigt.

Advertisements

Ein Kommentar zu “Das Simpsons-Paradox in der Zielgruppenanalyse

  1. Pingback: Ausländerkriminalität als Simpsons-Effekt – Der Sonntagsstatistiker

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s