Ψωμί και Ειρήνη / U.S. Presidential Elections 2008
Μπορούν δύο βασικές μεταβλητές να προβλέψουν με ακρίβεια το αποτέλεσμα των Αμερικάνικων εκλογών (ή πιο συγκεκριμένα το ποσοστό που παίρνει ο υποψήφιος του κόμματος που βρίσκεται στην εξουσία την περίοδο που διεξάγονται οι εκλογές); Αυτός είναι ο ισχυρισμός του Douglas Hibbs ήδη από το 2000. Το μοντέλο του Hibbs, το οποίο ονομάζει “bread and peace”, καταφέρνει να προβλέψει με ιδιαίτερη επιτυχία το ποσοστό ψήφων των υποψηφίων του incumbent κόμματος για τις προεδρικές εκλογές της Αμερικής χρησιμοποιώντας δύο θεμελιώδη μεγέθη: την απόδοση της οικονομίας της χώρας (την μεγέθυνση του πραγματικού εισοδήματος) και μερικές “διορθώσεις” για περιόδους πολέμου (τις συνολικές απώλειες ζωών σε πολέμους κατά την διάρκεια συγκεκριμένων προεδριών πριν τις εκάστοτε εκλογές). Στην πιο πρόσφατη εργασία του ο Hibbs απαντά στην περυσινή κριτική του William Nordhaus πως το μοντέλο του δεν μπορεί να προβλέψει με ακρίβεια το ποσοστό του Βush στις εκλογές του 2004.
Ο Andrew Gelman δημιούργησε ένα πολύ καλό γράφημα για την κατανόηση των αποτελεσμάτων της εργασίας του Hibbs (αλλά κοιτάξτε και το ίδιο το άρθρο του Hibbs):

Λινκ για πιο ευανάγνωστο γράφημα
Με λόγια, το γράφημα λέει πως:
According to the coefficient estimates […] each percentage point of growth in per capita real disposable personal income sustained over the presidential term boosts the in-party candidate’s vote share by around 3.6 percentage points above a benchmark constant of approximately 46 percent. In addition, the incumbent’s vote share is depressed by about 0.3 percentage points per 1000 American military fatalities owing to hostile, discretionary deployments of US armed forces in unprovoked wars.
Συγκεκριμένα για τις εκλογές του 2004 (Bush vs Kerry), σε ετήσια βάση o weighted-average ρυθμός μεγέθυνσης του κατά κεφαλή πραγματικού διαθέσιμου προσωπικού εισόδηματος στην πρώτη θητεία του Bush ήταν 1.72 ποσοστιαίες μονάδες. Οι απώλειες στο Ιράκ ήταν περίπου 1130 (1.13*1000 – έχει σημασία για τους υπολογισμούς) στο τέλος του Οκτωμβρίου 2004. Με αυτά τα δεδομένα το μοντέλο προβλέπει (within-sample prediction / regression fit) το ποσοστό ψήφων του Bush στο 52.08% (46.2+3.61*1.72−0.307*1.13 = 52.08) με σφάλμα −0.84% (51.24 −52.08). (Αναλυτικά, στο άρθρο του Hibbs, σελίδα 3).
Τι μας λέει το μοντέλο για τις εκλογές του 2008; Για έναν back-of-the-envelope υπολογισμό, χρειαζόμαστε δύο υποθέσεις. Σήμερα οι απώλειες στρατιωτών στο Ιράκ βρίσκονται γύρω στους 3915. Αν υποθέσουμε πως το 2008 θα φέρει τις ίδιες απώλειες με το 2007 (για τους πρώτους εννέα μήνες) μέχρι τις εκλογές, οι νεκροί θα αυξηθούν κατά 800 φτάνοντας τους 4715 (δεν υπολογίζω απώλειες στο Αφγανιστάν). Κατά δεύτερον, ας υποθέσουμε πως o weighted-average ρυθμός μεγέθυνσης του κατά κεφαλή πραγματικού διαθέσιμου προσωπικού εισόδηματος παραμένει στο 1.72%. Συνεπώς για τις εκλογές του 2008, το μοντέλο προβλέπει το ποσοστό ψήφων του ρεπουμπλικανού υποψηφίου στο 50.08% (46.2+3.61*1.72−0.307*4.715). Τα πράγματα είναι οριακά και θυμίζουν Bush vs. Gore!
Λίγες σκέψεις στα γρήγορα: 1) τα πράγματα σίγουρα δεν φαίνονται και τόσο “παιχνιδάκι” για τους δημοκρατικούς, 2) το κατά πόσον βρίσκεται η οικονομία της Αμερικής σήμερα σε ύφεση μπορεί να αποτελέσει τον καθοριστικό παράγοντα, μιας και ουσιαστική κάμψη των απωλειών στο Ιράκ δεν νομίζω ότι προβλέπει κανείς, 3) το θέμα της εκλεξιμότητας της Χίλαρυ ίσως είναι non-issue μιας και οι εκλογές του 2008 δεν θα κριθούν κατά κόρον από την ποιότητα του δημοκρατικού υποψηφίου (λέω ίσως γιατί το μοντέλο δεν εξηγεί το 100% του παρατηρούμενου variation), και 4) οι Huckabee/Romney/Giuliani πρέπει να προσεύχονται καθημερινά να βρει την θεία φώτιση ο Bush είτε να συγκρατήσει τις απώλειες δυνάμεων στο Ιράκ για τους επόμενους εννέα μήνες ή να βρει τρόπους να συγκρατήσει την αναμενόμενη ύφεση.
Μια επιπρόσθετη συζήτηση και το χατ τιπ στο Overcoming Βias. Μια ακόμη ανάλυση εδώ. (Σημείωση: η εργασία του Hibbs ενώ έγινε αρχικά αποδεκτή για δημοσίευση μετά από ένα revise and resubmit, από το ακαδημαϊκό περιοδικό Quarterly Journal of Political Science, τελικώς απορρίφθηκε γιατί ο συγγραφέας δεν ακολούθησε δύο μη-τεχνικές οδηγίες των editors. Είναι αλήθεια τελικά πως για να δημοσιεύσεις δεν χρειάζεσαι μόνο ένα καλό paper…)
Οικονομέτρες και στατιστικολόγοι, αματέρ και μη, ορμήχτε! Η συζήτηση για τις λεπτομέρειες έχει ψωμί – μακάρι και ειρήνη 🙂
—maikwl
11 σχόλια
Πολύ ενδιαφέρον. Αυτό που μου έκανε μεγάλη εντύπωση στη γρήγορη ανάγνωση είναι ότι το μοντέλο συγκρούεται με την κοινή αντίληψη στο ότι δε δίνει διαφορετικό βάρος στο προεδρικό incumbency (όταν δηλαδή ο υποψήφιος του incumbent κόμματος είναι ο ίδιος ο πρόεδρος).
Μπορεί κάποιος να ισχυριστεί ότι ουσιαστικά εξισώνει το προεδρικό με το αντιπροεδρικό incumbency, αφού σε όλες (πλην μιας) τις εκλογές από το 1952 μέχρι σήμερα, υποψήφιος ήταν κάποιος πρόεδρος ή αντιπρόεδρος.
Το πρόβλημα είναι ότι οι εκλογές του 2008 είναι οι πρώτες μετά από εκείνες του 1952, που δεν θα υπάρχει ούτε προεδρικό, ούτε αντιπροεδρικό incumbency. Το μοντέλο του Hibbs πρόβλεψε το αποτέλεσμα του 1952 με σχετική ακρίβεια, αλλά αρκεί ένα data point για να πείσει ότι καλύπτει επαρκώς αυτή την ιδιαιτερότητα;
Χμμ, καλή παρατήρηση. Ένα σκεπτικό που εστιάζει στο ότι “κακή οικονομία – πολλά fatalities” τιμωρεί το incumbent κόμμα αντί για τα πρόσωπα (τον πρόεδρο ή αντιπρόεδρο) θα μπορούσα να το δεχτώ αν γενικά οι πολιτικές προτάσεις του υποψηφίου του incumbent κόμματος προσεγγίζουν αυτές του προέδρου/αντιπροέδρου την περίοδο των εκλογών – όταν αυτός ο υποψήφιος δεν είναι ο ίδιος ο (αντί)πρόεδρος. Συνεπώς, ίσως να πρέπει να περιμένουμε για το χρίσμα…
Γενικά, και εγώ έχω πρόβλημα με τον αριθμό των παρατηρήσεων (observations). Αλλά μπορεί εύκολα να παραδεχτεί κανείς πως η στατιστική σχέση είναι πολύ δυνατή.
Έχω κάποιες αμφιβολίες ότι το εκ των υστέρων ταίριασμα αποτελεσμάτων και παραμέτρων έχει σοβαρό προγνωστικό βάρος. Για ένα μικρό σετ δεδομένων και έναν τεράστιο αριθμό κοινωνικοοικονομικών παραμέτρων μπορεί πάντα να βρεθεί συσχέτιση μεταξύ των πρώτων και ενός επιλεγμένου για τον σκοπό αυτό υποσυνόλου των δευτέρων. Υπενθυμίζω ότι ο μέχρι πρότινος σίγουρος οιωνός για την προεδρική εκλογή (που αστόχησε το 04) εξακολουθεί να έχει προγνωστική επιτυχία 94,4% :-b !
Α και ως εκλογομούρης, αν κάποιος μου έδινε απόδοση >3, έβαζα ένα στοιχηματάκι για τον Edwards ως μελλοντικό ένοικο του Λευκού Οίκου κυρίως επειδή τον βλέπω να πηγαίνει καλά στα πρώτα primaries και να αποκτά το λεγόμενο momentum. Αλλά είπα μόνο με πάνω από 3 απόδοση!
Σωστά Μιχάλη, και για να αποφεύγουμε το spurious correlation χρειαζόμαστε θεωρία πριν την στατιστική/οικονομετρική ανάλυση. Η εμπειρική ανάλυση στην συγκεκριμένη περίπτωση τεστάρει μια θεωρία η οποία υποδεικνύει 2 θεμελιώδεις μεταβλητές. Να δώσω περαιτέρω έμφαση και στο εξής θέμα… οι δύο μεταβλητές + η σταθερά εξηγούν περίπου το 82.6% του variation που παρατηρείται – συνεπώς, όπως λέει και ο talos, ο τεράστιος αριθμός κοινωνικοοικονομικών παραμέτρων παίζει σημαντικό ρόλο. Γενικά, νομίζω πως το μοντέλο δείχνει ποσοτικά πόσο σημαντικές είναι οι παράμετροι στις οποιές εστιάζει (ξέρω, λες και δεν το ξέραμε).
Η εμπειρική ανάλυση στην συγκεκριμένη περίπτωση τεστάρει μια θεωρία η οποία υποδεικνύει 2 θεμελιώδεις μεταβλητές
OK, ειλικρινές ερώτημα: τι προηγήθηκε, η θεωρία ή η διαπίστωση πως οι δύο αυτές μεταβλητές εξηγούν τα αποτελέσματα; Θέλω να πω μπορώ να φανταστώ άλλα μέτρα παρομοίων φαινομένων π.χ. {ποσοστά αποδοχής πολέμων στον πληθυσμό ή αριθμός νέων καταταγέντων} και {GDP/κάτοικο ή την αύξηση του διαθέσιμου εισοδήματος την προεκλογική μόνο χρονιά ή το discretionary και όχι το disposable income}. Αυτά που χρησιμοποιούνται επιλέχθηκαν επειδή κάνουν το καλύτερο post-diction ή για κάποιους ουσιώδεις για την θεωρία λόγους; Σημειώνω δε πως επειδή η αύξηση του διαθέσιμου εισοδήματος γενικά, είναι πολύ πάνω από το 1,72% που αναφέρεις από όσο τσέκαρα, το μοντέλο δίνει κάπου γύρω στο 54% για τους ρεπουμπλικάνους (barring a sharp downturn). Για ότι αυτή η εκτίμηση πέφτει έξω βάζω στοίχημα και με απόδοση 1,2 😉
Χαχα, λοιπόν, νομίζω θέτεις 2 ζητήματα… (ι) πως η θεωρία δεν είναι ανεξάρτητη των εμπειρικών στοιχείων και (ιι) το paper χρειάζεται sensitivity analysis. Στο (ιι) συμφωνώ απόλυτα… υπάρχει πολύς χώρος για βελτίωση του συγκεκριμένου paper (για αυτό άλλωστε είπα πως υπάρχει “ψωμί” στις λεπτομέρειες.) Για το (ι) έχουν γραφτεί πολλά – το δικό μου rule of thumb είναι πως την θεωρία θα την φτιάξεις από την εμπειρία σου πριν κάνεις engage σε data-mining. Βέβαια, μετά από κάποια χρόνια ενασχόλησης με κάποιας μορφής data-mining, οι θεωρίες σου ίσως γίνονται λίγο ύποπτες 🙂
Στην εκτίμησή σου για το 54% εύχομαι πραγματικά να πέφτεις έξω…
Ψωμί και Ειρήνη / U.S. Presidential Elections 2008 (maikwl / RT)…
«Μπορούν δύο βασικές μεταβλητές να προβλέψουν με ακρίβεια το αποτέλεσμα των Αμερικάνικων εκλογών»;…
@Τάλος: O Edwards φαίνεται να κοιμάται τον ύπνο του δικάιου, πάντως. Πολύ αμφιβάλλω οτι θα τον μετρήσουν ως πιθανότητα για τα primaries, τη στιγμή μάλιστα που ο Οbama φαίνεται να σπρώχνεται από τα μήντια (e.g. NEWSWEEK, Economist) ως το αντι-Χίλαρυ άλογο. Οπότε απόδοση 3 μου φαίνεται λίγη. 13 ίσως;
Τελικά, πάντως, αντί να το σκέφτονται τόσο πολύ πώς ακριβώς θα βάλουν τα data στο plot, καλό θα ήταν να είχαμε μια “συνεχή” καμπύλη (υποθέτω οτι αυτό το “growth in per capita real disposable personal income” είναι μετρήσιμο και ανά τρίμηνο π.χ.) πρόβλεψης και data από γκάλοπ δημοτικότητας για το εκάστοτε administration, μπας και βγάλουμε άκρη.
Ερώτηση: αυτά τα σφάλματα 0.84 που λέει καταλαβαίνει κανείς πώς εκτιμούνται αν διαβάσει το άρθρο (προσπαθώ να αποφύγω να το διαβάσω, προφανώς 🙂 )
Περί σφάλματος: είναι απλά το prediction error. Το μοντέλο προβλέπει 52.08% για τον Bush ενώ έλαβε 51.24% – είναι η απόσταση από το regression fit.
Αν ο Edwards πάρει την Iowa – μικρή πιθανότητα, αλλά έχουν ένα σχετικά σύνθετο σύστημα primaries που μάλλον τον ευνοεί, θα πέσει η απόδοση lazopolis. Κάποια στιγμή θα μετρήσει το γεγονός ότι ήταν και συνεχίζει να είναι (αν δεν κάνω λάθος) ο μόνος δημοκρατικός υποψήφιος που κερδίζει καθαρά κάθε ρεπουμπλικανό υποψήφιο σε polls [pdf]. Αν μου δίνεις απόδοση 13, πες το γρήγορα (πριν την Άιοουα) γιατί το πάω το στοίχημα σε μπύρες!