HT
13
Att vara eller inte vara i riksdagen - en uppsats om två prognosmetoder för svenska riksdagsval
Författare: Miriam Hurtado Bodell Henrik Karlsson
Uppsala Universitet
Handledare: Thommy Perlinger
Statistiska institutionen
Kandidatuppsats
Sammanfattning I uppsatsen kommer potentialen att prognostisera utfallet i svenska riksdagsval med logistisk regression och Seemingly Unrelated Regression (SUR) att undersökas. Estimeringarna baseras på svensk valdata från 1973 och framåt. Modellerna inkluderar makroekonomiska variabler såväl som indikatorer över de regeringens popularitet samt en tröttnadsvariabel. Resultaten tyder på att varken logistisk regression eller SUR är lämpliga att använda för prognostisering av svenska riksdagsval. Logistisk regression kräver en sådan förenkling av det politiska landskapet att några meningsfulla slutsatser är svåra att dra. SUR-estimeringen brister i att metodens antaganden inte uppfylls av svensk valdata.
Sökord: Forecasting, Election, Voting behaviour, Seemingly unrelated regression, Logistisc regression, Multiparty forecasting
Innehållsförteckning 1 INLEDNING .................................................................................................................................. 4 1.1 AVGRÄNSNINGAR ................................................................................................................................... 4 2 BAKGRUND ................................................................................................................................. 5 2.1 SVENSKA VALSYSTEMET ....................................................................................................................... 5 2.2 LITTERATURGENOMGÅNG .................................................................................................................... 6 2.2.1 ”De stora två” .................................................................................................................................. 6 2.2.2 Bortom ekonomiska variabler ................................................................................................. 8 2.2.3 Modellförteckning ......................................................................................................................... 9 3 METOD ......................................................................................................................................... 9 3.1 LOGISTISK REGRESSION ........................................................................................................................ 9 3.2 SEEMINGLY UNRELATED REGRESSION (SUR) ............................................................................... 11 3.2.1 Diskussion kring användandet av SUR vid valprognostisering .............................. 14 4 DATA .......................................................................................................................................... 15 4.1 STICKPROV ............................................................................................................................................ 15 4.2 VARIABELFÖRKLARING OCH DATAINSAMLING ............................................................................... 17 5 UNDERSÖKNING OCH RESULTAT ..................................................................................... 18 5.1 LOGISTISK REGRESSION ...................................................................................................................... 18 5.1.1 Estimering av riksdagsvalet 2010 ....................................................................................... 18 5.1.2 Estimering av riksdagsvalet 2014 ....................................................................................... 19 5.1.3 Prognoser för riksdagsvalen 2010 och 2014 .................................................................. 21 5.2 SUR-‐ESTIMERING ................................................................................................................................ 21 5.2.1 Estimering av riksdagsvalet 2010 ....................................................................................... 22 5.2.2 Estimering av riksdagsvalet 2014 ....................................................................................... 26 5.2.3 Prognoser för riksdagsvalen 2010 och 2014 .................................................................. 30 6 DISKUSSION OCH SLUTSATS .............................................................................................. 34 7 REFERENSER ........................................................................................................................... 37 8 APPENDIX ................................................................................................................................ 40
3
1 Inledning Öppna och fria val är grunden i demokratiska samhällen. Att kunna förutspå valresultat innan valdagen är en eftertraktad möjlighet som i huvudsak studeras bland statsvetare och ekonomer runt om i världen. En rad metoder och modeller används för att göra prognoser över hur andelen röster i ett land kommer att fördelas på valnatten. Dessutom har metoderna använts i stor utsträckning utan en djupare diskurs kring vilka statistiska antaganden som bör vara uppfyllda för att estimaten ska ses som statistiskt säkerställda. Litteraturen gällande estimering av valresultat behandlar i huvudsak amerikanska presidentval, men studier har även gjorts i Storbritannien, Tyskland och Frankrike. Genom att använda tre tidigare modeller på svensk valdata ges en inblick i hur dessa modeller hanterar att prognostisera valresultat i ett land med tradition av politisk tillhörighet samt ett parlamentariskt politiskt system med proportionellt val och en traditionellt sett stark stat. Logistisk regression och Seemingly Unrelated Regression (SUR) kommer att användas för att skatta utfallet i det svenska riksdagsvalet. Logistiska regressioner har använts begränsat inom området till förmån för linjära regressioner, medan SURestimering är på frammarsch. Med denna uppsats vill vi undersöka frågeställningen: Vilken potential har logistisk regression respektive Seemingly Unrelated Regression för att prognostisera resultatet i svenska riksdagsval?
1.1 Avgränsningar För att prognostisera utfallet använder vi tre modeller. ”De stora två” vars fokus ligger på makroekonomiska variablers betydelse för valresultat samt en modell från (Abramowitz, 1988) där fokus skiftas mot opinionen om den sittande presidenten samt hur länge paritet har regerat. Resultaten från dessa modeller finns väldokumenterade och kan därmed enkelt jämföras med denna uppsats. Olika tidslaggar kommer inte att behandlas i uppsatsen eftersom en skattning av utfallet i valet 2014 kräver en modell som använder information som finns tillgänglig ett år innan valnatten. Prognosmodellers styrka ligger dessutom i att långt i förväg kunna
göra
en
god
skattning
av
valresultatet
jämfört
med
exempelvis
4
opinionsundersökningar som börjar konvergera mot det faktiska resultatet först närmare valet (Lewis-Beck, 2005). Sverige har haft allmänna val från 19211, men uppsatsen kommer enbart behandla valdata från 1973 och elva val framåt. Övergången till enkammarriksdag år 1971 innebar en fundamental förändring av det politiska systemet, och dagens riksdag började ta form. För att göra prognoser för riksdagsvalen i modern tid bör data som representerar dagens politiska arena vara av större intresse att studera än att utnyttja en lång tidsserie. Sammanfattningsvis avgränsas uppsatsen till användandet av tre tidigare beprövade modeller för att skatta två olika val. Först skattas 2010 års val med hjälp av data från 1973-2009. Sedan skattas 2014 års val med data från 1973 till 2013. De oberoende variablerna skall finnas tillgängliga minst tolv månader innan valet.
2 Bakgrund I följande avsnitt kommer en kortare bakgrund först att redovisas kring hur det svenska valsystemet är uppbyggt. Vidare följer en genomgång kring tidigare litteratur gällande prognostisering av nationella val.
2.1 Svenska valsystemet Sverige har ett proportionellt parlamentariskt system. Varje svensk medborgare över 18 år har rösträtt och får därmed rösta i Sveriges återkommande riksdagsval, där medborgarna utser vilka partier som ska representera folket i Sveriges högsta beslutande organ. Andelen mandat fördelas proportionellt efter antalet röster mellan de olika partierna med hjälp av olika utjämningsprocesser. För att få plats i Sveriges riksdag krävs att partiet får minst fyra procent av rösterna. I Sverige är koalitions- och minoritetsregeringar vanligt förekommande. Det innebär att inget enskilt parti vanligtvis har egen majoritet i riksdagen och måste därför samarbeta och kompromissa med andra partier för att bilda regering. När partier samarbetar kan det bli svårare för väljare att utvärdera partierna individuellt. Bilden om att val fungerar som en utvärdering av styret blir därmed betydligt mer komplex och svår att prognostisera. Vid koalitionsregeringar ökar svårigheten ytterligare, eftersom fler partier kan hållas ansvariga för samma politik (Nannestad & Paldam, 1993). 1
Möjligheten att utesluta vissa grupper från den allmänna rösträtten togs dock bort först 1989
5
I Sverige finns det idag åtta partier representerade i riksdagen. Fyra av dem tillhör den så
kallade
Alliansen
Kristdemokraterna
(Moderata
och
samlingspartiet,
Centerpartiet).
Tre
Folkpartiet av
liberalerna,
oppositionspartierna
(Socialdemokraterna, Vänsterpartiet och Miljöpartiet de gröna) har haft ett utpräglat röd-grönt
samarbete
under
de
senaste
mandatperioderna.
Det
fjärde
oppositionspartiet, Sverigedemokraterna, är det nyaste riksdagspartiet och tillhör inget av det traditionella höger- eller vänsterblocken. Figur 2.1 Tidslinje för vilka partier som haft regeringsmakten i Sverige 1973
1976
1979
• Socialdemokraterna • Centerpartiet • Moderaterna • Folkpartiet
1982 1985
1988
• Socialdemokraterna
1991
1994
1998 2002
• Moderaterna • Socialdemokraterna • Centerpartiet • Folkpartiet • Kristdemokraterna
2006 2010 • Moderaterna • Centerpartiet • Folkpartiet • Kristdemokraterna
2.2 Litteraturgenomgång På 1960-talet, i valprognostiseringens vagga, presenterades tanken om att val fungerar som en utvärdering av makten. I samband med detta undersöks huruvida denna utvärdering kan baseras på den ekonomiska utvecklingen i landet. Denna första våg av studier i valprognostisering domineras av ett fåtal makroekonomiska variablers förmåga att förutspå utfallet i nationella val. De variabler som undersöktes i störst utsträckning var arbetslöshet och inflation, där arbetslösheten ibland ersattes av tillväxt. Olika kombinationer av dessa variabler är det som ibland kallas ”De stora två” (Lewis-Beck & Paldam, 2000).
2.2.1 ”De stora två” Effekten av arbetslöshet, inflation och tillväxt har undersökts i ett flertal länder under olika tidsperioder med varierande resultat. I industrialiserade länder med låg inflation tenderar både arbetslöshets- och inflationsvariabler bli signifikanta i modeller för valprognosticering. Dessa variabler återfinns i en rad studier där de har en negativ effekt på ett partis röstandelar. Koefficienterna för arbetslöshet och inflation varierar vanligtvis mellan -0,4 och -0,8 (Nannestad & Paldam, 1993). Enligt (Frey & Schneider, 1978) saknar många av de tidiga studierna såväl teoretiskt som statistiskt djup. Författarna bekräftar i undersökningen de tidigare dokumenterade effekterna av
6
både inflation och arbetslöshet på amerikansk valdata. I studien läggs även stor vikt vid att redovisa tester av antaganden som görs vid användandet av OLS-estimering. I (Mughan, 1987) presenteras en kombination av arbetslöshet och tillväxt i form av en linjär regressionsmodell med OLS-estimering utförd på brittisk valdata mellan åren 1951 och 1983. Antaganden associerade med OLS-estimering nämns eller utvärderas inte alls i studien. Författaren finner att variablerna har en tvetydlig effekt på de olika partierna. Två av partierna verkar missgynnas av god tillväxt medan det tredje partiet påverkas positivt av tillväxten. Arbetslösheten drabbar också partierna på olika sätt och koefficienterna för variablerna får olika tecken. Det enda utvärderande måttet av modellen som presenteras är R2-värden, som varierar mellan 0,65 och 0,85 för de olika partierna. Även i Sverige har det dokumenterats att arbetslöshet påverkar olika politiska partier på olika sätt. I (Jordahl, 2003) använder författaren en probit regression för att skatta sannolikheten att man röstar på samma parti två val i rad. Författaren hittar två effekter av arbetslöshet, där den första är negativ. Ökad arbetslöshet leder således till att partier tappar röster. Effekten har visat sig vara större för partier till vänster på den politiska skalan, då väljare tenderar att straffa dem i högre utsträckning för ökad arbetslöshet (Powell & Whitten, 1993). Den andra effekten av ökad arbetslöshet är positiv, andelen partisympatier höjs när arbetslösheten i landet går upp. Den positiva effekten drabbar i (Jordahl, 2003) enbart vänsterorienterade partier, då väljarkåren tycks ha ett större förtroende för att de kommer stödja arbetslösa i högre utsträckning än övriga alternativ. Dessa två motsatta effekter kan ta ut varandra (Jordahl, 2003). Det kan innebära att effekten av arbetslösheten uteblir helt eller att arbetslöshetens effekt på röstandelarna kommer att ha olika tecken för olika politiska partier. Arbetslöshet, tillväxt och inflation är de tre variablerna i fokus även i (Arzheimer & Evans, 2010) där franska val prognostiseras genom SUR-estimering med data från 1981 till 2007. Författarna delar in de franska partierna i fem större grupperingar med fokus på gruppen innehållande det främlingsfientliga partiet Front National. Denna studie ger en inblick i problematiken att förutspå när nya partier dyker upp på den politiska arenan. Författarna finner bevis för att de tre ekonomiska variablerna har en annan påverkan på missnöjespartier, främst på högerkanten, än övriga partier.
7
Skattningarna fungerade även dåligt för grupper som innehöll flera partier så som gruppen av ”Övriga partier”. Medelfelen i skattningarna för denna grupp var ungefär tre gånger så höga som för de andra partierna och prognoser över det slutgiltiga resultatet var kraftigt underskattade. Röstandelarna för samtliga partier summeras till 99,99. Författarna redovisar dock inga tester av antaganden som görs vid SURestimering.
2.2.2 Bortom ekonomiska variabler Modellen som publiceras i (Abramowitz, 1988) har fått ett stort genomslag framförallt i USA när vinnaren i presidentvalen ska förutspås. Modellen bygger på den tidigare nämnda tillväxtvariabeln och två icke-ekonomiska variabler. Den ena är ett mått på tröttnadseffekten, en dummyvariabel som antar värdet 1 när en makthavare styrt landet i två mandatperioder. Forskning visar att väljare tenderar att tröttna på den styrande makthavaren och väljer då att rösta på ett annat parti för omväxlings skull. Abramowitz erhåller ett negativt värde på tröttnadsvariabeln, vilket tolkas som att en när makthavare suttit två mandatperioder minskar partiets röstandelar. I modellen används även en popularitetsvariabel som representerar makthavarens popularitet innan valet, och inhämtas från opinionsundersökningar. För att avgöra presidentens popularitet låter man slumpmässigt utvalda individer svara på frågor av karaktären ”godkänner eller underkänner du den nuvarande presidentens arbete?”2. Användandet av sittande presidents popularitet har visat sig vara en fungerande estimator för kommande val i länder med tvåpartisystem (Brody & Sigelman, 1983). I (Abramowitz, 1988) hittar författaren bevis för att variabeln som reflekterar presidentens popularitet har en positiv effekt på det parti presidenten tillhör, vilket tolkas som ju mer populär presidenten är desto mer röster får partiet. I (Abramowitz, 1988) används en enkel linjär regressionsmodell utan genomgång av hur väl antaganden för OLS-estimering uppfylls. Författaren utgår även från ett litet stickprov, innehållandes enbart 10 observationer, där informationen mellan 1948 och 1984 används för att skatta valresultat i samtliga val under perioden. För att utvärdera
2
Baserat på Gallups fråga ”Do you approve or disapprove of the way (presidentens namn) is handeling
his job as a president?”
8
modellen jämförs modellens prognoser mot det verkliga utfallet tillsammans med en presentation av modellens förklaringsgrad. I genomsnitt skattar modellen 1,2 procentenheter fel och har en förklaringsgrad på 0,98. Dock kan detta mycket väl vara en konsekvens av det lilla stickprovet, vilket författaren inte alls diskuterar.
2.2.3 Modellförteckning Följande modeller användas genom uppsatsen och benämns Modell 1-3. Modell 1: 𝑌! = 𝛽! + 𝛽! 𝐼𝑛𝑓𝑙𝑎𝑡𝑖𝑜𝑛 + 𝛽! 𝐴𝑟𝑏𝑒𝑡𝑠𝑙ö𝑠ℎ𝑒𝑡 + 𝜀! (2.1) Modell 2: 𝑌! = 𝛽! + 𝛽! 𝑇𝑖𝑙𝑙𝑣ä𝑥𝑡 + 𝛽! 𝐼𝑛𝑓𝑙𝑎𝑡𝑖𝑜𝑛 + 𝜀! (2.2) Modell 3: 𝑌! = 𝛽! + 𝛽! 𝑇𝑖𝑙𝑙𝑣ä𝑥𝑡 + 𝛽! 𝑇𝑟ö𝑡𝑡𝑛𝑎𝑑𝑠𝑒𝑓𝑓𝑒𝑘𝑡 + 𝛽! 𝑃𝑜𝑝𝑢𝑙𝑎𝑟𝑖𝑡𝑒𝑡 + 𝜀! (2.3)
3 Metod I följande avsnitt kommer de olika estimeringsmetoderna att behandlas. Inledningsvis beskrivs en logistisk regression som används för att beräkna sannolikheten att sittande regering får behålla regeringsmakten efter valet. Sedan följer en genomgång av Seemingly Unrelated Regression (SUR) som används för att prognostisera hur röstandelarna för de olika partierna fördelar sig.
3.1 Logistisk regression I logistisk regression används en binär beroende variabel, som anger huruvida sittande regering får behålla makten eller inte. Det grundläggande konceptet vid logistisk regression är att man använder sannolikheter och odds vid estimering. Oddset för att en händelse inträffar beräknas enligt formeln 𝑜𝑑𝑑𝑠 ℎä𝑛𝑑𝑒𝑙𝑠𝑒 X! … X! =
𝑃(ℎä𝑛𝑑𝑒𝑙𝑠𝑒|X! … X! ) (3.1) 1 − 𝑃(ℎä𝑛𝑑𝑒𝑙𝑠𝑒|X! … X! )
Genom att logartimera oddset skapas ett logodds, som blir en linjärkombination av de förklarande variablerna enligt formeln nedan 𝑙𝑛 𝑜𝑑𝑑𝑠(ℎä𝑛𝑑𝑒𝑙𝑠𝑒|X! … X! ) = ln
𝑝 = 𝛽! + 𝛽! 𝑋! + ⋯ + 𝛽! 𝑋! (3.2) 1−𝑝
Där 𝑝 är sannolikheten för att händelsen inträffar och kan variera mellan 0 och 1. 𝑝=
1 1+
𝑒 ! !! !!! !! !⋯!!! !!
(3.3)
9
𝛽! (k=1,2,…,K) tolkas som förändringen i logoddset när 𝑋! ökar en enhet. Informationen från estimaten går sedan att omtolkas i termer av det något mer intuitiva sannolikheter och oddskvoter, det vill säga den relativa förändringen i oddset när de oberoende variablerna ökar en enhet. En oddskvot under 1 innebär att oddset sjunker när den förklarande variabeln ökar en enhet, den motsatta tolkningen görs när oddskvoten är över 1 (Gujarati & Porter, 2009). I ett flerpartisystem, som Sverige, där minoritets- och koalitionsregeringar är vanligt förekommande måste verkligheten förenklas för att passa det binära utfallet i logistisk regression. Metoden är fördelaktigt på grund av de få antaganden som görs vid användandet. Det man vinner i form av en lätthanterlig modell sker på bekostnad av begränsningar i informationen modellen kan ge. I uppsatsen undersöks huruvida denna informationsbegräsning påverkar det potentiella användandet av metoden för prognostisering av svenska riksdagsval. Vid användande av logistisk regression görs enbart två antaganden och inget av dem gäller det linjära förhållandet mellan den beroende variabeln och de oberoende variablerna eller fördelningen av dessa (Sharma, 1996). Det första av de två antagandena är att ett stort stickprov ska användas. Vad stort stickprov innebär kan anses som något godtyckligt. En tumregel är att man bör använda minst 10 observationer per förklarande variabel som ingår i modellen (Starkweather & Moske, 2011). Antagandet är svårt att uppfylla vid prognostisering av nationella val eftersom de sker sällan. Därmed kommer analysen baseras på valresultat från Sveriges 290 kommuner. Detta resonemang kommer att utvecklas vidare under datasektionen senare i uppsatsen. Det andra antagandet är frånvaron av perfekt multikollinearitet, som innebär att de oberoende variablerna förklarar samma variation i den beroende variabeln. Multikollinearitet kontrolleras för i Figur 8.1 och 8.2 i Appendix. Ytterligare ett sätt att upptäcka problem med multikollinearitet är om parametrarnas t-test visar på ickesignifikans medan modellens F-test är signifikant och förklaringsgraden är hög. Vid multikollinearitet kommer parametrarnas varians förstoras men estimaten kommer fortfarande att vara utan bias. Variance Inflation Factor (VIF) visar hur mycket estimatens varians förstoras på grund av närvaron av multikollinearitet. En tumregel är att problem med multikollinearitet föreligger när VIF överstiger 10 (Gujarati &
10
Porter, 2009) Problem med multikollinearitet åtgärdas genom att utesluta en av de förklarande variablerna som är starkt korrelerad med resterande förklarande variabler. Hur väl den logistiska regressionen fungerar utvärderas med hjälp av olika goodnessof-fit tester. För att utvärdera modellens ”generella passform” undersöks resultatet från likelihoodkvottestet. Modellens likelihood (L) motsvarar sannolikheten att den estimerade modellen förklarar datan. Nollhypotesen för testet är att vektorn av de skattade parametrarna är noll. Om de förklarande variablerna tillför någon information till modellen kommer nollhypotesen förkastas (Hosmer & Lemeshow, 2000). När passformen undersökts fortsätter utvärderingen av modellen genom att undersöka de enskilda variablerna, genom Walds 𝜒 ! -test. Testet används för att utvärdera de oberoende variablernas statistiska signifikans (Sharma, 1996). Slutligen används ett mått på rangkorrelation, 𝜏! (tau-c), vilket reflekterar hur ofta modellen skattar rätt utfall. Modellens tau-c kan anta värden mellan -1 och 1, där 1 motsvarar att modellen alltid skattar rätt utfall medan -1 indikerar att modellen alltid har fel. Om tau-c är noll har förändringar i de oberoende variablerna ingen effekt på den beroende. Tau-c är även det mått som används för att jämföra modeller (Sharma, 1996).
3.2 Seemingly Unrelated Regression (SUR) I ett flerpartisystem är riksdagsval ett nollsummespel, om ett parti förlorar röster så kommer de läggas på ett annat alternativ (Tomz et al., 2002). Feltermerna mellan regressionerna för de olika partierna kan därmed vara beroende av varandra. Finns det korrelation mellan feltermerna kan Seemingly Unrelated Regression (SUR) användas för att uppnå konsistenta parameterskattningar utan bias. Vid användande av Zellners SUR-modell används ett ekvationssystem med J-1 ekvationer 3 . Andelen röster för varje enskilt parti estimeras simultant, där 𝒀! ~𝑁(𝝁! , 𝚺). SUR-modellen skrivs oftast som p korrelerade regressionsmodeller enligt: 𝒚! = 𝑿 𝜷! + 𝒆! 𝑗 = 1,2, … , 𝑝 (3.4)
3
J=antal röstningsalternativ
11
Zellners SUR förutsätter att de beroende variablerna är approximativt multivariat normalfördelade (Tomz et al, 2002). För att undersöka om det är rimligt att vårt material uppfyller denna förutsättning görs de multivariata normalfördelningstesten, Henze-Zirkler T och Mardia-testerna vilka presenteras i Figur 8.3 i Appendix. I samma figur presenteras även Kolmogorov-Smirnov-tester som undersöker om de enskilda beroende variablerna är univariat normalfördelade. Dessa är dock känsliga mot uteliggare vilket innebär att en mer rättvis bild fås genom att studera en Q-Q graf, vilken presenteras nedan i Figur 3.1. Figur 3.1 Multivariat normalitetsgraf för partiernas röstandelar inför svenska riksdagsvalet 2014
Med undantag för några extremvärden ser datan ut att vara approximativt multivariat normalfördelad, då övriga observationer följer en rät linje utan tydliga kurvlinjära avvikelser. SUR verkar därmed inte direkt olämpligt att använda, men extremvärdena kan vara en källa till oro vid estimering. Vid SUR-estimering skattas parametrarna först med hjälp av en OLS-estimering. Residualerna används sedan för att undersöka hur feltermerna korrelerar samt för att skatta varians- och kovariansmatriser. Matriserna används i sin tur vid en slutgiltig skattning med (Feasible) Generelized Least Square (Timm, 2002). SUR ger inte alltid mer effektiva, konsistenta, uttömmande eller mindre biased parameterskattningar än OLS. När exakt samma förklarande variabler används för samtliga partier blir OLS-estimaten och SUR-estimaten identiska. SUR-estimeringen 12
minimerar dock standardfelen för respektive parameterskattning och är därför att föredra framför multipla OLS-regressioner (Tomz et al., 2002). Antagandena för OLS gäller för varje enskild funktion i SUR-modellen, nämligen (Gujarati & Porter, 2009): 1. Modellen är linjär eller loglinjär i parametrarna. 2. 𝐶𝑜𝑣(𝑋! , 𝜀! ) = 0, oberoende mellan förklarande variabler och felterm. 3. 𝐸 𝜀! 𝑋! … 𝑋! = 0, feltermernas betingade medelvärde är noll. 4. 𝐸 𝜀!! 𝑋! … 𝑋! = 𝜎 ! , ingen heteroskedasticitet. 5. 𝐶𝑜𝑣 𝜀! 𝜀! 𝑋! , 𝑋! = 0 när 𝑖 ≠ 𝑗, ingen autokorrelation. 6. Antalet observation ska vara större än antalet skattade parametrar. 7. Ingen perfekt multikollinearitet. Till dessa tillkommer även att feltermerna är normalfördelade för att uppnå optimala estimat utan bias. För SUR-modellen räcker det att residualerna är oberoende och likafördelade för att estimaten ska kunna användas för inferens (Moon & Perron, 2006). Detta antagande går enbart att undersöka efter genomförd regression. Problem med multikollinearitet behandlas på samma sätt som i avsnitt 3.1. Problem med autokorrelation undersöks genom att använda Durbin-Watsons test, då detta går att genomföra direkt på SUR-modellen. Testet utgår från nollhypotesen att ingen autokorrelation finns. Ett problem med testet är att resultatet kan hamna inom ett intervall där ingen slutsats kan dras. Vid problem med autokorrelation kommer estimaten vara utan bias och konsistenta men parameterskattningens varians påverkas. Om modellen inte uppfyller homoskedasticitetsantagandet kommer återigen parameterskattningarnas varians och därmed standardfel att påverkas. Problem med heteroskedasticitet är ingen omöjlighet då partiernas röstandelar har varierat i datasetet. Detta problem gäller särskilt för gruppen Sverigedemokraterna tillsammans med övriga partier då den vissa val får närmare noll procent av rösterna men över tio procent i andra. Homoskedasticitetsantagandet undersöks genom att studera residualgraferna för de olika estimeringarna. Vid SUR-estimering krävs att stickprovet innehåller minst 2(J+1) observationer, i denna studie innebär det att minst 18 observationer krävs. Därför används kommunaldata även vid SUR-estimeringen.
13
Vid OLS-skattning kan partiernas andel av rösterna variera fritt, vilket inte överensstämmer med verkligheten. Varje enskilt partis röstandel 𝑃 måste uppfylla kriteriet: 𝑃 ∈ 0,1 . För att uppfylla detta kriterium transformeras datan genom att beräkna logkvoten: 𝐿! = log (𝑝! 𝑝! ). Andelen som valt att inte rösta alls används som referenskategori (pJ) i enlighet med (Bélanger & Nadeau, 2005). Valet av referenskategori påverkar parameterskattningarna, vilka tolkas som hur logkvoten förändras i relation till referenskategorin. Transformationen bör förhindra att ett partis röstandel överstiger 100 procent, dock finns ingen restriktion i modellen som gör att partiernas gemensamma andel summerar till 100 procent. Att ingen restriktion om summan av partiernas röstandelar finns i metoden är en del av kritiken mot SUR-estimering, vilket diskuteras mer i avsnitt 3.2.1. För att utvärdera hur väl modellerna passar datan studeras Bayesian Information Criterion (BIC), som baseras på modellens likelihoodkvot. Ju lägre BIC-värde desto starkare indikation på att samtliga inkluderade oberoende variabler i modellen bidrar med information. I programvaran SAS gäller denna regel även för negativa värden, exempelvis är -200 bättre än -100. Det är därmed av intresse att BIC sjunker när de förklarande variablerna tillkommer i modellen (Arzheimer & Evans, 2010). Även det kvadrerade medelfelet (MSE) rapporteras för varje modell. Detta är ett mått på spridningen kring medelvärdet och kan fungera som en indikator på precisionen i estimaten.
3.2.1 Diskussion kring användandet av SUR vid valprognostisering SUR-estimering är på stark frammarsch och anses av vissa vara framtiden inom valprognostisering i flerpartisystem på grund av dess enkelhet. Dels är det okomplicerat att anpassa metoden efter det exakta antalet partier i landet och den tar i teorin hänsyn till det nollsummespel nationella riksdagsval är. Användandet av SURmodeller har dock fått kritik. I (Katz & King, 1999) kritiseras SUR-modellen på ett antal punkter, bland annat att metoden inte begränsar de skattade röstandelarna för samtliga partier att summera till 100 procent. Dessutom kan ett parti skattas till att få en negativ röstandel. Författarna menar att även när SUR-modellen gör bra skattningar och prognoser, så är en modell med möjliga icke-logiska utfall inte en trovärdig modell. Istället presenteras en ny 14
metod som kräver en djupare förståelse för statistisk metod som är särskilt utvecklad för att fungera i flerpartisystem. Författarna finner dessutom inga belägg för att valdata är multivariat normalfördelad vilket är ett antagande vid användning av SUR-modeller. I undersökningen finner de att brittisk valdata inte är normalfördelad utan följer en students t-fördelning. Författarna uppmanar fler forskare till att undersöka denna typ av grundläggande antaganden vid estimering. (Katz & King, 1999) kritiserar också de statistiska metoder som tidigare använts vid prognostisering av nationella val, samt redovisningen av resultaten inom disciplinen. (Tomz et al, 2002) besvarar kritiken mot användandet av SUR-modeller i (Katz & King, 1999) och hävdar att metoden är lämplig för valprognostisering. Genom att använda logaritmerade kvoter istället för rådatan menar författarna att metoden begränsar ett partis andel av rösterna mellan 0 och 100 procent. Författarna presenterar även hur informationsförlusten av normalfördelningsantagandet inte är ett stort problem. Det kan förklaras av att t-fördelningen konvergerar mot en standard normalfördelning när den går mot oändligt antal frihetsgrader. Fortsatt argumenterar författarna för att vinsten i form av användarvänlighet är tillräcklig för att fortsätta förespråka metoden. I (Tomz et al., 2002) ges även kritik på metoden i (Katz & King, 1999), då den anses vara så pass avancerad att möjligheterna för bredare användning är begränsad. Metoden prövas dessutom enbart vid en estimering av tre partier och beräkningarna fortsätter försvåras för varje ny dimension som läggs till modellen i form av ytterligare partier. Vidare fortsätter författarna att jämföra effektiviteten och träffsäkerheten hos SUR-estimering i relation till metoden i (Katz & King, 1999). Resultatet visar på att SUR inte fungerar nämnvärt sämre, och i vissa fall till och med bättre, än i (Katz & King, 1999).
4 Data I detta avsnitt behandlas stickprovets struktur och brister, hur de olika variablerna är definierade samt var datan har sitt ursprung.
4.1 Stickprov För att genomföra logistisk regression krävs ett stort stickprov. För möta detta antagande används valresultat från Sveriges 290 kommuner. Det innebär att antalet
15
observationer ökar till 3480 4 . För skattningar av valet 2010 används enbart informationen från valen 1973-2006, vilket innebär att 3190 observationer används. För SUR-estimering krävs att samtliga funktioner som skattas innehåller lika många observationer. Då Miljöpartiet inte ställde upp i riksdagsvalen förrän valet 1982 och Kristdemokraterna inte ställde upp i valet 1985, utan samarbetade istället med Centerpartiet, så faller 4 av riksdagsvalen bort. Kvar återstår 2030 observationer vid estimering av valet 2010 samt 2320 observationer vid estimering av valet 2014. Data över de förklarande variablerna från 1973 och framåt finns enbart på nationell nivå och de beroende variablerna är på kommunal nivå. Det är en påtaglig brist i datasetet. Rimligtvis bör de olika kommunerna uppleva olika konjunkturer, vilket gör att deras röstbeteende inte nödvändigtvis står i direkt proportion till den nationella konjunkturen. Detta torde försvaga sambandet mellan beroende och oberoende variabler. Man kan dock spekulera i att man i riksdagsvalet utvärderar regeringens arbete på en nationell nivå, medan man i kommunal- och landstingsvalen utvärderar den mer geografiskt närliggande politiska situationen. I (Jerôme & Jerôme-Speziari, 2000) undersöks hur franska kommunala val påverkas av nationella ekonomiska variabler, som en av få studier i dess slag. Resultatet i undersökningen är inte entydigt, dock verkar kommunala val fungera som utvärdering av det centrala styret. Detta kan indikera på att den nationella ekonomiska situationen även skulle påverka hur man röstar i nationella riksdagsval. Tidigare studier har funnit att det är den övergripande samhällsutvecklingen som avgör hur väljare röstar snarare än den egna livssituationen, det vill säga att väljare är mer sociotropiska än egotropiska (Nannestad & Paldam, 1993). Frågan huruvida om väljare är sociotropiska eller egotropiska av naturen är inte en avslutad diskussion och det finns även forskning som visar på att väljarna röstar med plånboken (Lewis-Beck & Paldam). Kan medborgare ses som sociotropiska skulle användandet av nationell data inte vara ett större problem i undersökningen. Fixa effekter används för att fånga upp skillnader i valresultat som beror på geografiska orsaker, exempelvis stark tradition av partitillhörighet i vissa kommuner. (Arzheimer & Evans, 2010). I uppsatsen används Stockholms kommun som referens.
4
Kommuner*val=290*12=3480, justerat efter kommunindelning 2007.
16
4.2 Variabelförklaring och datainsamling Uppsatsen utgår från fem olika variabler med tidigare väldokumenterad effekt. Dessa variabler är tillväxt (BNP), inflation, arbetslöshet, en tröttnadsvariabel samt en popularitetsvariabel. Tillväxtvariabeln är framtagen genom att ta förändringen i BNP från samma period tidigare år dividerat med den ursprungliga BNP-nivån. Datan är säsongsrensad och är beställd från Konjunkturinstitutet (KI). Perioden 1970-1992 är inte Sveriges officiella statistik utan KI:s egen kvartalsfördelning på SCB:s årsdata. Inflation och arbetslöshet anges båda i procentenheter. Inflationsdatan är hämtad från OECD och deras publikation Economic outlook No. 94. Det är en studie genomförd av OECD för att undersöka och prognostisera medlemsländernas ekonomiska utveckling. Där återfinns data för headline inflation, vilket innebär att beräkningarna även inkluderar matvaror och bränslepriser. Statistiken över arbetslöshet är hämtad från Statistiska Centralbyrån (SCB). För att jämföra data efter 1986, då definitionen av arbetslöshet förändrades, med äldre arbetslöshetssiffror har SCB:s justerat denna tidsserie. SCB påpekar att en viss osäkerhet kan förekomma i de justerade värdena. Tröttnadseffekten fångas av en dummyvariabel som antar värdet 1 om regeringen suttit vid makten i två mandatperioder eller längre vid valdagen, och 0 om så inte är fallet.
Användandet
av
två
mandatperioder
som
avgränsningsvärde
för
tröttnadseffekten är hämtad direkt från (Abramowitz, 1988). Utfallet i SCB:s stora Partisympatiundersökning (PSU) året innan valet fungerar som en estimator för de olika partiernas popularitet. Undersökningen genomförs i maj varje år och där frågan: ”Om det varit val idag, vilket parti hade du röstat på?” ställs. Popularitetsvariabeln är baserad på hur många procentenheter det rådande regeringsalternativet erhåller i PSU ett år innan valet. År 1981 genomfördes inte undersökningen och därmed kommer popularitetssiffran för valet 1982 från 1980. I den logistiska regressionsmodellen används en beroende variabel som anger huruvida det sittande regeringsalternativet får behålla makten efter valet. Om sittande regering är kvar i regeringsställning efter valet antar denna binära variabel värdet 1 och i annat fall 0. Vid koalitionsregeringar måste samtliga regeringspartier finnas kvar efter valet för att variabeln ska anta värdet 1. 17
5 Undersökning och Resultat Inledningsvis redovisas resultaten av den logistiska regressionen och slutligen SURestimeringen. Samtliga tolkningar av estimaten görs med reservation för eventuella problem med ouppfyllda antaganden.
5.1 Logistisk regression Inledningsvis konstateras att antagandet gällande stort stickprov är uppfyllt då fler än 3000 observationer används. Genom att studera korrelationsmatrisen i Tabell 8.1 och 8.2 i Appendix fastslås att multikollinearitet inte bör vara ett problem. Den högsta korrelationen återfinns mellan tröttnadsvariabeln och arbetslöshetsvariabeln, där den linjära korrelationen är |0,65|. Det genererar ett VIF-värde på 2,9 vilket är under tumregelns gräns för problematisk multikollinearitet. Dessa två variabler återfinns dock inte i samma modell. Pearsons- och Spearmans korrelationskoefficienter skiljer sig i vissa fall kraftigt åt, vilket kan tyda på ett icke-linjärt förhållande mellan de oberoende
variablerna.
Misstanken
bekräftas
av
att
studera
de
parvisa
sambandsdiagrammen.
5.1.1 Estimering av riksdagsvalet 2010 I Tabell 5.1 nedan presenteras estimeringarna för de fyra modellerna med data från 1973 fram till 2006 för att estimera utfallet i 2010 års val. Tabell 5.1 Estimering av valet 2010 med logistisk regression n=3190 Parameter Likelihoodkvot
Modell 1 <,0001
Modell 2 <,0001
Modell 3 <,0001
Intercept
0,7808 (0,0009)
-0,5002 (0,5507)
-1,2662 (0,0003)
17,7511 (<,0001)
19,6956 (<,0001)
Tillväxt Inflation
-0,0867 (<,0001)
Arbetslöshet
-0,0803 (<,0001)
-0,0118 (0,2397)
Tröttnad
-0,3139 (0,1902)
Popularitet
0,0196 (0,0115)
Tau-c
0.597
0.606
0.620
Paranteserna presenterar p-värderna tillhörande Wald’s 𝜒 ! -teststatistika
18
Inledningsvis studeras likelihoodkvotstestet för i Tabell 5.1 För samtliga modeller är p-värdet för testet mindre än 0,0001 vilket tyder på att åtminstone någon av de skattade parametrarna för modellerna är skilt från noll. Fortsättningsvis undersöks de förklarande variablernas enskilda signifikans. Samtliga variabler i Modell 1 är signifikanta5 samt har förväntade tecken, nämligen att inflation och arbetslöshet sänker oddset att få behålla regeringsmakten. För att undersöka hur oddset för att behålla regeringsmakten förändras med de förklarande variablerna studeras de avlogaritmerade estimaten. Tolkningen av parameterskattningen för arbetslöshetens är att oddset för att behålla makten efter valet sänks i genomsnitt med 7,7 6 procent när arbetslösheten ökar med en procentenhet. Sittande regering straffas därmed när arbetslösheten ökar. Liknande tolkningar går att göra för samtliga estimat. Tau-c för Modell 1 är 0,597, vilket reflekterar hur ofta modellens skattning överensstämmer med verkligheten. Modellen skattar således rätt utfall oftare än slumpen. I Modell 2 studeras variablerna tillväxt och inflation ett år innan riksdagsvalet. Estimatet för inflationen är negativt men icke-signifikant. Tillväxt har dock en positiv inverkan på oddset för att bli omvald medan inflation har en icke-signifikant negativ effekt. Tau-c för denna modell 0,606 vilket är marginellt bättre än Modell 1. Den sista modellen i Tabell 5.1 är Modell 3. Tillväxt och regeringens popularitet är signifikant och de förväntade positiva tecknen som innebär att båda höjer oddset för att bli omvald. Tröttnadseffekten har förväntat tecken men är icke-signifikant. Tau-c är 0,620 vilket är högre än för Modell 1 och 2. Det innebär att Modell 3 skattar rätt oftare än de andra två modellerna och är därmed att föredra.
5.1.2 Estimering av riksdagsvalet 2014 I Tabell 5.2 presenteras resultatet av skattningarna för 2014, vilka baseras på 3480 obersvationer, det vill säga ett större stickprov än tidigare då valet 2010 är inkluderat.
5
Hädanefter används signifikansnivån 𝛼 = 0,05
6
1-e-0,0803=0,077
19
Tabell 5.2 Estimering av valet 2014 med logistisk regression n=3480 Parameter Likelihoodkvot
Modell 1 <,0001
Modell 2 <,0001
Modell 3 <,0001
Intercept
0,6397 (<,0001)
-0,1716 (0,0043)
-1,3577 (<,0001)
10,7459 (<,0001)
0,0257 (<,0001)
Tillväxt Inflation
-0,0647 (<,0001)
Arbetslöshet
-0.0858 (<,0001)
-0,0405 (<,0001)
Tröttnad
-0,3657 (<,0001)
Popularitet
0,0257 (0,0007)
Tau-c
0.578
0.593
0.614
Paranteserna presenterar p-värderna tillhörande Wald’s 𝜒 ! -teststatistika
I Modell 1 är både inflation och arbetslöshet är signifikanta. Modellen har ett lägre tau-c (0,578) än dess motsvarighet för valet 2010. Vilket innebär att modellen har blivit sämre på att förutse rätt utfall. Den minskade precisionen kan bero på att det politiska landskapet förändrades efter 2010 års val då ett åttonde parti valdes in i riksdagen. Fortsättningsvis
studeras
Modell
2
som
har
ett
signifikant
p-värde
för
likehoodkvottestet vilket innebär att någon variabel bidrar med information till modellen. Inflations- och tillväxtvariabeln är signifikanta och har förväntande tecken. Tau-c är 0,593, vilket är högre än för Modell 1 för samma data. Även för Modell 2 är tau-c lägre för det större datasetet. Slutligen studeras Modell 3 I Tabell 5.2. Alla variablerna i modellen är signifikanta och har förväntat tecken. Tau-c statistikan är 0,614 vilket är det högsta värdet bland modellerna för valet 2014. Modell 3 fick även det högsta tau-c värdet vid estimering för 2010 års val. Modell 3 verkar således vara den som fungerar bäst för undersökningar om sittande regering får behålla makten efter valet, då denna skattar rätt utfall oftast av modellerna.
20
5.1.3 Prognoser för riksdagsvalen 2010 och 2014 Fortsättningsvis utvärderas modellerna genom att undersöka deras förmåga att prognostisera det verkliga utfallet i 2010 års riksdagsval samt skattningar för valet 2014. Sannolikheterna i tabellen nedan beräknas enligt formeln 3.3 på sidan 9. Valet 2010 vanns av den då sittande Alliansen. Valet 2014 vet vi ännu inte resultatet för, de senaste opinionsundersökningar tyder på att Alliansen kommer att förlora regeringsmakten. En bra modell bör därmed predicera dessa två utfall. Sannolikheten att den sittande regeringen får behålla makten presenteras i Tabell 5.3 nedan. Tabell 5.3 Sannolikheten för bibehållen regeringsmakt i valen 2010 och 2014 Val
Modell 1
Modell 2
Modell 3
2010
0,5181
0,4914
0,8518
2014
0,5018
0,4620
0,3575
För valet 2010 skattar Modell 1 och Modell 3 att Alliansen får behålla regeringsmakten medan Modell 2 säger det motsatta. Både Modell 1 och 2 skattar att sannolikheten för bibehållen makt nära 0,5 i båda valen, vilket kan liknas vid att singla slant om utfallet. Modell 3, vilken har högst tau-c, predicerar det verkliga utfallet från valet 2010 med en sannolikhet på 85 procent. Samma modell estimerar att den nuvarande regeringen kommer förlora regeringsmakten i nästa val. Våra modeller för att estimera om sittande regering får behålla makten 2014 visar inte ett entydigt svar. Den förenklingen av det politiska systemet som krävs för att kunna applicera logistisk regression på svensk valdata tycks således leda till en betydande informationsförlust. Sammanfattningsvis kan man säga att två av tre modeller prognostiserar att valet 2014 resulterar i ett regeringsskifte, men enbart med någorlunda säkerhet.
5.2 SUR-estimering I följande avsnitt presenteras resultatet för estimeringen av andelen röster för de olika partierna i valet 2010, samt hur väl antagandena för estimeringen uppfylls och vad eventuella konsekvenser för icke-uppfyllda antaganden får. Därefter repeteras estimeringen för riksdagsvalet 2014.
21
5.2.1 Estimering av riksdagsvalet 2010 Inledningsvis studeras BIC-värdena i Tabell 8.1 i Appendix för att undersöka huruvida våra förklarande variabler tillför någon information om variationen i partiernas röstandelar. De olika partiernas BIC-värden skiljer sig åt, vilket tyder på att modellerna innehåller olika mycket information för de olika partierna. Detta är en indikation på att de oberoende variablerna förklarar variationen i röstandelar för vissa partierna bättre än för andra. Gruppen med Sverigedemokraterna tillsammans med övriga partier har överlägset högst BIC-värden för samtliga modeller. Det kan vara en första indikator på att denna grupp kommer vara svårast att skatta. BIC-värdena för Modell 3 tenderar att vara lägre än för ”De stora två”-modellerna (Modell 1 och Modell 2), som antyder att den kan fungera bättre för att prognostisera valresultat. I Tabell 5.4 presenteras resultatet av SUR-estimeringen av 2010 års riksdagsval för Modell 1. Tabell 5.4 SUR-estimering av Modell 1 för valet 2010, n=2030 M
Fp
C
Kd
Mp
S
V
Sd& Övriga
Intercept
0,376179
0,436873
-1,69058
-0,83010
-0,34850
0,600343
-0,52928
-1,26297
(<,0001)
(<,0001)
(<,0001)
(0,0003)
(0,0028)
(<,0001)
(<,0001)
(0,0267)
0,032300
-0,02317
0,04595
-0,08939
-0,08019
0,008509
-0,04740
-0,07785
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0005)
0,014373
-0,10156
-1,01428
-0,021222
-0,03509
0,007640
0,042594
-0,04041
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
Res. Norm.
Nej
Nej
Ja
Nej
Ja
Nej
Ja
Nej
Heterosked.
Ja
Nej
Ja
Ja
Ja
Ja
Ja
Nej
Autokorr.
Ja
Ja
Nej
-
Ja
Ja
Nej
Nej
MSE
0,033
0,067
0,078
0,349
0,092
0,010
0,085
2.192
Adj-R2
0,833
0,732
0,811
0,446
0,636
0,838
0,748
-0,012
Inflation
Arbetslöshet
1. Parenteserna presenterar p-värdena tillhörande variablernas t-statistika. 2. De fixa effekterna presenteras inte i Tabellen 3. I Autokorr. Representerar (-) ett icke-fullständigt svar 4. Estimaten står i kontrast mot de som inte röstar alls.
Innan tolkningen av resultaten bör modellens antaganden undersökas. Genom att studera residualutskrifterna för de olika politiska partierna är det tydligt att modellens antaganden inte är uppfyllda. Residualerna inte är likafördelade, då vissa partier följer normalfördelningen
men
inte
alla.
Enbart
Centerpartiet,
Miljöpartiet
och 22
Vänsterpartiet har normalfördelade residualer och därmed är deras estimat minst troliga att innehålla bias. Parameterskattningarna av dessa variabler indikerar på att olika partier påverkas olika av de ekonomiska variablerna. Det är viktigt att tänka på att estimatens tecken och tolkningar bör göras i relation till de som väljer att inte rösta alls. Vänsterpartiet och Socialdemokraterna uppvisar den effekt beskriven i (Jordahl, 2003), där partier till vänster på den politiska skalan kan växa under ökad arbetslöshet. Dock ökar även Moderaterna, som enda alliansparti, i kontrast till de som inte röstar när arbetslösheten går upp. Även inflationen tycks ha en positiv inverkan på Moderaterna och Socialdemokraterna (såväl som Centerpartiet). Sveriges två största riksdagspartier på olika sidor av den politiska skalan verkar därmed växa vid lågkonjunktur, i relation till de som inte röstar. Det kan indikera på att väljarna har ett högre förtroende för att de stora partierna kan hantera lågkonjunkturer bättre än övriga alternativ. Som tidigare nämnts ska tolkningarna göras med försiktighet då det kan förekomma bias i parameterskattningarna.
Det
justerade
R2-värdet
för
Moderaterna
och
Socialdemokraterna är även det högsta bland partierna, samtidigt som deras MSE är de lägsta. Intressant nog så indikerar denna modell inte på att Sverigedemokraterna tillsammans med övriga partier ökar när arbetslösheten och inflationen ökar. Detta är inte i linje med förväntningarna av ”missnöjespartier”, vilket Sverigedemokraterna i vissa sammanhang spekuleras vara. Att effekten av de förklarande variablerna i detta fall bli negativt tyder på att gruppen som inte röstar alls ökar i förhållande till gruppen mes Sverigedemokraterna tillsammans med övriga partier. Dock är det justerade R2värdet för denna grupp negativt, vilket är utanför dess möjliga logiska värden. Denna grupp har också överlägset högst medelfel. I Tabell 8.2 i Appendix presenteras standardfelen. Även standardfelen för Sverigedemokraterna tillsammans med övriga partier skiljer sig från resterande partiers, då dessa tenderar att vara högre. Modell 1 verkar således inte lämplig för att förklara Sverigedemokraterna tillsammans med övriga partier. Som tidigare beskrivits leder problem med heteroskedasticitet och autokorrelation till att parameterskattningarnas varians och därmed inferens blir missvisande. I Tabell 5.5 presenteras resultatet av skattningen för Modell 2.
23
Tabell 5.5 SUR-estimering av Modell 2 för valet 2010, n=2030 M
Fp
C
Kd
Mp
S
V
Sd& Övriga
Intercept
0,650493
-0,49019
-1,89944
-1,01269
-0,59414
0,71233
-0,12957
-1,35127
(<,0001)
(0,0012)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,2821)
(0,0155)
0,004319
0,015039
0,062997
-0,08254
-0,07462
0,001324
-0,06454
-0,09134
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0140)
(<,0001)
(<,0001)
-0,05760
2,681668
3,421826
0,130092
-1,96723
-1,83987
-1,54769
-9,812048
(0,7901)
(<,0001)
(0,8348)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
Res. Norm.
Nej
Nej
Nej
Nej
Ja
Ja
Nej
Nej
Heterosked.
Ja
Nej
Ja
Ja
Ja
Ja
Ja
Nej
Autokorr.
Ja
Ja
Nej
Nej
Ja
Ja
Nej
Ja
MSE
0,042
0,159
0,074
0,353
0,101
0,009
0,101
2,157
Adj-R2
0,784
0,367
0,821
0,440
0,599
0,857
0,701
0,005
Inflation
Tillväxt
1. Parenteserna presenterar p-värdena tillhörande variablernas t-statistika. 2. De fixa effekterna presenteras inte i Tabellen 3. I Autokorr. Representerar (-) ett icke-fullständigt svar 4. Estimaten står i kontrast mot de som inte röstar alls.
I likhet med Modell 1 är det inget av partierna som uppfyller samtliga antaganden för användandet av SUR-estimering. Enbart Miljöpartiet och Socialdemokraterna har normalfördelade residualer och därmed bör estimaten vara fria från bias. Partierna har dock problem med autokorrelation och heteroskedasticitet. Majoriteten av partierna har negativa tecken för tillväxtvariabeln, medan det förväntade tecknet för variabeln var positivt. Detta innebär att i förhållande till gruppen som inte röstar alls så krymper partierna när tillväxten är hög. I (Mughan, 1987) hittar författaren samma resultat. Det kan eventuellt bero på att fler personer inte känner ett behov av att rösta när ekonomin går bra. Icke-röstande skulle kunna ses som en lyx människor unnar sig när landets ekonomi är stabil. För Moderaterna och Centerpartiet är variabeln inte signifikant. Gruppen Sverigedemokraterna tillsammans med övriga partier missgynnas till synes hårdast av tillväxten i förhållande till de som inte röstar alls. Jämfört med Modell 1 följer nu Sverigedemokraterna tillsammans med övriga partier mönstret för missnöjespartier. Standardfelen för denna grupp är betydligt högre än för resterande partier, vilket kan kontrolleras i Tabell 8.3 i Appendix. Modellen lyckas enbart förklara 0,5 procent av variationen i röstandelar och MSE är högt för gruppen. 24
Socialdemokraterna är fortsatt det parti där modellen har högst förklaringsgrad och lägst MSE. Estimaten för Socialdemokraterna tenderar att likna Moderaternas och de övriga partierna till höger på den politiska skalan mer än de övriga av dagens oppositionspartier. Slutligen presenteras resultatet av den tredje och sista estimeringsmodellen för 2010 års riksdagsval i Tabell 5.6. Tabell 5.6 SUR-estimering av Modell 3 för valet 2010, n=2030 M
Fp
C
Kd
Mp
S
V
Sd& Övriga
Intercept
0,820091
-0,36019
-3,10469
1,856150
0,473533
0,336658
-0,29920
5,698527
(<,0001)
(0,0296)
(<,0001)
(<,0001)
(0,0007)
(<,0001)
(0,0003)
(<,0001)
-1,55536
0,212116
-4,72607
10,38601
6,610668
-1,73398
8,865399
-5,74868
(<,0001)
(0,5819)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
0,148157
0,163684
0,578577
-0,85840
-0,47932
0,015170
-0,72388
-0,35069
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
-0,00521
-0,00278
0,031920
-0,07178
-0,03159
0,009100
0,002819
-0,18030
(<,0001)
(0,1016)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0008)
(<,0001)
Res. Norm.
Nej
Nej
Ja
Ja
Nej
Nej
Ja
Nej
Heterosked.
Nej
Ja
Nej
Nej
Nej
Ja
Ja
Ja
Autokorr.
Ja
Ja
Nej
Nej
Ja
Nej
Nej
Nej
MSE
0,036
0,156
0,0269
0,126
0,110
0,006
0,038
1,266
Adj-R2
0,816
0,380
0,935
0,799
0,563
0,900
0,887
0,416
Tillväxt
Tröttnad
Popularitet
1. Parenteserna presenterar p-värdena tillhörande variablernas t-statistika. 2. De fixa effekterna presenteras inte i Tabellen 3. I Autokorr. Representerar (-) ett icke-fullständigt svar 4. Estimaten står i kontrast mot de som inte röstar alls.
Även för Modell 3 misslyckas majoriteten av partierna att uppfylla antagandena för metoden. För Centerpartiet fungerar modellen väl för att förklara partiets röstandelar och residualerna följer normafördelningen. Jämför man samtliga partiers standardfel, i Tabell 8.4 i Appendix, urskiljer sig inte Centerpartiet nämnvärt trots att de andra partierna har problem med autokorrelation och/eller heteroskedasticitet.
25
Tröttnadseffekten har ingen entydig påverkan, då den för vissa partier har negativ effekt och för andra positiv. Det är i huvudsak de mindre partierna som minskar när regeringen har suttit i två mandatperioder i förhållande till de som inte röstar alls. Inte heller popularitetsvariabeln beter sig som förväntat då denna får har en negativ effekt på flera av partierna, vilket skulle indikera på att om regeringens popularitet ökar så minskar partiers röstandelar i relation till gruppen som inte röstar alls. Detta kan ha sin förklaring i att ju nöjdare man är med regeringen desto mindre benägen blir man att gå och rösta på valdagen. I (Mueller, 1970) finner författaren att invånare är mer benägna att bestraffa dåligt skötta ekonomier än de är att belöna välskötta. Modell 3 är den modell som får högst genomsnittlig förklaringsgrad, medan gruppen med Sverigedemokraterna tillsammans med övriga partier har fortsatt högst MSE. Sammanfattningsvis kan det konstateras att estimeringen inte uppfyller antagandena för metoden, vilket leder till biasproblematik och möjligheterna till god inferens är små. Heteroskedasticitet är ett vanligare problem än autokorrelation för samtliga partier.
5.2.2 Estimering av riksdagsvalet 2014 Inledningsvis studeras återigen BIC-värdena i Tabell 8.1 i Appendix. För alla partier är BIC-värdena lägst för Modell 1 eller Modell 3. Kristdemokraterna, Centerpartiet, Vänsterpartiet och Sverigedemokraterna tillsammans med övriga partier har lägst BIC-värde för Modell 3 medan röstandelar för Folkpartiet och Miljöpartiet bäst förklaras av Modell 1. Moderaterna och Socialdemokraterna har lägst BIC-värden för olika modeller vid estimering med de olika dataseten. I Tabell 5.7 presenteras resultatet för SUR-estimeringen av Modell 1 för det kommande riksdagsvalet 2014.
26
Tabell 5.7 SUR-estimering av Modell 1 för valet 2014, n=2320 M
Fp
C
Kd
Mp
S
V
Sd& Övriga
Intercept
0,455886
0,409038
-1,5687
-0,90845
-0,29776
0,531999
-0,66853
-1,0736
(<,0010)
(<,0001)
(<,0001)
(<,0001)
(0,0043)
(<,0001)
(<,0001)
(0,0356)
0,032751
-0,10163
-0,01426
-0,0217
-0,03506
0,007464
0,042118
-0,03942
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0004)
0,000559
-0,02112
0,049048
-0,07462
-0,08103
0,013886
-0,03284
-0,1082
(0,6304)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
Res. Norm.
Nej
Ja
Ja
Nej
Ja
Nej
Ja
Nej
Heterosked.
Ja
Nej
Ja
Ja
Ja
Ja
Ja
Ja
Autokorr.
Nej
Ja
Nej
Nej
-
Ja
-
-
MSE
0,052
0,061
0,075
0,329
0,084
0,015
0,101
2,006
Adj-R2
0,749
0,74
0,841
0,428
0,675
0,794
0,683
0,054
Arbetslöshet
Inflation
1. Parenteserna presenterar p-värdena tillhörande variablernas t-statistika. 2. De fixa effekterna presenteras inte i Tabellen 3. I Autokorr. Representerar (-) ett icke-fullständigt svar 4. Estimaten står i kontrast mot de som inte röstar alls.
Inget parti uppfyller samtliga antaganden vid användandet av SUR-estimering. Endast Folkpartiet, Centerpartiet, Miljöpartiet och Vänsterpartiet uppfyller antagandet om normalfördelade residualer vilket borde innebära att punktskattningarna är utan bias. Däremot har alla partierna problem med heteroskedasticitet och/eller autokorrelation. Moderaterna är det enda partiet i modellen där inflationsvariabeln inte är signifikant. Socialdemokraterna, Vänsterpartiet och Moderaterna växer i förhållande till referensgruppen när arbetslösheten stiger, likt tidigare estimeringar. Sverigedemokraterna tillsammans med övriga partier har låg förklaringsgrad, vilket är en indikation på att modellen inte förklarar mycket av variationen i röstandelar för denna grupp. Sverigedemokraterna tillsammans med övriga partier har även överlägset högsta MSE i modellen, vilket varit ett genomgående resultat i undersökningen. Trots den låga förklaringsgraden och det höga medelkvadratfelet är passformen bättre än för samma modell vid skattning av valet 2010.
27
Tabell 5.8 SUR-estimering av Modell 2 för valet 2014, n=2320 M
Fp
C
Kd
Mp
S
V
Sd& Övriga
Intercept
0,7411
-0,45508
-1,69206
-1,10069
-0,59251
0,593739
-0,31875
-1,38193
(<,0001)
(0,0006)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0054)
(0,0044)
-3,3505
1,518679
1,114062
3,599233
-0,89340
0,619808
2,90834
-10,8001
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0004)
-0,00938
0,0102
0,053395
-0,06811
-0,07015
0,011548
-0,046
-0,0955
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
Res. Norm.
Nej
Nej
Ja
Nej
Ja
Ja
Ja
Nej
Heterosked.
Ja
Nej
Ja
Ja
Ja
Ja
Ja
Nej
Autokorr.
Nej
Ja
Nej
Nej
-
Ja
Ja
-
MSE
0,046
0,140
0,075
0,317
0,092
0,015
0,104
1,874
Adj-R2
0,775
0,405
0,810
0,449
0,641
0,795
0,671
0,116
Tillväxt
Inflation
1. Parenteserna presenterar p-värdena tillhörande variablernas t-statistika. 2. De fixa effekterna presenteras inte i Tabellen 3. I Autokorr. Representerar (-) ett icke-fullständigt svar 4. Estimaten står i kontrast mot de som inte röstar alls.
Återigen uppfyller inget av partierna alla antaganden för att använda SUR-estimering. Centerpartiet, Miljöpartiet, Socialdemokraterna och Vänsterpartiet är det enda partierna med normalfördelade residualer och alla partierna har problem med heteroskedasticitet och/eller autokorrelation. Det är inte längre samma partier som har problem att uppfylla samma antaganden. I Tabell 5.5 har fler partier problem autokorrelation än i Tabell 5.8. Variablerna är signifikanta för alla partier till skillnad från Modell 1 i Tabell 5.7. Återigen är det Sverigedemokraterna tillsammans med övriga partier som har lägst förklaringsgrad i OLS-skattningarna. Centerpartiet har nu högst förklaringsgrad (0,81), jämfört med estimering av 2010 års val då Socialdemokraterna förklarades bäst av modellen. Även i Tabell 5.8 har Sverigedemokraterna tillsammans med övriga partier avsevärt högre MSE än de andra partierna. I förhållande till samma modell vid estimering av 2010 års riksdagsval är det fler partiers vars röstandel ökar vid ekonomisk tillväxt, i relation till de som inte röstar alls. Sverigedemokraterna tillsammans med övriga partier krymper fortfarande
28
kraftigt vid positiv tillväxt. Standardfelet för gruppen är fortsatt högre än för andra partier, se Appendix Tabell 8.6. Tabell 5.9 SUR-estimering av Modell 3 för valet 2014, n=2320 M
Fp
C
Kd
Mp
S
V
Sd& Övriga
Intercept
0,627248
-0,37365
-2,78667
1,605776
0,204219
0,454548
-0,34375
4,842583
(<,0001)
(0,0107)
(<,0001)
(<,0001)
(0,1741)
(<,0001)
(<,0001)
(<,0001)
-4,31860
0,156164
-1,14195
5,068830
1,02586
0,771944
8,339666
-19,7892
(<,0001)
(0,5884)
(<,0001)
(<,0001)
(0,0005)
(<,0001)
(<,0001)
(<,0001)
0,135638
0,16343
0,594815
-0,88248
-0,5462
0,026523
-0,72626
-0,4143
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(0,0005)
(<,0001)
(<,0001)
(<,0001)
0,000122
-0,00268
0,000924
-0,06151
-0,02081
0,00426
0,003834
-0,15319
(0,8889)
(0,0816)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
(<,0001)
Res. Norm.
Nej
Nej
Ja
Nej
Ja
Ja
Ja
Nej
Heterosked.
Ja
Nej
Ja
Ja
Ja
Ja
Ja
Ja
Autokorr.
Ja
Ja
-
Nej
Ja
Nej
Nej
Nej
MSE
0,044
0,137
0,050
0,155
0,144
0,017
0,037
1,394
Adj-R2
0,785
0,420
0,875
0,731
0,439
0,759
0,882
0,342
Tillväxt
Tröttnad
Popularitet
1. Parenteserna presenterar p-värdena tillhörande variablernas t-statistika. 2. De fixa effekterna presenteras inte i Tabellen 3. I Autokorr. Representerar (-) ett icke-fullständigt svar 4. Estimaten står i kontrast mot de som inte röstar alls.
Kraven för att använda SUR-modellen uppfylls inte i Modell 3. Endast Centerpartiet, Miljöpartiet, Socialdemokraterna och Vänsterpartiet har normalfördelade residualer. Vid denna estimering uppvisar alla partier utom Folkpartiet problem med heteroskedasticitet. Autokorrelation är fortsatt ett problem för en del partier. Moderaterna och Folkpartiet har problem med icke-signifikanta variabler. Parameterskattningen för popularitetsvariabeln är nära noll för samtliga partier. Röstandelen förändras därmed inte nämnvärt i relation till de som inte röstar alls när populariteten av regeringen ökar med en procentenhet. Sverigedemokraterna tillsammans med övriga partier drabbas fortsatt starkt negativt av ökad tillväxt med högt standardfel. De minskar därmed i relation till gruppen som inte röstar alls i högkonjunktur.
29
Den justerade förklaringsgraden på OLS-skattningarna för Sverigedemokraterna tillsammans med övriga partier är återigen den lägsta för alla partier i modellen. Folkpartiet har också en låg förklaringsgrad, som kan bero på att varken tillväxt- eller popularitetsvariabeln är signifikant för partiet. Modellen förklarar variationen i röstandelar bäst för Vänsterpartiet, då partiets förklaringsgrad är 0,882. Modell 3 är fortsatt den modell som ger högst förklaringsgrad samt lägst MSE. Samtliga modeller uppvisar liknande brister gällande problem att uppfylla metodens antaganden.
5.2.3 Prognoser för riksdagsvalen 2010 och 2014 I följande avsnitt presenteras de slutgiltiga prognoserna för riksdagsvalet 2010 och 2014. Prognoserna för 2010 års val jämförs med det slutgiltiga resultatet i valet medan prognosen för 2014 jämförs med SIFOs opinionsundersökning från november 2013. Undersökningen är den senast tillgängliga siffran som kan återspegla ett möjligt utfall i nästkommande val. Skillnaden mellan prognos och utfall beräknas efter standardisering av valprognosen för att få en meningsfull jämförelse. Inledningsvis presenteras prognoserna genom Modell 1 i Tabell 5.10. Tabell 5.10 Prognos för svenska partiers röstandelar (%) med Modell 1 M
Fp
C
Kd
Mp
S
V
Sd&
Summa
Övriga Prognos valet 2010
37,5
12,7
3,1
7,5
10,7
38
17,2
4,1
130,8
Standardiserad prognos
28,7
9,7
2,4
5,7
8,2
29,1
13,2
3,1
100,2
Valresultat 2010
30,1
7,1
6,6
5,6
7,3
30,7
5,6
7,1
100,1
Differens
-1,4
2,6
-4,2
0,1
0,9
-1,6
7,6
-4,0
Prognos valet 2014
31,0
10,9
2,9
5,3
8,9
27,7
10,8
4,0
101,4
Standardiserad prognos
30,5
10,8
2,8
5,2
8,7
27,3
10,7
3,9
99,9
SIFO (nov 2013)
25,0
5,9
4,1
3,9
9,1
34,5
7,3
10,2
100,1
Differens 5,5 4,9 -1,3 1,3 -0,4 -7,2 3,4 -6,3 Differenserna i tabellen är beräknade utifrån den standardiserade prognosen
Vid första anblick konstateras att Modell 1 inte lyckas uppfylla den logiska och realistiska begränsningen att röstandelarna bör summera till 100 procent. Samtliga av
30
de dåvarande riksdagspartiernas andel av rösterna överskattas, medan gruppen med Sverigedemokrater tillsammans med övriga partier underskattas. För att jämföra vårt resultat med det verkliga utfallet krävs en standardisering7. Vänsterpartiets röstandelar överskattas mest följt av Folkpartiet. Centerpartiet prognostiseras få lämna riksdagen, då deras andel av rösterna inte överstiger riksdagsspärren. Modell 1 lyckas inte förutspå Sverigedemokraternas inträde i riksdagen. Sverigedemokraterna tillsammans med
övriga
partier
underskattas
med
4
procentenheter.
De
rödgröna
oppositionspartierna prognostiseras få en större andel av rösterna än den borgerliga Alliansen. Därmed skattar modellen fel vinnare av valet. Samma modells prognos för det kommande valet 2014 tycks fungera bättre. Röstandelarna summer till 101,4 procent vilket är betydligt bättre än för 2010. Då det inte finns någon inbyggd mekanism i SUR-estimeringen som begränsar summan av röstandelarna är en prognos som summerar till 101,4 procent rätt god. Trots det standardiseras resultatet för mer korrekt jämförelse. Alliansens andel av rösterna är större än den rödgröna oppositionens. Däremot skattas Centerpartiet hamna precis under riksdagsspärren, då partiet enbart får 3,9 procent av rösterna och får lämna riksdagen. Alliansen skulle därmed förlora regeringsmakten. Efter
standardisering
befinner
sig
även
Kristdemokraterna
väldigt
nära
riksdagsspärren, med 4,1 procent av rösterna. Socialdemokraterna, Miljöpartiet och Vänsterpartiet skulle inte överstiga 50 procent av rösterna och ett samarbete mellan dem leda till en minoritetsregering. Sverigedemokraternas andel av rösterna underskattas sannolikt med en stor felmarginal, då de tillsammans med övriga partier enbart får 4 procent av rösterna. Det är inte ett troligt resultat då de i senaste opinionsundersökningarna är Sveriges tredje största partiet.
7
Samtliga estimat beräknas genom att divideras med den prognostiserade summan av partierna
dividerat 100, exempelvis standardiseras estimatet för Moderaterna med Modell 1 för 2010 års riksdagsval: 37,5/1,208
31
Tabell 5.11 Prognos för svenska partiers röstandelar (%) med Modell 2 M
Fp
C
Kd
Mp
S
V
Sd&
Summa
Övriga Prognos valet 2010
37,6
10,1
2,3
7,4
12,7
44,6
19,6
9,7
144,0
Standardiserad prognos
26,1
7,0
1,6
5,1
8,8
31,0
13,6
6,7
99,9
Valresultat 2010
30,1
7,1
6,6
5,6
7,3
30,7
5,6
7,1
100,1
Differens
-4,0
-0,1
-5,0
0,5
1,3
0,3
8,0
-0,4
Prognos valet 2014
32,3
9,8
2,8
5,2
8,5
27,9
11,3
3,8
101,5
Standardiserad prognos
31,7
9,6
2,8
5,1
8,4
27,5
11,1
3,8
100,0
SIFO (nov 2013)
25,0
5,9
4,1
3,9
9,1
34,5
7,3
10,2
100,1
Differens
6,7
3,7
-1,3
1,2
-0,7
-7,0
3,8
-6,4
Differenserna i tabellen är beräknade utifrån den standardiserade prognosen
Modell 2 misslyckas med att summera alla partiers röstandelar till 100 procent. Modellen prognostiserar återigen den rödgröna oppositionen till vinnare av det föregående riksdagsvalet. Vänsterpartiet överskattas mest, medan Centerpartiet underskattas mest. Sverigedemokraterna tillsammans med övriga partier estimeras komma över riksdagsspärren. Modell 2 lyckas således bättre med att fånga upp att ett nytt parti väljs in i riksdagen. Modell 2 gör en mer realistiskt prognos för riksdagsvalet 2014 än 2010, då röstandelarna summerar till 101,5 procent. Dock överskattas antagligen återigen Vänsterpartiet medan Sverigedemokraterna tillsammans med övriga partier sannolikt underskattas. Socialdemokraterna är det parti som skattas längst ifrån resultatet av den senaste opinionsundersökningen med en differens på 7 procentenheter. Även denna modell prognostiserar att Socialdemokraterna, Miljöpartiet och Vänsterpartiet skulle få möjlighet att bilda minoritetsregering eftersom Centerpartiet inte skattas uppnå fyra procent och därmed får lämna riksdagen. Avslutningsvis presenteras resultatet för prognosen av Modell 3 i Tabell 5.12.
32
Tabell 5.12 Prognos för svenska partiers röstandelar (%) med Modell 3 M
Fp
C
Kd
Mp
S
V
Sd&
Summa
Övriga Prognos valet 2010
37,8
11,8
5,6
1,9
4,4
47,7
9,8
1,1
120,1
Standardiserad prognos
31,5
9,8
4,7
1,6
3,7
39,7
8,1
1,0
100,1
Valresultat 2010
30,1
7,1
6,6
5,6
7,3
30,7
5,6
7,1
100,1
Differens
1,4
2,7
-1,9
-4,0
-3,6
9,0
2,5
-6,1
Prognos valet 2014
33,0
11,2
4,8
2,6
4,9
29,7
6,2
2,5
94,9
Standardiserad prognos
34,9
11,9
5,0
2,8
5,2
31,4
6,6
2,6
100,4
SIFO (nov 2013)
25,0
5,9
4,1
3,9
9,1
34,5
7,3
10,2
100,1
Differens
9,9
6,0
0,9
-1,1
-3,9
-3,1
-0,7
-7,6
Differenserna i tabellen är beräknade utifrån den standardiserade prognosen
Modell 3 är den av modellerna som kommer närmast den logiska begränsningen att partiernas gemensamma andel bör summera till 100 procent för riksdagsvalet 2010, trots en överskattning på nästan 20 procentenheter. Denna modell lyckas inte heller förutspå den verkliga vinnaren av valet, då de rödgröna oppositionspartiernas andel av rösterna är större än Alliansens. Miljöpartiet och Kristdemokraterna skattas båda hamna under riksdagens fyraprocentsspärr och skulle därmed få lämna riksdagen. För denna modell är det Socialdemokraterna som överskattas mest, med hela 9 procentenheter över det slutliga resultatet efter standardisering. Sverigedemokraterna tillsammans med övriga partier underskattas när de gemensamt enbart får 1 procent av rösterna. Prognosen för riksdagsvalet 2014 summerar enbart till 94,9 procent. Modellen skattar att Kristdemokraterna får lämna riksdagen medan Centerpartiet denna gång får behålla sin riksdagsplats. Modellerna verkar ha fångat upp den nedgående trend de två partier har uppvisat. Båda partier har i opinionsundersökningar placerar sig nära riksdagens 4-procentsspärr.
33
Sverigedemokraterna kommer enligt denna prognos inte få stanna kvar i riksdagen. Enligt prognosen skulle valet vinnas av Alliansen, även utan Kristdemokraterna. Dock så överskattas samtliga Allianspartier medan oppositionspartierna underskattas. Sammanfattningsvis kan det konstateras att ingen av modellerna lyckas prognostisera utfallet av riksdagsvalen 2010 och 2014 på ett tillfredsställande sätt. Modellerna tenderar dock att fungera bättre vid prognoser för 2014 års riksdagsval, då de nästan klarar begräsningen att samtliga partiers röstandelar bör summer till hundra procent.
6 Diskussion och slutsats I denna uppsats har potentialen att använda logistisk regression och SUR för att göra prognoser i svenska riksdagsval studerats, med förklarande variabler som finns tillgängliga ett år innan valet. Den logistiska regressionen baseras på en binär beroende variabel, och kan användas för att skatta huruvida det sittande regeringsalternativet får behålla regeringsmakten efter valet. I undersökningen lyckas Modell 3, presenterad i (Abramowitz, 1988), förutspå valresultatet i 2010 års riksdagsval med störst precision. Då regeringen enbart lyckades bilda en minoritetsregering är det dock svårt att avgöra om detta är en bra skattning eller ej. Eftersom Alliansen i valet 2006 hade majoritet kan resultatet i valet 2010 tolkas som att väljarna röstade bort dem från regeringsmakten. På grund av att Sverigedemokraterna inte röstade mot Alliansens regeringsalternativ fick de trots majoritetsförlusten sitta kvar. På grund av Sverigedemokraternas inträde i riksdagen blir det svårare för de två traditionella blocken att på egen hand uppnå de 175 mandat som krävs för att bilda en majoritetsregering. I och med Sverigedemokraternas inträde i riksdagen ökar sannolikheten för minoritetsregeringar eftersom inget av blocken hittills velat samarbeta med partiet. Inför riksdagsvalet 2014 har Socialdemokraterna dessutom meddelat att de är villiga att samarbeta med partier från både höger- och vänsterblocket för att bilda regering. Därmed kan det binära utfallet i en logistisk regression inte längre trovärdigt spegla det svenska politiska landskapet och därför förlorar modellen sin potential. Dock kan metoden ge en fingervisning mot vart de politiska vindarna blåser. Två av modellerna
34
prognostiserar att Alliansen kommer förlora nästa val. En av dessa är Modell 3, som fungerade bäst för skattningar av valet 2010. SUR-modellerna har i teorin en bättre möjlighet att göra en realistisk prognos över utfallet i svenska riksdagsval, eftersom varje partis röstandel kan skattas enskilt. För att estimat ska vara utan bias och dessutom konsistenta, effektiva och uttömmande bör antagandena för den statistiska metoden vara uppfyllda. Vid estimering med SUR krävs att antaganden för OLS uppfylls för samtliga funktioner som ingår i ekvationssystemet som bildar modellen. Residualerna för modellen bör därmed vara likafördelade samt att det inte ska förekomma heteroskedasticitet, autokorrelation eller perfekt multikollinearitet. I denna undersökning är det i få undantagsfall dessa antaganden uppfylls av något parti. Därmed blir parameterskattningarna och/eller inferens gjord på modellen sällan helt tillförlitliga. Problem med autokorrelation och heteroskedasticitet torde inte vara unikt för svensk valdata men diskuteras sällan i studier om valprognostisering. HAC-estimatorer bör således vara praxis inom området. Parameterskattningarna för de olika modellerna indikerar mot att olika riksdagspartier påverkas olika av de förklarande variablerna, i förhållande till gruppen som väljer att inte rösta, vilket är i linje med tidigare forskning. Dock får ett flertal av variablerna motsatt tecken än förväntat, vilket kan vara en konsekvens av bias i estimaten eller en följd av att nationell data skall förklara riksdagsvalresultat på regional nivå. Estimatens tecken påverkas även av vilken grupp som används som referens vid logtransformationen innan OLS-skattningen. Prognoserna från SUR-modellerna uppfyller inte det logiska antagandet att partiernas röstandelar bör summera till 100 procent. Även detta kan ha sin förklaring i att SURestimeringens antaganden uppfylls eller på grund av brister i datasetet. Huruvida detta uppfylls i tidigare forskning är inte tydligt, då det inte redovisas om resultaten är standardiserade eller ej. I synnerhet lyckas ingen av modellerna att förutspå Sverigedemokraternas entré i riksdagen i valet 2010. Modellerna har även svårt att prognostisera deras förmodade fortsatta framgång. I linje med tidigare fynd från andra länder så är nya partiers framgångar svåra att förutspå. Modeller som inte lyckas prognostisera stora
35
förändringar i det politiska landskapet är väldigt begränsande och kommer inte lyckas göra aktuella prognoser. Sammanfattningsvis kan vi dra slutsatsen att SUR-modeller inte fungerar väl i Sverige. Mycket av tidigare forskning på området presenterar sällan huruvida metodens antagande är uppfyllda eller ej. Tydligare redovisning av såväl metod som resultat efterfrågas i framtida forskning på området, för att avgöra säkerheten i skattningarna samt underlätta jämförelser mellan studier. För att lyckas göra goda prognoser av utfallet i svenska riksdagsval bör även andra modeller undersökas. Modeller innehållandes variabler som speglar kvaliteten på välfärden, så som längden på vårdköer eller skolresultat, kan eventuellt vara av intresse att undersöka i Sverige där regeringen traditionellt hållits ansvariga för förändringar i välfärden. Makroekonomiska variablers inverkan på partiers röstandelar försvagas eventuellt även av en stark tradition av politisk tillhörighet. Att finna ett mått på detta och använda som förklarande variabel i framtida modeller kan också vara av intresse. Partiernas röstandelar tycks förklaras i varierande utsträckning av de olika förklarande variablerna. Därför kan det vara meningsfullt att använda olika oberoende variabler för de enskilda partierna vid SUR-estimering och på så vis förbättra precisionen i prognosen över fördelningen av röstandelar i svenska riksdagsval.
36
7 Referenser Tryckta källor: Hosmer, D. W., Lemeshow, S. (2000). Applied Logistic Regression, 2a upplagan, 3144. New York: John Wiley & Sons, Inc. Sharma, S. (1996). Applied Multivariate Techniques, 317-335. New York: John Wiley & Sons, Inc. Simonoff, J. S. (2003). Analyzing Categorical Data, 427-434. New York: SpringerVerlag Timm, N. H. (2002). Applied Multivariate Analysis, 311-349. New York: SpringerVerlag
Artiklar: Abramowitz, A. I. (1988). An improved model for Predicting Presidential Election Outcomes. Political Science and Politics, 21(4), 843-847 Arzheimer, K., Evans, J. (2010) Bread and butter à la française: Multiparty forecast of the French legislative vote (1981-2007). International Journal of Forecasting 26(1), 19-31 Bélanger É., Nadeau R. (2005) Political trust and the vote in multiparty elections: The Canadian case. European Journal of Political Research, 44(1), 121-146 Bingham Powell, G Jr., Whitten, G. D. (1993). A Cross-National Analysis of Economic Voting: Taking Account of the Political Context. American Journal of Political Science, 37(2), 391-414 Brody R., Sigelman L. (1983) Presidential Popularity and Presidential Election: An Update and Extension. Public Opinion Quarterly, 47(3), 325-328 Frey, B. S., Schneider, F. (1978) An Empirical Study of Politico-Economic Interaction in the United States. The Review of Economics and Statistics, 60(2), 174283 Jerôme, B., Jerôme-Speziari, V. (2000) The 1998 French regional elections: why so much political instability?. Electorial Studies, 19(2), 219-236 37
Jordahl, H. (2006) An economic analysis of voting in Sweden. Public Choice 127(34), 251-273 Katz, J. N., King, G. (1999) A Statistical Model for Multiparty Electoral Data. The Americal Political Science Review, 93(1), 15-32 Lewis-Beck, M. S. (2005). Election Forecasting: Principles and Practice. The British Journal of Politics & International Relations, 7(2), 145-164 Lewis-Beck, M. S., Paldam, M. (2000) Economic voting: an introduction. Electoral Studies, 19(2), 113-121 Mueller, J. E. (1970) Presidential Popularity from Truman to Johnson. The Americal Political Science Review, 64(1), 18-34 Mughan, A. (1987). General election forecasting in Britain: A comparison of three simple models. Electorial Studies, 6(3), 195-207 Nannestad, P., Paldam, M. (1994) The VP-function: A survey of the literature on vote and popularity functions after 25 years, Public Choice 79(3-4), 213-245 Tomz, M., Tucker, J. A., Wittenberg, J. (2002) An easy and accurate regression model for multiparty electoral data. Political Analysis, 10(1), 66-83 Zellner, A. (1962) An efficient method of estimating seemingly unrelated regressions and test for aggregation bias. Journal of American statistical Association, 57(298), 348-268 Databaser: Konjunkturinstitutet (2013). Distribuerad av Skalin, J, Statistikansvarig vid Konjunkturinstitutet (Hämtad 2013-11-07) OECD (2013), "OECD Economic Outlook No. 94", OECD Economic Outlook: Statistics and Projections (database). do:10.1787/data-00676-en (Hämtad 2013-11-08) Statistiska Centralbyrån (2013). Arbetskraftsundersökningen (AKU) 1970-1986 Länkade serie, månad. http://www.scb.se/sv_/Hitta-statistik/Statistik-efteramne/Arbetsmarknad/Arbetskraftsundersokningar/Arbetskraftsundersokningarna-
38
AKU/23265/23272/Lankade-data/Lankade-data-fran-1970--till-och-med-1986/ (Hämtad 2013-11-05) Statistiska Centralbyrån (2013). Arbetskraftsundersökningen (AKU) 1987-2013. Säsongsrensade serier, månad, 16-64 år. http://www.scb.se/sv_/Hittastatistik/Statistik-efteramne/Arbetsmarknad/Arbetskraftsundersokningar/ArbetskraftsundersokningarnaAKU/23265/23272/Sasongsrensade-data/Sasongsrensade-serier/ (Hämtad 2013-1105) Statistiska Centralbyrån (2013). Riksdagsval – valresultat efter region och parti mm. Antal och andelar. Valår 1973-2010. http://www.scb.se/sv_/Hittastatistik/Statistikdatabasen/Variabelvaljare/?px_tableid=ssd_extern:ME0104T3&rxid =cfc12044-9d13-4ead-9731-c134bdd48b17 (Hämtad 2013-12-04) Statistiska Centralbyrån (2013). Partisympatiundersökningen (PSU) http://www.scb.se/ME0201/ (Hämtad 2013-11-05) TNS-SIFO (2013). Väljarbarometern november 2013. http://tnssifo.se/media/482440/vb_nov_2013_svd.pdf (Hämtad 2013-12-07) Valmyndigheten. (2011) Tidigare val – 2006 allmänna val – valresultat - slutligt resultat 2006. http://www.val.se/tidigare_val/val2006/valresultat/index.html (Hämtad 2013-11-27) Valmyndigheten (2010). Valresultat 2010 års val – Det slutgiltiga resultatet. http://www.val.se/val/val2010/slutresultat/R/rike/index.html (Hämtad 2013-12-04) Övriga: Moon, R. H., Perron B. (2006) Seemingly unrelated regressions. The New Palgrave Dictionary
of
Economics.
http://mapageweb.umontreal.ca/perrob/palgrave.pdf
(Hämtad 2013-12-17) Starkweather, J., Kay Moske, A. (2011). Multinominal Logistic Regression. http://www.unt.edu/rss/class/Jon/Benchmarks/MLR_JDS_Aug2011.pdf (Hämtad 2013-11-29) Valmyndigheten. (2012). Historik. http://www.val.se/det_svenska_valsystemet/allmant_om_val/historik/ (Hämtad 201311-20) 39
8 Appendix Figur 8.1 Pearsons korrelationskoefficienter för de förklarande variablerna
Figur 8.2 Spearmans korrelationskoefficienter för de förklarande variablerna
40
Figur 8.3 Multivariat normalitetstest för valet 2014
41
Tabell 8.1 BIC-värden för estimering av riksdagsvalen 2010 och 2014 för respektive parti BIC
2014
BIC
Moderaterna: Fixa effekter Modell 1 Modell 2 Modell 3
1272,5 750 1273,2 957,7
Moderaterna: Fixa effekter Modell 1 Modell 2 Modell 3
2085,7 1670,2 1414 1321
Kristdemokraterna: Fixa effekter Modell 1 Modell 2 Modell 3
6312,2 5546,9 5570,9 3493
Kristdemokraterna: Fixa effekter Modell 1 Modell 2 Modell 3
6657,4 5965,8 5885,3 4234,5
Folkpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4004,3 2211,1 3953,9 3920,3
Folkpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4068,9 2076,2 3996,5 3942,5
Centerpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
3784,2 2507 2386.3 348,1
Centerpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4062,7 2538,4 2540,8 1585,6
Socialdemokraterna: Fixa effekter Modell 1 Modell 2 Modell 3
-1407,2 -1661,7 -1927,3 -26131
Socialdemokraterna: Fixa effekter Modell 1 Modell 2 Modell 3
-721,7 -1211 -1208,4 -830,2
Miljöpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4548,2 2833,6 3031,2 3212,9
Miljöpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4940 2790,7 3022,1 4064,6
Vänsterpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4261,1 2679,7 3020,7 1061,7
Vänsterpartiet: Fixa effekter Modell 1 Modell 2 Modell 3
4368 3226,5 3307,9 936,2
9366,1 9277,9 9245,1 8170,5
Sverigedemokraterna & övriga: Fixa effekter Modell 1 Modell 2 Modell 3
10408,3 10165,3 10007,3 9327,8
Sverigedemokraterna & Övriga: Fixa effekter Modell 1 Modell 2 Modell 3
42
Tabell 8.2 Standardfel för parameterskattningar i Modell 1 2010 M
FP
C
KD
MP
S
V
SDOvr
Intercept
0,069719
0,99918
0,10747
0,22723
0,116474
0,038492
0,11214
0,569602
Arb12
0,001429
0,002048
0,002202
0,004657
0,002387
0,000789
0,002298
0,011673
I12
0,001003
0,001438
0,001546
0,00327
0,001676
0,000554
0,001614
0,008196
Tabell 8.3 Standardfel för parameterskattningar i Modell 2 2010 M
FP
C
KD
MP
S
V
SDOvr
Intercept
0,078309
0,151555
0,103202
0,225703
0,120745
0,035601
0,120431
0,557905
T12
0,216375
0,418759
0,285157
0,623637
0,333628
0,098368
0,33276
1,541537
I12
0,001175
0,002273
0,001548
0,003385
0,001811
0,000534
0,001806
0,008368
Tabell 8.4 Standardfel för parameterskattningar i Modell 3 2010 M
FP
C
KD
MP
S
V
SDOvr
0,079729
0,165392
0,068612
0,148872
0,138948
0,032941
0,081797
0,471152
0,18566
0,385139
0,159773
0,34667
0,32356
0,076708
0,190476
1,097146
Trottnad
0,008973
0,018614
0,007722
0,016754
0,015638
0,003707
0,009206
0,053025
Popreg
0,000819
0,001699
0,000705
0,001529
0,001427
0,000338
0,00084
0,00484
Intercept T12
Tabell 8.5 Standardfel för parameterskattningar i Modell 1 2014
Intercept Arb12 I12
M
FP
C
0,081817
0,089299
0,098652
0,00179
0,001953
0,001162
0,001269
KD
MP
S
V
SDOvr
0,20684
0,§04§65
0,044045
0,114422
0,510473
0,002158
0,004525
0,002279
0,000964
0,002503
0,011167
0,001402
0,002939
0,00148
0,000626
0,001626
0,007252
SDOvr
Tabell 8.6 Standardfel för parameterskattningar i Modell 2 2014 M
FP
C
KD
MP
S
V
Intercept
0,076083
0,132741
0,096995
0,199431
0,107598
0,043235
0,114434
0,48485
T12
0,135577
0,236539
0,172842
0,355378
0,001368
0,077043
0,001455
0,863984
I12
0,000968
0,001688
0,001233
0,002536
0,191736
0,00055
0,203916
0,006166
43
Tabell 8.7 Standardfel för parameterskattningar i Modell 3 2014 M
FP
C
KD
MP
S
V
SDOvr
Intercept
0,083158
0,146307
0,088037
0,155809
0,150208
0,052306
0,076539
0,466999
T12
0,163978
0,288503
0,173599
0,30724
0,296195
0,103141
0,150928
0,920876
Trottnad
0,009892
0,017403
0,010472
0,018533
0,017867
0,006222
0,009104
0,055549
Popreg
0,000873
0,001535
0,000924
0,001635
0,001576
0,000549
0,000803
0,0049
44