Forskningsprocessen Fredrik Brunes Avdelningen för Bygg‐ och Fastighetsekonomi Fastigheter och Byggande 2014‐09‐17 TRITA ‐ FOB ‐ Rapport 2014:6 ISBN 978‐91‐85783‐42‐7
1
Innehåll 1. Vad är forskning? ................................................................................................................ 3 2. Vetenskapliga metoder för argumenten (Evidens) ............................................................. 5 2.1 Deduktion, dvs. slutledning .............................................................................................. 5 2.2 Hypotetisk-deduktiva metoden ........................................................................................ 6 3. Argument och krav på dessa ............................................................................................... 7 3.1 Krav 1. Korrekta begrepp och mätning (Construct Validity)........................................... 7 3.2 Krav 2. Belägg för kausalitet (Intern validitet) – finns orsakssamband? ......................... 9 3.3 Krav 3. Empirisk generaliserbarhet – hur väl beskriver urvalet populationen? ............. 12 3.4 Argument för värderande frågor .................................................................................... 13 4. Vetenskaplig metod: Induktion del 1, grundläggande val. ............................................... 16 4.1 Undersökningsupplägget ................................................................................................ 16 4.2 Urval ............................................................................................................................... 17 4.3 Datainsamlingsstrategi ................................................................................................... 17 4.4 Analysen av data ............................................................................................................ 25 5. Analys av förklarande fråga med både extensiv och intensiv studie. ............................... 32 5.1 Kontrafaktisk skillnad med extensiv studie ................................................................... 32 5.2 Isolering med extensiv studie ......................................................................................... 34 5.3 Kausal generaliserbarhet ................................................................................................ 35 5.4 Orsaksmekanism och Tidsordningen med intensiv studie ............................................. 36 6. Svaren (Inferensen) och osäkerheten ................................................................................ 41 6.1 Problem med induktion .................................................................................................. 41 6.2 Problem med deduktion ................................................................................................. 42 7. Bidraget ............................................................................................................................. 44 References ................................................................................................................................ 47
2
1. Vad är forskning? Den här rapporten har till syfte att kortfattat beskriva forskningsprocessen. Ska man uttrycka sig lite extremt och enkelt så är forskning egentligen ”bara” att komma på en fråga man vill ha besvarad, se figur 1.1.
?
!
Figur 1.1. Forskning, hur svårt kan det vara? Sedan kan arbetet från frågetecken till utropstecken vara mer eller mindre problematiskt. Jag ska här beskriva forskningsarbetet som ett linjärt arbete från ax till limpa enligt figur 1.2. Vilket absolut inte är hela sanningen eftersom arbetet många gånger måste tas om och tidigare skeden måste ändras för att arbetet ska kunna slutföras på ett så bra sätt som möjligt. Men, det är ett bra sätt att förklara forskning.
Forsknings‐ frågan
Argument
Svaren
Osäkerheten
Bidraget
Figur 1.2. De centrala delarna i forskningen. Det första en forskare måste göra är att komma på en intressant forskningsfråga. Vad intresserar dig som forskare, vad intresserar samhället eller snarare vilka problem vill samhället ha lösta? Hur långt har man kommit i att besvara en tidigare fråga? Var kan jag i så fall ta vid och fortsätta studien? Om vi anser att vår fråga uppfyller dessa krav blir nästa uppgift att fundera på vilken typ av fråga det handlar om. Här brukar man skilja på beskrivande, förklarande eller värderande frågor, se tabell 1.1. Beskrivande Vad? Hur? Förklarande Vad påverkar? Varför? Värderande Hur borde det vara? Tabell 1.1. Typer av frågor som en forskare kan ägna sig åt. Beskrivande frågor försöker beskriva ett tillstånd. Det kan vara: Hur stort är fastighetsbeståndet i Kalmar? Hur stor del av svenska folket bor i villa? Hur lång tid tar en fastighetsaffär? Förklarande frågor försöker förklara varför eller hur ett tillstånd har uppstått. Det kan vara: Varför är fastighetsbeståndet i Kalmar 20000 lägenheter? Varför bor 60 % av svenskarna i villa? Varför tar en fastighetsaffär två månader? Värderande frågor försöker förklara vad som vore bäst (normativa). Det kan vara: Vad borde fastighetsbeståndet vara i Kalmar? Hur många av svenskarna borde bo i villa? Och hur lång tid borde en fastighetsaffär ta? Valet av forskningsfråga påverkar senare vilka metoder vi kan använda för att besvara den och vilka argument vi har på uppkomna svar, mer om det senare. Det är inte ovanligt att man i 3
forskningsarbetet försöker besvara samtliga typer av frågeställningar. Svårigheten med att hitta en bra fråga är att man oftast måste ha hög kunskap inom det ämne man ska skriva. Det erhålls genom utbildning och praktisk kunskap. När väl forskningsfrågan är formulerad gäller det att finna belägg för ett svar, dvs. ha gott om argument. Om vi påstår att de stigande bostadsrättspriserna i Stockholm beror på en stor inflyttning till staden är det viktigt att ha argument för att inflyttning faktiskt sker och att de som flyttar in verkligen är intresserade av att köpa en bostad. Efter det att vi har samlat argument och formulerat ett rimligt svar på frågan, bör ett resonemang om osäkerheten i svaren föras. Det finns alltid en risk att argumenten och slutsatserna är felaktiga. Det sista steget i forskningens ”från‐ax‐till‐limpa” är i vilken omfattning det finns någon samhällsnytta med forskningen. Det kan vara som bidrag till den sammanlagda kunskapsbanken, det s.k. inomvetenskapliga kriteriet. Det kan även vara vilken praktisk användning forskningen har för världen utanför forskningsvärlden, det s.k. utomvetenskapliga kriteriet. Det var en snabbgenomgång av forskningsprocessen. Vi ska i resten av den här rapporten studera varje moment mer ingående.
4
2. Vetenskapliga metoder för argumenten (Evidens) När forskningsfrågan är bestämd är det dags att samla in argument eller bevis för att kunna formulera ett rimligt svar på forskningsfrågan. Det har genom historien funnits två grundläggande sätt att söka sanningen och det är genom våra sinnen och genom logik. Dessa ansatser kallas induktion och deduktion. Förenklat är deduktion att med logik förbättra en teori och sedan med data testa teorin medan induktion är att utifrån observationer bygga teori, se figur 2.1. Teori
Induktion
Deduktion
Observationer Figur 2.1. Induktion som teoribyggande och deduktion som teoritestande. En medelväg som används ofta är hypotetisk‐deduktiva metoden. I det här kapitlet behandlar vi deduktion och hypotetiska‐deduktiva metoden, i kapitel fem och sex behandlas induktion. Jag vill poängtera att dessa tre metoder oftast används samtidigt för att få klarhet i frågeställningar.
2.1 Deduktion, dvs. slutledning Deduktion är att argumentera genom logisk slutledning utifrån ett antal uppställda antaganden om individers och företags egenskaper. Deduktion inom nationalekonomin inkluderar en mängd antaganden bl.a. att individer alltid nyttomaximerar, dvs individer väljer det bästa alternativet, alltid vet om ett alternativ är bättre, sämre eller lika bra som ett annat alternativ. På liknande sätt görs antagandet att företag vinstmaximerar, dvs vill tjäna så mycket pengar som möjligt. Det finns ytterligare antaganden som jag inte går igenom i den här texten. För att visa på härledning med deduktion kan de ovanstående nationalekonomiska antaganden följande slutsats dras: Om inkomster stiger kommer fler bostäder att byggas. Med den deduktiva slutsatsförmågan kan vi ställa upp orsakssamband enligt figur 2.2. Inkomster stiger
Individ söker större lägenhet.
Väljer nyproducerade
Produktionen stiger
Nyttomaximer Kan välja Vinstmaximera Figur 2.2. Antaganden om individer och företag göra att man kan förvänta sig ett visst skeende på marknaden. Här visas att när inkomster för individer stiger kommer individer att söka sig till större lägenheter för att maximera sin nytta. Om de föredrar nya lägenheter framför gamla lägenheter kommer de att välja en nyproducerad lägenhet. Företagen på marknaden kommer att märka det ökade intresset för nya lägenheter och för att vinstmaximera väljer dem att öka sin produktion. Vi förutsätter att försäljningspriset på lägenheter överstiger kostnaden för att bygga, annars hade byggföretagen inte velat bygga.
5
Det bör tilläggas att individer inte är robotar och att allt därmed är på förhand bestämt vilket innebär att så fort inkomster stiger kommer produktionen att stiga. Vi bör istället ha ett probalistiskt synsätt. När inkomster stiger är det mycket stor sannolikhet att produktionen också stiger. Ett problem med deduktiva härledningen är att antaganden kan vara felaktiga. Ett antagande nationalekonomin gör är att individer med lika stor förmögenhet har samma nytta (lycka). Om Kalle och Lisa har fem miljoner kronor var är de då lika lyckliga idag om Kalle igår hade en miljon medan Lisa hade nio miljoner kronor. Ett annat problem med deduktion uppstår om faktorer som kan vara av betydelse exkluderas eller faktorer inkluderas som är av ringa betydelse. Anta att vi försöker bedöma företags lokaliseringsval, men vi antar inte att företagen tar hänsyn till var konkurrerande företag är lokaliserade. Då kommer analysen att bli delvis fel.
2.2 Hypotetisk‐deduktiva metoden Den hypotetisk deduktiva metoden som gärna används vid studier av enstaka fall har följande upplägg. Det handlar om att ställa en hypotes, ett påstående. Om hypotesen stämmer borde ett antal konsekvenser uppstå. Om dessa konsekvenser inte uppstår är det rimligt att påstå att hypotesen är felaktig, se figur 2.3.
HYPOTES
Förenklad planprocess ökar byggandet
Konsekvenser av Tes
Stor mängd av nya bygglovsansökningar
Data om
Hur många bygglovsansökningar
konsekvenserna
finns i projektet
Tes falsifieras, stämmer inte
Få bygglovsansökningar
Figur 2.3. Ett exempel på den hypotetiska‐deduktiva metoden.
Om vi antar följande hypotes: en förenkling av planprocessen, dvs. om det är lättare för byggföretag att få tillstånd att bygga, så borde det byggas mer. Då bör konsekvensen vara att fler bygglovsansökningar görs. Om det är en rimlig konsekvens, bör insamling av data på hur många bygglovsansökningar som de facto har gjorts efter att planprocessen förenklats. Om det visar sig att antalet nya bygglovsansökningar inte har ökat, bör hypotesen avfärdas. Den hypotetisk‐deduktiva metoden har liknande problem som den induktiva metoden. Vi kommer därför i nästa kapitel att behandla den induktiva metodens uppbyggnad samt dess styrkor och svagheter, vilket i sin tur kan användas på den hypotetisk‐deduktiva metoden.
6
3. Argument och krav på dessa Anta att vi har bestämt forskningsfrågan och bestämt vilken vetenskaplig metod som ska användas. Då är det dags att samla in argument eller bevis för att kunna formulera ett rimligt svar på forskningsfrågan. Men innan det görs måste det bestämmas vilka krav som ska ställas på argumenten, så att rätt typ av argument insamlas. I det här kapitlet ska vi studera vilka krav som ställs på argument vid en beskrivande, förklarande och värderande frågor. Kraven kan sammanfattas i tre olika delar: korrekta begrepp och mätning (Construct validitet), belägg för kausalitet (intern validitet) och möjlighet till empirisk generalisering (extern validitet). Vi behandlar dessa tre krav nedan.
3.1 Krav 1. Korrekta begrepp och mätning (Construct Validity) Anta att vi arbetar med en beskrivande forskningsfråga. Problemet med beskrivningar av ett tillstånd är att de kan vara hur omfattande som helst. Om jag t.ex. ska beskriva marknaden för bostadsrätter i Stockholm, skulle jag kunna börja med att beskriva att det finns en mängd hus där flerbostadshus är upplåtna med bostadsrätt. Många bostadsrätter ligger vid parker som har gott om utrymme för lekande barn. Vid bostadsrätterna finns oftast ett daghem etc. Jag skulle kunna hålla på i evighet att beskriva varenda detalj av marknaden för bostadsrätter. Av den anledningen måste förenkling ske genom informationsminskning. Men hur gör vi för att förenkla? Det kan göras med tre steg, nämligen genom att definiera begrepp, operationalisera och mäta. 3.1.1 Definiera begrepp Definiera begrepp innebär att det fenomen som observeras samlas under ett passande begrepp. Anta att det i ett område genomförs ett antal bostadsaffärer till ett pris av cirka tre miljoner kronor. Vad som dessutom noteras är att det finns två typer av aktörer, dels de som säljer sitt hus och dels de som köper. Vi förenklar genom att kalla alla de som har råd och är villiga att köpa ett hus för efterfrågan och ingen skillnad görs om de söker ett mindre eller större hus, om de gillar enplans‐ eller flerplanshus, om de gillar tegel‐ eller trähus. På liknande sätt görs en förenkling om alla hus som är till salu, de kallas för utbud. Vi förenklar genom att enbart inkludera hus som är av stadigvarande bruk avsedda för boende. Det innebär att bl.a. sommarhus, industrihus, kontorshus mm exkluderas. Slutligen görs även en förenkling av själva försäljningen. Alla överlåtelser av hus från köpare till säljare kallas för transaktion. Vi har nu, utifrån fenomenet att hus byter ägare i en stad, förenklat detta förlopp med tre begrepp och nästa steg är att definiera dessa tre begrepp. Det kan göras genom att varje begrepp ges ett antal egenskaper, se tabell 3.1.
7
Begrepp Utbud
Definition genom egenskaper ‐ Hus för stadigvarande bruk ‐ Hus som uppfyller statens krav. Efterfrågan ‐ Villiga köpare av hus. ‐ Som har råd. Transaktion ‐ En överföring av ägande från säljare till köpare. ‐ Ska ske på en marknad där alla som vill får lägga ett bud, ej reglerad. ‐ Ej köp mellan kompisar eller släkt som genererar en rabatt. ‐ Tillräcklig marknadsföringstid så att alla som är intresserade har möjlighet att lägga ett bud. Tabell 3.1. Begrepp och dess egenskaper.
Operationaliseras Antal (styck) Antal (styck) Antal (styck) Pris (kr)
Här har jag, i den andra kolumnen, definierat vad som menas med de tre begreppen utbud, efterfrågan och pris. Definitionen har gjorts genom att räkna upp de egenskaper som ska vara förknippade med begreppet. Till exempel begreppet utbud som vi förknippar med hus för stadigvarande bruk och inte något tillfälligt. Boendet ska dessutom uppfylla de byggnadstekniska krav staten har för byggnader som används för boende, det kan vara tillgång till kök, badrum, förråd mm. 3.1.2 Operationalisera Nu har vi definierat olika begrepp och nästa steg i förenklingsprocessen, är att fundera i vilka enheter begreppen ska mätas, se tabell 4.1. Det är oftast relativt enkelt i fastighetsbranschen där ”hårda” värden som lägenheters storlek eller gjorda affärer mäts i kvadratmeter respektive kronor. I andra sammanhang, som t.ex. faktorn ”läget” kan det vara svårare att göra om till mätbara enheter. I vårt fall har samtliga begrepp intervallskala eftersom det går att mäta utbud i antal hus som är till salu. Vad gäller efterfrågan mäts det i antalet personer som är villiga att köpa hus. Och till sist begreppet transaktion som kan mätas både i hur många försäljningar som sker och hur höga priser husen säljs för. Men om ingen lämplig enhet finns måste enheter eller i alla fall skalnivåer skapas. Det finns tre sorters skalnivåer. Den första är den nominala skalnivån vilket innebär att begreppet enbart kan delas in i olika kategorier, hus kan t.ex. delas in i vilket material stommen är uppförd i, det finns hus med trä‐, tegel‐ och betongstomme, se tabell 3.2. Stomme Trä Tegel Betong
Nominal skalnivå XXX XX X
Ordinal skalnivå 2 3 1
Intervallskala 2 1 5
Tabell 3.2. Tre olika skalnivåer. Här visar kryssen i tabellen ”Nominal skalnivå” antalet hus med trä, tegel eller betongstomme. Den andra skalnivån är den ordinala som förutom den nominala skalan delar in husen i olika kategorier även rangordnar de olika kategorierna. I tabell 4.2 har rangordning gjorts där hus med betongstomme anses bättre än trästomme som i sin tur anses bättre än tegelstomme. Vad vi däremot inte kan säga med den rangordningen är hur mycket bättre ett hus med betongstomme är 8
än ett hus med tegelstomme. Den tredje skalnivån är intervallskala. Då betygsätts olika typer av hus och betyget visar hur mycket bättre något är; betyg två för trästomme och betyg ett för tegelstomme innebär att trästommen är dubbelt så bra. 3.1.3 Mäta Nu när vi har bestämt hur begreppen ska operationalisera behövs ett verktyg för att kunna mäta. Här ställs två krav på ett sådant mätverktyg; det ska ha både hög validitet och reliabilitet. Med det menas låga systematiska och slumpmässiga fel. Jag ska förklara med ett exempel, se tabell 3.3. Mätinstrument
Faktiskt temp. Mätinstr. 1 Mätinstr. 2 Mätinstr. 3
Temp Temp Temp Temp Genom‐ snittlig temp 100 100 100 100 100 80 120 90 110 100 81 79 80 80 80 100 100 100 100 100
Validitet Reliabilitet
‐ Hög Låg Hög
‐ Låg Hög Hög
Tabell 3.3. Faktisk temperatur på det kokande vattnet och tre olika mätinstrument. Här finns tre stycken mätinstrument för att mäta temperaturen på kokande vatten. Som vi alla vet kokar vatten vid 100 grader vilket alltså är det korrekta värdet. Mätinstrument 1 visar ett väldigt skiftande mätresultat på de fyra olika mätningarna. Men det genomsnittliga värdet på 100 grader är korrekt. Det innebär att mätinstrumentet inte har något systematiskt mätfel, dvs. mätinstrumentet har hög validitet. Däremot skiftar mätningarna mycket, dvs. det slumpmässiga mätfelet är stort, vilket innebär att mätinstrumentet har låg reliabilitet. Mätinstrument 2 har en stabil serie runt 80 grader. Eftersom vi vet att rätt temperatur är 100 grader har mätinstrumentet ett högt systematiskt mätfel (låg validitet); den uppmätta temperaturen är hela tiden för låg jämfört med korrekt värde. Mätinstrumentet har däremot hög reliabilitet eftersom det slumpmässiga mätfelet är lågt, värden ligger klistrade runt 80 grader. Till sist mätinstrument 3 som mäter korrekt vid samtliga fyra mätningar och har därmed hög validitet (inget systematiskt mätfel) och hög reliabilitet (inget slumpmässigt mätfel).
3.2 Krav 2. Belägg för kausalitet (Intern validitet) – finns orsakssamband? Belägg för kausalitet (orsakssamband) är av vikt vid förklarande frågor. Hur vet vi att det finns orsakssamband mellan två faktorer? Svaret är att det kan man aldrig med säkerhet veta, men vi kan ha ett antal argument för att orsakssamband finns. En bra beskrivning på argument för kausalitet har Teorell och Svenssons i sin bok ”Att fråga och att svara”. Orsakssamband kan definieras utifrån fyra kriterier. Låt oss säga att vi antar att x påverkar y. Det kan vara att efterfrågan påverkar prisnivån. För att kunna argumentera för det påståendet är det viktigt att det mellan efterfrågan och pris råder kontrafaktisk skillnad, isolering, tidsordning och orsaksmekanismer, se figur 3.2 Vi ska nedan gå igenom dessa krav.
Kontrafaktisk skillnad Isolering Tidsordning Orsaksmekanismer
Figur 3.2. Fyra argument för att orsakssamband finns. 9
3.2.1 Kontrafaktisk skillnad Kontrafaktisk skillnad, innebär att om x inträffar så inträffar även y och om x inte inträffar så kommer y inte heller att inträffa, se tabell 3.4. Efterfrågeförändring Inträffar Inträffar inte Inträffar Inträffar inte
Prisförändring Inträffar Inträffar inte Inträffar inte Inträffar
Samband Kontrafaktisk skillnad Inte kontrafaktisk skillnad
Tabell 3.4. Kontrafaktisk skillnad vilket innebär att efterfrågeförändring styr prisförändring. Här visas på rad två och tre att om efterfrågan stiger så ska prisnivåerna också stiga. Och om efterfrågan inte stiger ska inte heller prisnivåerna stiga. Om så sker har vi belägg för kontrafaktisk skillnad. På rad fyra och fem visas när kontrafaktisk skillnad inte kan beläggas, här stiger efterfrågan men inte priset och vise versa. 3.2.2 Isolering Nästa kriterium för orsakssamband är isolering, dvs. vi ska vara säkra på att det verkligen är x som påverkar y och inget annat. Risken är annars att någon annan faktor, z, påverkar både x och y, och sambandet är istället spuriöst, dvs. det tycks finnas ett samband men det sambandet är falskt. Vi ska se på ett exempel: anta att vi mäter ett barns ålder, vikt och kunskapsnivå, se tabell 3.5. Kunskapsnivå 10 20 30
Vikt 4 8 12
Ålder 1 2 3
Tabell 3.5. Data om kunskapsnivå, vikt och ålder. Finns det något orsakssamband dem emellan? Här visas finns en tydlig korrelation mellan vikten och kunskapsnivån, dvs. ju högre vikt desto högre kunskapsnivå. Är det då verkligen vikten som påverkar barnens kunskapsnivå? Nej, det är snarare så att den bakomliggande faktorn är att barnen blir äldre och därmed blir både större och mer kunniga. Det är alltså åldern som avgör både kunskapsnivån och vikten och det finns följaktligen inget orsakssamband mellan vikt och kunskap utan enbart en korrelation, se figur 3.3.
Vikt
Kunskap
Ålder
Figur 3.3. Kausaldiagram för vikt, kunskap och ålder. 3.2.3 Tidsordningen Det tredje argumentet för orsakssamband är tidsordningen. Här är det viktigt att x i tid kommer före y och att det inte är tvärtom. I vårt fall är det av intresse att se att efterfrågeförändring faktiskt kommer före prisförändring, se figur 3.4. 10
Efterfrågan och Pris
Efterfrågan
Pris
Figur 3.4. Tidsordningen viktig för att utreda kausalitet.
Tid
Här visas hur efterfrågan och pris ändras över tid och vi ser framförallt hur ändringar i efterfrågan tidsmässigt kommer före prisförändringar, vilket tyder på en koppling i tid. Om det vore tvärtom så gäller inte argumentet om tidsordning mellan efterfrågan och pris. 3.2.4 Orsaksmekanismer Det fjärde argumentet som bör uppfyllas för att det ska finnas ett orsakssamband är orsaksmekanismer. Det innebär att ju mer vi vet om hur x påverkar y desto bättre går det att argumentera för att orsakssamband finns, se figur 3.5.
Pris på bostadsrätter stiger.
Efterfrågan stiger Efterfrågan stiger
Fler personer går på visningar
Fler personer deltar i budgivningen
Pris på bostadsrätter stiger.
Figur 3.5. Överst visas orsak och verkan utan några orsaksmekanismer. Nedan visas även mellanliggande orsaksmekanismer. Här visas överst att när efterfrågan stiger så stiger även priset. Men för att kunna argumentera för ett samband bör mellanliggande händelser som sammanbinder dessa förändringar redovisas. Här ser vi att när efterfrågan stiger, dvs. fler människor än tidigare är villiga att köpa hus kommer man i högre grad gå på visningar. Det innebär att ännu fler kommer att delta i budgivningen än tidigare. Med fler personer i budgivningen än tidigare kommer det slutgiltiga priset att bli högre än tidigare. Prisnivån på bostadrätter stiger. Och vid utredande av orsaksmekanismerna ser vi de mellanliggande stegen. Låt oss sammanfatta de fyra kraven på argumenten för orsakssamband. I exemplet med efterfrågeförändring och prisförändring är det viktigt att studera om prisförändringar har skett utan att efterfrågeförändring skett (kontrafaktisk skillnad). Det är dessutom intressant att se om något annat påverkar båda variablerna vilket gör att sambandet mellan pris och efterfrågan kanske är falskt (isolering). Om vi har data på efterfråganförändringar och prisförändringar, är vi intresserade att se om efterfrågeförändring i tid kommer före prisförändring. Till sist för att kunna förstå hela kedjan av händelser är det intressant att studera vilka mellanliggande steg som gör att efterfrågeförändring påverkar prisförändring. 11
3.3 Krav 3. Empirisk generaliserbarhet – hur väl beskriver urvalet populationen? Många gånger är forskningsfrågan uttryckt att man vill säga något om en hel population och man vill gärna göra det genom att undersöka populationen. Men många gånger är populationen så pass stor att man får nöja sig med att undersöka en mindre del av populationen. I sådana fall är det viktigt att urvalet på bästa sätt representerar populationen vilket kallas empirisk generaliserbarhet. Vi skiljer mellan deskriptiv och kausal generalisering. I det avsnittet ska vi först studera deskriptiv generalisering och sedan kausal generalisering. 3.3.1 Deskriptiv generalisering Med deskriptiv generalisering avses beskrivande frågor. Anta att vi ska bedöma marknadsvärdet för fastigheter i Norra Ängby. För att ta reda på det finner vi data i både Södra och Norra Ängby. Norra och Södra Ängby är relativt olika varandra där Södra Ängby består av tegelhus med närhet till Mälaren och Norra Ängby består av trähus med längre avstånd till Mälaren, se figur 3.6.
Vällingby
Norra Ängby
Södra Ängby
Jämförelse‐ objekt Babben 1 Oredarn 2 Betner 3 Gervais 12 Don Rickles Pryor 1 Nilsen 12 Malmberg 4 Andersson 2 Lindstedt 3 Brunes 1 Brunes 2
Område
Pris
Södra Ängby Södra Ängby Södra Ängby Södra Ängby Södra Ängby Södra Ängby Södra Ängby Södra Ängby Södra Ängby Södra Ängby Norra Ängby Norra Ängby
8 900 000 9 000 000 8 900 000 8 900 000 9 100 000 9 150 000 9 150 000 9 000 000 9 000 000 8 900 000 4 000 000 6 000 000
Figur 3.6. Karta med Norra och Södra Ängby samt tabell 3.5 med genomförda affärer. Här visas 12 jämförelseobjekt, 10 som sålts i Södra Ängby och två i Norra Ängby. Anta att marknadsvärdet för en fastighet är fem miljoner kronor i Norra Ängby och anta att vi använder urvalet i Södra Ängby för att bedöma marknadsvärdet. Vi kommer då att hamna på en bedömning på cirka nio miljoner kronor. Men eftersom dessa jämförelseobjekt (=urvalet) har låg representativitet för en fastighet i Norra Ängby kommer bedömningen på nio miljoner kronor att ha ett högt systematiskt urvalsfel. Om vi däremot använder de två jämförelseobjekten (=urvalet) i Norra Ängby kommer vi att bedöma marknadsvärdet till någonstans mellan mellan fyra och sex miljoner kronor, vilket ger en hög representativitet men låg precision, dvs. höga osystematiska urvalsfel. 3.3.2 Kausal generalisering Med kausal generalisering avses förklarande frågor. Vi vill utifrån ett urval säga något om varför ett visst tillstånd uppstått i populationen. I fallet med medelpriset i Norra Ängby kanske vi har argument för att boytan påverkar medelvärdet, dvs.de fyra kraven på kausalitet är uppfyllda (kontrafaktisk skillnad, isolering, tidsordning och orsaksmekanism). Men vi önskar också att detta kan generaliseras 12
till andra marknader. Om boytan även påverkar priset på andra marknader, är den kausala generaliserbarheten. Mer om kausal generaliserbarhet i kapitel sex. Även vid kausal generaliserbarhet kan problem med systematiskt fel (bristande representativitet) och osystematiska fel (bristande skattningsprecision) uppstå. Låt oss sammanfatta. Vi har ovan gått igenom vilka krav vi har på argumenten. Det är korrekta begrepp och rätt mätning. Det är kausalitet, att vi har funnit orsakssamband. Det är empirisk generaliserbarhet, att vi kan dra generella slutsatser om en population utifrån ett urval.
3.4 Argument för värderande frågor Vi ska avsluta det här kapitlet med att studera värderande frågor. Med värderande frågor försöker vi ta reda på hur det borde vara eller vad som borde göras. Problemet med värderande frågor är att det omöjligen går att säkerställa vad som är rätt eller fel. Vilket av ”Man borde bygga fler bostadsrätter i Stockholm” eller ”Man borde bygga fler villor i Stockholm” som är mest korrekt är svårt att bestämma. Vad som borde göras måste ses ur ett perspektiv vilka mål vi har i samhället och hur situationen är idag. Ur den aspekten så är de beskrivande och förklarande frågorna en del av den värderande frågan. Utifrån beskrivningen får vi en uppfattning om hur situationen är idag och utifrån förklarande frågor får vi vetskap om varför situationen har uppstått. Om vi då dessutom vet vartåt vi vill, kan vi använda de orsaksförklaringar vi fått fram för att peka på vad vi tycker borde göras för att nå vårt mål. Anta att det på en marknad i genomsnitt bor fem personer per lägenhet (beskrivande). Anta att förklaringen till den trångboddheten är att för lite mark upplåts av staden för byggande av bostäder. Det kan förstås finnas flera bidragande orsaker men anta att detta är den viktigaste orsaken för samhället. Då blir svaret på den värderande frågan att vad som borde göras är att upplåta mer mark. Ett ytterligare problem med värderande frågor är att det kan vara svårt att avgöra vilket mål som är viktigast. Anta att samhället har att välja mellan att bygga en väg i Stockholm eller i Piteå. Med ett samhällsekonomiskt mål ska vägen byggas där nyttan minus kostnaden ger högst överskott. Då kommer vägen att byggas i Stockholm. Men anta istället att staten har ett fördelningsmål där man gärna vill förbättra för invånarna i Piteå oavsett om kostnaderna för Staten överstiger nyttan för Piteborna. Då ska vägen byggas i Piteå. 3.4.1 Argumentationsanalys Argumentationsanalys är ett praktiskt verktyg som kan användas för att bedöma värderande frågor. Den utgår från ett påstående, en tes: ”Sverige bör ha högre invandring”, ”Alla i Hälsingland borde få resebidrag” etc. För att bedöma tesens styrka försöker man hitta argument för och emot tesen. Dessa argument har olika styrka beroende på två faktorer, argumentens hållbarhet och relevans. Hållbarheten beror på hur rimligt det är att acceptera ett argument. Relevansen beror på relationen mellan argumentet och tesen som ska bevisas. Om argumentet har hög relevans för tesen är det svårt att avfärda tesen om argumentet har hög hållbarhet. Anta att tesen är: ”Jorden är rund”, då finns ett antal argument för och emot det argumentet, se tabell 3.5.
13
Argument
Hållbarhet
Relevans
Styrka
Det finns fotografier från satelliter som visar att Jorden är rund.
Hög
Hög
Hög
Vikingarna trodde att Jorden var platt.
Hög
Låg
Låg
Geodetiska forskare Låg påstår att Jorden är platt.
Hög
Låg
Fredrik Brunes anser att Jorden är platt.
Låg
Låg
Låg
Tabell 3.5. Styrkan hos argument beror på hållbarheten och relevansen. Det första argumentet har hög hållbarhet, det är högst troligt att det finns fotografier som faktiskt visar att Jorden är rund. Argumentet har också hög relevans vilket innebär att om vi accepterar argumentet så ökar det styrkan hos tesen. Det andra argumentet har antagligen hög hållbarhet; Vikingarna trodde verkligen att jorden var platt. Relevansen är dock mycket låg. Argumentet stärker inte tesen eftersom Vikingarna var okunniga när det gäller forskning generellt och antagligen vad gäller planetsystemet i synnerhet. Sålunda har argumentet låg styrka. Det tredje argumentet har låg hållbarhet, det är inte sant att geodetiska forskare anser att Jorden är platt. Argumentet har hög relevans eftersom geodetiska forskare är experter på jorden, det är deras forskningsämne. Men på grund av den låga hållbarheten hos argumentet har argumentet låg styrka. Det fjärde påståendet har låg hållbarhet. Ärligt talat så tror jag inte att jorden är rund. Argumentet har också låg relevans eftersom jag är en ”nolla” eller i alla fall inte en auktoritet i ämnet. Påståendet har med andra ord mycket låg styrka. 3.4.2 Beskrivning av argumenten Vad jag har gjort hittills är att värdera argumenten. Men innan vi når det stadiet måste vi identifiera alla argument, det görs i den deskriptiva delen av argumentationsanalys, se tabell 3.6.
14
Verktyg
Förkortning
Beskrivning
Exempel
Tes
T
Ett påstående som inte stöder något annat påstående men däremot stöds av en mängd andra påståenden.
Jorden är rund.
Pro argument
Ett påstående som stödjer ett annat argument eller tesen.
Det finns fotografier från satelliter som visar att Jorden är rund.
Kontra argument
Ett påstående som motsäger ett annat argument eller tesen.
Vikingarna ansåg att jorden var platt.
Premiss
Ett påstående som ökar relevansen hos ett annat påstående eller tesen.
Fotografier visar alltid verkligheten.
Ett påstående som minskar relevansen hos ett annat påstående.
Fotografier kan förvanskas.
Relevans invändning
Table 3.6. Verktygen i en argumentationsanalys
Den deskriptiva delen består av fyra faktorer. Ett argument som stödjer en tes är ett proargument. De kan vara många och är därför indexerade. Ett argument som motsäger en tes är ett kontraargument. De är också många och är därför indexerade. Det kan finnas kedjor av pro‐ och kontraargument. Ett påstående är till exempel ett kontraargument mot det proargument som stödjer ännu ett proargument. Det kan vara lite knepigt att utreda argumentsordningen. Men det är ett bra verktyg att använda för att belysa alla argument för och emot en tes. Två andra definitioner är premiss och relevansinvändning. En premiss är ett argument som ökar relevansen hos ett annat argument som stöd för tesen. Argumentet ökar relevansen hos pro argumentet, , som stöd för tesen. Relevans invändningens syfte är att minska relevansen hos andra är en relevans invändning som minskar relevansen hos premissen pro‐ och kontra argument. . I praktiken börjar man med den deskriptiva fasen och identifierar alla argument. Efter det värderas både pro‐ och kontraargument. Utifrån den subjektiva värderingen görs sedan en bedömning av tesens styrka.
15
4. Vetenskaplig metod: Induktion del 1, grundläggande val. Induktion bygger på datamaterial som systematiskt analyserar för att besvara en forskningsfråga. Vi ska nedan gå igenom de steg som är viktiga att beakta vid en studie med induktion. De fyra stegen är undersökningsupplägget, urval, datainsamling och analys. Jag ska nedan gå igenom dessa steg.
4.1 Undersökningsupplägget Undersökningsupplägget kan översiktligt delas in i experimentella och icke experimentella studier. Experimentella studier bygger på en experimentgrupp som manipuleras och en kontrollgrupp som inte utsätts för manipulation. Anta att en experimentgrupp väljs ett antal städer där hyresregleringen avskaffas samt som kontrollgrupp ett antal städer där hyresregleringen behålls. Efter ett antal år studeras grupperna för att se om det har blivit någon skillnad på fastighetsmarknaden. Eftersom experimentell forskning är relativt ovanlig inom fastighetsekonomi utelämnas en djupare beskrivning av dessa metoder. Istället ska vi ägna stort utrymme åt de icke experimentella metoderna som i sin tur kan delas in i intensiv (fåfalls) och extensiv (flerfalls) studie, se figur 4.1. Figur 4.1. Intensiv studie och extensiv studie Beroende på tillgängliga forskningsresurser och data görs valet. Valet görs också självklart beroende på vilken fråga som ska besvaras. Anta att det är en beskrivande fråga: ”Vad är prisnivån i Göteborg?”. Då är extensiv studie mest naturlig. Om frågan utökas till ”Varför är prisnivån i Göteborg X kr?” kan extensiv studie också användas men även kompletteras med en intensiv studie. Slutsatsen är alltså beroende på frågeställning och tillgängliga data bestäms om en intensiv eller extensiv studie ska göras. Både intensiv‐ och extensiv studie kan göras i olika varianter. En intensiv studie kan vara jämförande där man jämför ett antal fall utifrån ett antal aspekter. Den kan även innebära att man enbart studerar ett fall. Ett exempel på data från en extensiv studie visas i tabell 4.1. År 2008 2009 2010 2011
Hus A Pris 4,8 5,0 5,2 5,1
Boyta 90 90 90 90
Hus B Pris 4,7 4,6 4,4 4,7
Boyta 90 90 90 90
Hus C Pris 5,5 5,5 5,3 5,2
Boyta 120 120 120 120
Hus D Pris 5,3 5,2 5,2 5,3
Boyta 120 120 120 120
Tabell 4.1. Tvärsnittsdata och tidsserie ger tillsammans paneldata. Data kan delas upp i tvärsnittsdata och tidsseriedata. Tvärsnittsdata är data på flera olika analysenheter vid ett specifikt tidstillfälle, i tabellen finns data på prisobservationer och boyta för fyra olika analysenheter år 2008. Men tabellen innehåller även data för flera tidpunkter, här år, vilket kallas för tidsseriedata. För hus A finns data vid fyra olika tidpunkter. I den bästa av världar finns det
16
paneldata, dvs. både tvärsnitts‐ och tidsseriedata. Det innebär att data finns för samtliga fyra hus för samtliga fyra år, dvs. all data i tabell 4.1.
4.2 Urval Nästa frågeställning är vilken strategi som ska användas för att hitta fall. Här finns ett antal strategier, det går att använda sig av alla analysenheter som finns. Anta att hälsan hos svenska folket ska undersökas och för det undersöks alla svenskar, en totalundersökning genomförs. Problemet med den strategin är kostnaden, det kommer att bli väldigt dyrt. Ett bättre alternativ är att göra ett urval och välja ett antal individer för att dra slutsatser om hela populationen, se figur 4.2.
Population
Urval
Figur 4.2. Utifrån urvalet drar vi slutsatser som populationen. I stora drag finns två typer av urval, slumpmässigt och strategiskt. Det slumpmässiga innebär att man drar ett antal fall ur populationen, där varje fall i populationen har lika stor chans att bli draget. Fördelen med ett slumpmässigt urval är att om urvalet är tillräckligt stort kommer urvalets egenskaper att på ett bra sätt beskriva populationen. Slumpmässigt urval kan göras enligt ett antal varianter, dels den obundna, dels den bundna genom kluster‐ eller stratifierat urval. Ibland, speciellt vid intensiva studier, kan det vara mindre lämpligt med slumpmässigt urval. Då är det bättre med ett strategiskt urval. Det innebär att forskaren bestämmer vilka som ska ingå i urvalet. Här finns både för och nackdelar, om forskarens bedömning är korrekt kan ett representativt urval erhållas men om bedömningen är felaktig kommer slutsatserna om populationen att vara felaktiga. Anta att vi vill säga något om svenskars syn på skattenivåer. Vi väljer att fråga ett antal direktörer från Djursholm. Det mindre lyckade och korkade urvalet gör att slutsatserna om svenskarnas syn på skattesystemet kommer att vara felaktigt.
4.3 Datainsamlingsstrategi Nu har vi bestämt oss för vilken undersökningsstrategi som ska användas och hur urvalet ska göras. Nästa uppgift är att samla in data. Det finns generellt fyra sätt att gå tillväga. Det är genom historiska data, enkäter, intervjuer och direkta observationer. Låt oss studera sätten lite mer ingående nedan. Dessa skiljer sig viktigt emellan vad gäller vem som utför arbetet. Existerande källor har ju någon annan gjort och kallas för sekundär data medan övriga metoder ansvarar forskaren själv för och kallas här primärdata. 4.3.1 Historiska data Historiska data i fastighetsbranschen kan vara skrivna entreprenadkontrakt, hyreskontrakt, gjorda fastighetsaffärer mm, se figur 4.3. Fördelen med historiska data är att det ofta är skarpt läge; det är 17
händelser som har inträffat. Det här är situationer där aktörer har avslöjat sina preferenser genom att de facto göra en affär1. Till skillnad från en situation där aktören utan förbindelse påstår något om sitt handlande2. Tidpunkt 2013‐01‐09 2013‐01‐15 2013‐02‐01 2013‐02‐10 2013‐02‐22 2013‐02‐23 2013‐03‐01 2013‐04‐01 2013‐04‐12
Fastighet Copernicus 2 Kepler 4 Newton 1 Newton 2 Brunes 1 Brunes 2 Brunes 3 Einstein 2 Galileo 3
Köpesumma 350 000 000 450 000 000 510 000 000 320 000 000 930 000 000 950 000 000 980 000 000 350 000 000 250 000 000
Figur 4.3. Två källor till information. Ett hyreskontrakt och data över gjorda transaktioner.
För att kunna använda historiska data krävs att ett antal kriterier är uppfyllda. Det är äkthet, närhet i tid och rum samt tendens. Anta att vi vill beskriva ett händelseförlopp i ett bygge genom att gå igenom protokollet från ett byggprojektmöte. Är protokollet äkta? Eller har någon suttit och fabricerat texten. Om det är skrivet av någon som inte var närvarande vid mötet så minskar källans närhet i tid och rum. Om det dessutom visar sig att den som skrivit protokollet har ett incitament att försköna sin egen insats, minskar dokumentets trovärdighet än mer. Anta att författaren är byggprojektledare för ett projekt som går dåligt. Då kan det finnas en tendens hos författaren att svartmåla de externa omständigheterna som rådde vid bygget. 4.3.2 Enkäter och intervjuer Enkäter och intervjuer kallas på engelska för survey. Enkäter är frågor som skickas till den svarande (som vi fortsättningsvis kallar för respondent) per e‐post eller brev. Vid intervjuer ställer forskaren frågor muntligt och intervjuer kan göras vid fysiskt möte mellan forskaren och respondenten eller per telefon. I den bästa av världar Vid frågor med enkäter eller intervjuer bör processen helst vara enligt figur 4.4. Här ställer forskaren en fråga som innehåller informationen A. Förhoppningsvis förstår respondenten frågan helt enligt det, dvs. som ett A. Respondenten funderar på frågan och utan några systematiska fel i sitt resonemang (typ känsla av krav på svar) är deras svar B. Till sist skickar respondenten över sitt svar till forskaren utan att några missförstånd uppstår, så att forskaren förstår att svaret är B. 1 2
När aktören visar på ett beteende kallas det för revealed preferences. När aktören uttalar sig om sitt beteende kallas det för stated preferences.
18
A
A
B
B
Figur 4.4. I den bästa av världar erhålls svar på önskad fråga och forskaren tolkar svaret
Tyvärr är verkligheten inte alltid så enkel. Av den anledningen blir en av forskarens viktigaste uppgifter vid enkäter och intervjuer att minimera skadan i processandet hos intervjupersonen samt i överföring mellan forskare och intervjuad. Svårigheter För att peka på svårigheter ska jag använda en översiktlig modell baserad på Maltén (1998), se figur 4.5. Processen börjar med att forskaren omvandlar frågan till ord, det kallas att koda. Viktigt är att frågan formuleras på ett noggrant sätt så att den överensstämmer med dess syfte. Respondenten lyssnar och avkodar budskapet och har då förhoppningsvis erhållit budskapet [1]. Respondenten kan vid intervju få återkoppling [5] för att försäkra sig att hen verkligen förstått fråga: ”Du undrar om jag anser att jorden är rund eller platt?”.
Sammanhang
1
KOD‐ NING
AV‐ KOD‐ NING
3
2
Forskare
AV‐ KOD‐ NING
4 KOD‐ NING
Respondent
5
Figur 4.5. Intervjusituationens olika aspekter. Nästa steg i processen är när respondenten förstått frågan och avger ett svar [2]. Det vi önskar hos respondenten är att den inre processen sker utan systematiska avvikelser. Det vill säga att respondenten svarar så ärligt som möjligt. I det här sammanhanget ska man även inkludera i vilket sammanhang intervjun eller enkäten görs [3]. Finns det störande moment. Kanske andra personer som kan påverka respondenten. Respondenten kan även känna press från forskaren att leverera ett svar. Det sista steget är att respondenten har kommit fram till ett svar som vederbörande formulerar i ord eller genom att kryssa i en ruta i ett svarsformulär [4]. Nästa risk i processen är hur respondenten
19
kodar sitt svar och hur forskaren avkodar svaret. Även här bör det finnas möjlighet till återkoppling från forskaren till respondenten [5], ”du menar att jorden är platt?” Det vi har skissat på är en modell på hur kommunikation generellt går till och hur det kan påverka mätresultatet från en intervjustudie. Mätresultatet beror på vilken typ av survey man genomför, dvs. är det telefonintervju, besöksintervju eller enkät. Vi ska nu nedan återigen studera frågan [1], den inre processen [2] och svaren [4]. [ 1 ] Frågan Det finns tyvärr många fallgropar vid konstruerande av frågan. Jag ska ta upp ett antal problem som jag tror är de viktigaste. Det är oftast saker som kan anses som självklara men som forskaren ändå glömmer bort. En grundläggande aspekt är att definiera frågan tydligt i tid och rum. Till exempel: ”Hur länge har du bott här?” Vad menas med här? I området eller i staden eller i landet. Och vad menas med hur länge? Ska svaret vara i år eller i månader. En annan viktig detalj är att ta en sak i taget och inte blanda ihop flera frågor i en: ”Tror du att priset på stövlar och ägg kommer att gå upp?” Om jag svara ja menar jag då att både stövlar och ägg kommer att gå upp, eller skulle jag svara ja om jag enbart ansåg att äggpriserna kommer att stiga. Frågan ska dessutom vara balanserad så att man inte påverkar svaranden i en viss riktning. ”Är ni för A?” är en obalanserad fråga medan ”Är ni för eller emot A?” är en balanserad fråga. Andra fallgropar är bl.a. vid attitydfrågor där respondenten ska delge sin åsikt; vad tycker du om monarkin? Vilket är Sveriges bästa parti? Om frågan ställs fel finns risk för överrapportering; Är högertrafik bra? Det finns en tendens hos respondenter att hellre hålla med och svara ja än att säga emot. Det tycks ligga i vår natur. Det finns dock situationer där man kan ana en underrapportering: respondenterna säger inte vad de tycker för att det inte är socialt hållbart. Då kan det vara bra att ha avsiktligt ledande frågor. Till exempel: ”Många läkare anser att ett glas vin om dagen kan vara bra för hjärtat. Hur mycket vin dricker du i veckan?” Ytterligare inverkan på svaret kan frågeordningen ha. Ett tips är att ställa känsliga frågor sist. Det minskar risken att förstöra resten av frågorna på grund av att den intervjuade blir på dåligt humör. En beprövad teknik, utvecklad av Gallup, är tratt‐tekniken vilket innebär att man börjar med en allmän fråga för att sedan ställa specifika frågor. Om syftet är att fråga om ett områdes naturkvaliteter, kan man börja med att fråga allmänt vad folk tycker om staden och om området för att sedan gå på djupet med ”Vad tycker ni om miljön i södra Surahammar?”. ”Varför tycker ni det?”. Fördelen med att börja med helheten är att folk har lättare att besvara specifika frågor om de först fått begrunda det hela utifrån en allmän fråga. [ 2 ] Inre process Det finns en mängd aspekter att belysa när det handlar om respondentens inre process. Det kan t.ex. vara formuleringen av frågan eller frågeordningen som vi belyste i föregående avsnitt. I den här avdelningen ska jag belysa problemet med minnet. Hur säkra kan vi vara på att den svarande minns rätt? Det vi önskar hos den svarande är hög tillförlitlighet (hög reliabilitet), dvs. att svaret inte varierar över tid, och hög validitet, dvs. att svaret stämmer överens med vad som faktiskt har hänt. En känd politiker har utfrågats ett antal gånger om han var glad eller ledsen när Berlinmuren föll 1989. Hans svar har varierat över tid, dvs. ibland minns han det som att han var glad och ibland minns han det som att han var ledsen. Hans svar har därmed låg reliabilitet. (Den senaste
20
informationen jag har i frågan är att han var glad.) Om han de facto var glad när Berlinmuren föll har hans senaste svar hög validitet, dvs. den överensstämmer med vad som faktiskt hände. För att belysa minnets påverkan på respondentens svar ska vi börja med att studera minnet. En teori om minnet är ”glömske kurva”, dvs. ju längre tid som förflyter mellan händelsen och erinran (när man ska svara på vad som hände vid händelsen), desto större är risken för glömskan. En annan teori är inferensteorin där möjligheten att minnas en händelse beror på tidigare erfarenheter, dvs. före händelsen men även på erfarenheter man gör mellan händelsen och erinringstidpunkten. Den härskande teorin just nu är att allting som händer lagras i hjärnan. Knepet är att hitta minnet, ungefär som att hitta en bok i ett bibliotek. Utifrån ett sådant angreppssätt blir det viktigt hur vi minns händelser, dvs. kodar, och vilka verktyg vi har för att hämta ur minnet, s.k. erinran. Det som lagras ska knytas till det som redan finns lagrat, det gör det lättare att minnas. Kodning är beroende på omständigheter kring händelsen och på tidigare upplevelser, kunskaper, attityder och känslor hos personen. Det går inte i efterhand att påverka hur människor kodat ett minne, om det inte gäller undervisning där man kan använda tidigare kunskaper, attityder och känslor för att förbättra inlärning. Däremot går det att påverka erinring. Till att börja med går det inte att bortse från att tiden ändå har en viss påverkan. Därför bör erinringsperioden, dvs. mellan händelse och erinran vara så kort som möjlig. Ett sätt att erinra är att försöka finna associationer till annan lagrad kunskap. Detta genom minnesmärken. ”Sverige vände 0‐4 till 4‐4 mot Tyskland. I samband med det, hur mycket tittade du på sport?” Genom att ställa frågor kring denna enklare händelse, försöker man öka erinran från händelser som inträffade samtidigt. Utöver beaktande av kodning och erinran finns andra detaljer som påverkar möjligheten att erinra, det är intervjusituationen, dvs. intervjuares närvaro, hotande frågor och intervjutiden. [4] Svaren från intervjuade. Hur svaren ges från respondenten beror förstås på vilka möjligheter forskaren ger respondenten att svara på ett bra sätt. Man brukar skilja på öppna och stängda frågor. Öppna frågor är där respondenten med egna ord får formulera sitt svar, medan stängda svar innebär att respondenten kryssar för något, av forskaren bestämt svarsalternativ. Det är förstås möjligt att ha både och. Öppna frågor är mest användbara när det finns många möjliga svar som det i förväg inte går att förutse. En annan fördel är att om forskaren vill ha en förståelse för hur viktigt ett ämne är för respondenten, så kan man få en uppfattning om det genom hur respondenten uttrycker sig. Nackdelen med öppna svarsalternativ är att de är resurskrävande och det kan vara svårt för forskaren att få med all information som delges honom. Givna svaralternativ kan vara enligt figur 4.6. ”Kostnadsöverskridanden beror på att projektet ändrat utformning” Ja, absolut Ja, troligen Kanske Nej, troligen inte
21
Nej, absolut inte Vet ej Kommentar:
Figur 4.6. Ett exempel på en fråga med givna svarsalternativ.
Här uppfylls ett antal elementära krav. Svaren är ömsesidigt uteslutande. Om vi svarar med kryss i ett alternativ så kan det inte tolkas som svar även för något annat alternativ. Svaren är uttömmande, dvs. inget alternativ saknas. Ibland saknas alternativet ”vet ej” vilket innebär att svarsalternativen inte är uttömmande. Svarsalternativen är överblickbara vilket innebär att den svarande lätt förstår vilka alternativ han har att välja mellan). Till sist ska även nämnas att svarsalternativen är balanserade, dvs. det finns lika många och starka ”Ja” alternativ som ”Nej” alternativ. Användande av skattningsskalor ska ha en neutral punkt, ”vet ej” och vara symmetriska för att ge bästa svar. Om man ska ha fem‐, sju eller niogradig skala, bör man kunna motivera om man ska ha fler än fem. Det finns studier om positionseffekter (primacy och recency effects) för att slippa dessa kan man ändra ordningen på svarsalternativen till de olika respondenterna. Fördelen med givna svarsalternativ är att de är resursbesparande, de går enkelt att använda till statistiska metoder för olika beräkningar. 4.3.3 Direkta observationer Direktobservation är en typ av datainsamling där forskaren i realtid studerar vilka val analysenheterna gör. Det finns i stort två sätt att utföra direktobservationer: Genom dold eller öppen studie av analysenheten. Vid dold analys känner inte analysenheten till att den blir studerad vilket den gör vid öppen analys. I komedin ”Psalmer från köket” som utspelas under bostadsforskningens storhetstid på 50‐talet studerar forskare hur ensamstående män i Norge utnyttjar sina kök för att utforma kök på ett optimalt sätt. I filmen sitter forskaren i en tennisstol i köket i forskningsobjektets hem, det är sålunda frågan om en öppen analys. Ungkarlen, som frivilligt deltar i undersökningen, börjar efter ett tag att tröttna på att blir studerad. Han borrar därför ett hål i taket ovanför forskaren för att i sin tur studera när forskaren sitter i sin tennisstol för att studera ungkarlen (och börjar undra vart han har tagit vägen). Ungkarlens observation av forskaren är sålunda en dold analys. Den öppna analysen kan dessutom delas in i passivt och aktivt deltagande. Ovanstående exempel med forskaren är ett exempel på passiv observation. En form av aktivt deltagande är den deltagande observation som innebär att forskaren aktivt deltar i de aktiviteter forskningsobjektet utför. Eftersom jag tror att deltagande observation är ganska vanligt i realiteten men sällan utnyttjat kommer jag nedan att utveckla tekniken med deltagande observation. Deltagande observation Deltagande observation är ofta förknippat med sociologi, dvs. i studier av hur samhället i stort fungerar, och etnologi, dvs. hur människor fungerar. I de fallen innebär deltagande observationer
22
kanske flera månader eller år av observationer tillsammans med en folkgrupp. Det kan vara allt från indianska stammar, patienter på ett ålderdomshem till norska nynazister. Deltagande observation är inte så vanlig i bygg‐ och fastighetsbranschen. Inte i dess renodlade form i alla fall. Däremot i mindre utsträckning eftersom ekonomisk forskning bör vara kopplad till verkligheten. Ekonomi handlar om att fatta beslut. Att då aldrig ha deltagit vid faktiska beslut är en brist forskaren bör åtgärda. Många forskare bedriver därför deltagande observationer i och med att de samtidigt med sin forskning är involverade i olika processer och på så sätt får insikt i hur marknaden fungerar och beslut tas. Det kan vara i form av konsultuppdrag där forskaren gör analysarbeten åt fastighetsföretaget, eller som aktivt deltagande i olika organ såsom bolagsstyrelser mm. Anta att vi med deltagande observation ska studera fastighetsvärderare för att få mer insikt i hur de utför marknadsvärdebedömningar. Kortfattat består vårt arbete med deltagande observation i fyra moment, dessa är: tes, förarbete, genomförande och slutsatser, se figur 5.8. Oftast behöver man arbeta med samma moment flera gånger och återvända till ett tidigare moment, därav de streckade linjerna i figur 4.7.
TES
Förarbete
Genomförande
Analys
Figur 4.7. Översiktlig bild av processen vid deltagande observation.
Tes En tes är det påstående eller fråga som vi vill testa med vår studie. I vårt exempel är tesen: ”Fastighetsvärderarna använder sig av olika tumregler vid marknadsvärdebedömning något som riskerar att försämra värderingen”. Huruvida man ska börja med en tes, ett påstående, finns det delade meningar om. De flesta anser att det är bra att ha något påstående att fokusera på när man börjar sina studier för att det ska bli lättare att fokusera. Men att detta inte får hindra en att vara vidöppen för andra eller ytterligare teser. Förarbete Vårt förarbete blir att studera beslutsfattande generellt och den forskning om fastighetsvärdering som finns. Här finns teser om att värderarna skulle ha en viss tendens till ankring och confirmation bias. Ankring är att värderarna är påverkade av tidigare uttalanden om fastigheters värden. Confirmation bias innebär att värderaren har bestämt sig tidigt vad marknadsvärdet är och sedan i stor omfattning söker data som stöder hans bedömning och bortser från data som motsäger bedömningen. Fördelar med att läsa in sig är att man inte gör saker som tidigare gjorts. Nackdelen är att man kanske låser sig i förklaringsmodeller som tidigare forskare kommit fram till. I förarbetet får du även tillfälle att beakta din egen känslomässiga inställning till ämnet och gruppen du ska studera. Kanske har du en kraftig åsikt om gruppen som gör att dina observationer kommer att påverkas negativt. I förarbetet ingår också att bestämma vilken grupp du ska undersöka. Kanske finns det en mängd
23
företag du skulle kunna göra din undersökning på och då är det bra att välja ett som är bra. Vid val av ställe finns det de som anser att djupgående på ett ställe är att föredra framför flera ställen. Genomförande Genomförandet bygger initialt på att ett förtroende upparbetas hos dem där observationen ska göras. Det gäller att hitta dörröppnare, folk i organisationen som tycker att du ska få tillträde till arenan. När du väl har fått in en fot gäller det att hålla uppe förtroendet. Antagligen kommer de observerade att till att börja med kanske vara på sin vakt. Men förhoppningsvis kommer de efter hand att strunta i din närvaro. Detta är av vikt för din studie. Du kan då på allvar analysera hur de beteer sig. När väl förtroende upparbetats, men glöm inte att det måste underhållas löpande, fortskrider ditt observerande. Du kommer att lägga märke till individernas verbala‐ och icke‐verbala kommunikation. Under genomförandet för du anteckningar. Du kan dela in dina anteckningar i observationsdata. Där skriver du, nästan, ordagrant vad som sägs och görs. Observationsdata i vårt fall är t.ex. hur många jämförelseobjekt värderaren använder. Hur han bedömer framtida hyresintänkter etc. Vi börjar även analysera utifrån ett teoretisk perspektiv så smått under genomförandet. Vi antecknar dessa analyser i dina teoretiska observationer. Kanske ser vi att någon använder en viss metod på ett visst sätt. Kanske noterar vi att någon tidigt bestämt ett värde och i stor utsträckning försöker argumentera för det genom att ändra i olika parametrar. Vi gör även metodologiska anteckningar. Dessa ska vara vägledning i det fortsatta arbetet. Här antecknar vi vad vi bör vara mer uppmärksamma för i fortsättningen av studien. Att genomföra en deltagandeobservation kan göras på heltid, vi arbetar på ett ställe under en längre tid. Men det finns ett alternativ som deltid deltagande, kanske bara under ett tillfälle ett antal dagar etc. Analys Det finns inga klara gränser mellan analysdelen och genomförandedelen. Du börjar med analys i och med dina teoriobservationer. När du väl ska fokusera på analysen kan man dela in den i tre delar. Dels tolkning av första graden där allt råmaterial skrivs ned. Helst varje uttalad bokstav, varje andetag. Då får vi en känsla för värderarens arbetsmetod och resonerande. Tolkning av andra graden innebär att vi försöker ta hänsyn till många relevanta sammanhang (kontexter) för att förklara en handling. Här tar vi hänsyn till värderarens begränsade tillgång till information. Vi tar även hänsyn till omständigheter som stress, relationen till kunden etc. Vid tolkning av tredje graden gör vi än mer teorianknytning av handlingar vi har observerat. Kanske säger teorin att confirmation bias är påtaglig vid värdering av svåra objekt, när marknaden har låg aktivitet. Här försöker vi se om våra observationer stämmer med tidigare teori och om den kan utveckla eller motsäga rådande teorier. Slutsatser om deltagande observationer Fördelen med deltagande observation jämfört med t.ex. intervjuer är bl.a. att det underlättar tillgång till information som de inte vill prata om. Det blir också möjligt att studera det aktörerna de facto gör jämfört med vad de säger att de gör, vilket de gör i enkäter och intervjuer.
24
4.4 Analysen av data I det här avsnittet ska vi behandla hur intensiva‐ och extensiva studier, var för sig, kan analysera data för beskrivande frågor. För förklarande frågor är det optimala arbetssättet att använda både intensiva‐ och extensiva studier, det behandla i nästa kapitel. 4.4.1 Generalisering av beskrivande fråga med extensiv studie Generalisering av beskrivande fråga med extensiv studie görs oftast genom punktestimering, intervallskattning eller hypotestestning. Vi ska gå igenom de tre metoderna med hjälp av ett exempel. Anta att vi vill veta marknadsvärdet för fastigheter i Norra Ängby, Stockholm, och det finns prisobservationer på samtliga fastigheter, se figur 4.8. 5,1 5,0 4,9 4,5 4,9 5,5 5,3 4,5 5,0 5,1 4,9 4,7 5,2
5,2 4,8 4,9 4,5 4,9 5,2 5,4 4,5 5,0 5,1 4,8 4,7 5,0
5,3 4,7 4,8 4,5 5,0 4,8 5,4 5,5 4,9 5,0 5,0 4,7 5,0
5,2 4,6 5,2 4,5 5,0 4,8 5,4 5,5 4,8 5,0 5,1 4,7 5,0
4,8 5,0 5,0 4,9 5,1 4,7 5,4 5,5 4,8 5,1 5,2 4,7 5,0
4,7 5,1 5,5 5,1 5,2 4,6 5,4 5,0 4,8 5,0 5,3 5,3 5,0
4,7 5,2 5,5 5,1 5,3 5,0 5,4 5,0 4,9 4,9 4,9 5,3 5,0
4,6 5,2 4,5 5,1 5,4 5,1 5,4 5,0 4,8 4,8 4,8 5,3 5,0
Figur 4.8. Till höger samtliga prisobservationer i karta och till vänster dessa observationer i miljoner kronor. Statistisk kallas alla dessa transaktioner för population och det går relativt lätt att räkna ut populationens medelvärde (µ), vilket är fem miljoner kronor. Men, som tidigare nämnts, finns det oftast inte information om hela populationen utan analysen görs utifrån ett urval. Så istället för prisobservationer på hela populationen har finns enbart prisobservationer på ett urval på 10 fastigheter. Vi ska nedan gå igenom hur vi använder urvalet för att dra slutsatser, eller med andra ord göra kvalificerade gissningar, om populationen. Punktestimering Punktestimering innebär att urvalets medelvärde, vilket även kallas stickprovsmedelvärdet ( ), används för att dra slutsatser om populationens medelvärde. Anta att 10 stycken observationer har dragits slumpmässigt, de rödmarkerade i figur 4.9, och räknar ut stickprovsmedelvärdet till 5,08 miljoner kronor.
25
5,1 5,0 4,9 4,5 4,9 5,5 5,3 4,5 5,0 5,1 4,9 4,7 5,2
5,2 4,8 4,9 4,5 4,9 5,2 5,4 4,5 5,0 5,1 4,8 4,7 5,0
5,3 4,7 4,8 4,5 5,0 4,8 5,4 5,5 4,9 5,0 5,0 4,7 5,0
5,2 4,6 5,2 4,5 5,0 4,8 5,4 5,5 4,8 5,0 5,1 4,7 5,0
4,8 5,0 5,0 4,9 5,1 4,7 5,4 5,5 4,8 5,1 5,2 4,7 5,0
4,7 5,1 5,5 5,1 5,2 4,6 5,4 5,0 4,8 5,0 5,3 5,3 5,0
4,7 5,2 5,5 5,1 5,3 5,0 5,4 5,0 4,9 4,9 4,9 5,3 5,0
4,6 5,2 4,5 5,1 5,4 5,1 5,4 5,0 4,8 4,8 4,8 5,3 5,0
Figur 4.9. Två urval med tio observationer i varje urval. Vi antar sålunda att populationens medelvärde också är 5,08 miljoner kronor vilket är en ganska bra gissning eftersom korrekt värde är 5 miljoner kronor. vad den rätta populationen är, även om gissningen inte är helt korrekt. Men det är trots allt en skillnad mellan stickprovsmedelvärdet och populationens medelvärde. Skillnaden kallas för slumpmässigt urvalsfel. För att beakta det slumpmässiga urvalsfelet går det att bredda analysen genom att även utföra en intervallskattning. Intervallskattning Anta att vi istället för urvalet ovan hade dragit tio andra objekt. Utifrån dessa tio skulle vi erhållit stickprovsmedelvärdet 4,9 miljoner kronor. Det stämmer inte heller med populationens medelvärde även om värdet är relativt nära populationens medelvärde men vi får åter igen ett urvalsfel. Hur beaktas problemet med slumpmässigt urvalsfel. Vi kan lita på och använda centrala gränsvärdessatsen, vars innebörd är att om det görs många urval och för varje urval beräknas ett stickprovsmedelvärde, så kommer medelvärdet av alla dessa stickprovsmedelvärden att bli populationens medelvärde, i det här fallet 5,0 miljoner kronor. Verkar det konstigt, se tabell 4.2.
26
Urval
Prisobservationer
1 2 3 4 5 6 7 Urval 1 5,3 5,2 5,2 4,5 5,0 5,1 5,1 Urval 2 4,8 4,6 4,5 5,2 5,0 4,6 4,6 Urval 3 4,9 4,6 5,0 4,8 5,2 5,1 5,0 Urval 4 5,2 4,8 5,2 5,0 4,7 4,8 5,1 Urval 5 5,0 4,9 4,9 4,8 4,8 5,1 5,1 Urval 6 5,1 5,2 5,3 5,2 5,1 5,1 5,2 Urval 7 5,1 4,9 5,0 5,0 4,9 4,8 5,1 Urval 8 4,8 4,9 4,8 4,9 4,8 4,8 4,9 Urval 9 4,8 5,0 4,9 4,9 4,9 4,9 5,1 Urval 10 5,1 5,0 5,1 5,1 4,9 4,8 4,8 Medelvärdet av samtliga stickprovsmedelvärden
8 5,0 5,1 5,0 5,2 5,1 5,2 5,2 4,9 5,0 4,8
9 5,1 5,1 4,8 5,3 5,2 5,1 5,0 5,0 5,0 5,2
10 5,3 5,1 4,4 5,3 5,0 5,0 5,1 5,0 5,0 5,0
Stickprovsmedelvärdet ( 5,08 4,86 4,90 5,06 4,99 5,15 5,01 4,88 4,95 4,98 4,986
Tabell 4.2. Medelvärdet av samtliga stickprovsmedelvärden. Här visas 10 olika urval. På rad ett, ”Urval 1” visas 10 slumpmässiga prisobservationer och längst till höger har stickprovsmedelvärdet beräknats. Sedan har ytterligare nio urval gjorts där 10 prisobservationer har dragits i varje urval. Vid varje urval har ett stickprovsmedelvärde beräknats, kolumnen längst till höger. Till sist har medelvärdet av alla dessa stickprovsmedelvärden beräknats vilket i det här fallet blev 4 986 000 kronor vilket är väldigt nära det sanna medelvärdet på 5 000 000 kronor. Det här är kärnan i centrala gränsvärdessatsen, om ett tillräckligt stort antal urval (stickprov) görs där stickprovsmedelvärdet beräknas kommer medelvärdet av alla dessa stickprovsmedelvärden att bli populationens medelvärde. Om vi redovisar de 10 stickprovsmedelvärden i en frekvenstabell kommer de att fördela sig runt populationens medelvärde på ett visst sätt, se figur 4.10. Stickprovsmedelvärdet (
5,0
5,08
Antal medelvärden
Figur 4.10. Medelvärdet av samtliga medelvärden kommer vid många dragningar att få formen av normalfördelning. Här motsvarar varje kloss ett stickprovsmedelvärde. Vid dragning av oändlig mängd stickprovsmedelvärden kommer de att fördela sig enligt den dragna linjen i figur 5.11. Fördelningen kallas Students t‐fördelning med medelvärdet µ och spridningen ⁄√ , där µ är populationens medelvärde, s är standardavvikelsen i stickprovsmedelvärdet och n är antalet enheter i urvalet. Fördelningens utseende varierar beroende på urvalsstorleken (n). Ju större n är desto mer kommer den att likna normalfördelningen. Problemet är att vi enbart har ett urval och därmed enbart ett stickprovsmedelvärde, vilket representeras av den röda klossen i figur 4.11.
27
Antal medelvärden
5,0
Stickprovsmedelvärdet (
Figur 4.11. Om man inför ett intervall, d, så kan man täcka in populationens medelvärde. Kom ihåg att vi inte känner till det sanna populationsmedelvärdet, så vi vet inte var i fördelningen den röda klossen befinner sig. För att vi ska vara säkra på att det beräknade stickprovsmedelvärdet (den röda klossen) täcker populationens medelvärde, införs ett intervall (d) runt stickprovsmedelvärdet. I vårt exempel skulle d kunna vara 200 000 kronor. Det innebär att utifrån stickprovsmedelvärdet på 5 080 000 kronor bedöms att populationens medelvärde finns i intervallet 4 980 000 – 5 180 000 kronor. Och eftersom vi i detta påhittade exempel känner till populationens sanna medelvärde så vet vi att intervallet täcker detta. Nästa fråga är hur stort intervallskattningen ska vara? Utan att gå in på hur formeln härleds kan d erhållas med formeln, 2 ⁄√ . Med intervallet d går det med 95 % säkerhet anta att intervallet täcker populationens medelvärde, dvs. 19 gånger av 20 kommer intervallet att täcka populationens medelvärde. Men varför 95 %? Varför inte ett större eller mindre intervall? Det finns inget bra svar på den frågan. Det är en konvention som forskarvärlden använder. Vi skulle kunna ha ett mindre intervall och säga att populationens medelvärde med 60 % säkerhet ligger inom ett intervall, men då skulle vi enbart gissa rätt sex av tio gånger. Vi skulle även kunna ha ett större intervall och då säga att intervallet med 99 % säkerhet täcker intervallet. Nackdelen med den strategin är att intervallet blir så stort att det blir meningslöst. Hypotesprövning Hypotesprövning (Signifikanstest) är den tredje varianten att utifrån ett urval dra slutsatser om populationen. Vid hypotesprövning vill man avgöra om ett påstående om populationen är sant eller falskt. Förenklat består hypotesprövningen av fem moment 1. Ett påstående (en hypotes) görs. Det skulle kunna vara att populationens medelvärde är 5,0 miljoner kronor. En alternativ hypotes fastställs också. I det här fallet att populationens medelvärde är skiljt från 5,0 miljoner kronor. 2. En teststorhet ska väljas som kan använda för att avgöra om påståendet (hypotesen) ska avfärdas eller inte. En vanlig teststorhet är t= μ ⁄ ⁄√ som har sitt ursprung i att stickprovsmedelvärdet ( ) har en sannolikhetsfördelning som är Students t‐fördelad med medelvärdet µ och standardavvikelsen ⁄√ . Då vet vi att 95 % av gångerna kommer att 28
⁄√ . Nu kan vi genom linjär variabeltransformation3 hamna mellan μ t ⁄√ och μ utforma teststorheten t så att den med 95 % säkerhet kommer att vara mellan ‐t och +t, se figur 4.12. Antal t‐värden Antal medelvärden
‐t *
√
Medel pris
t *
√
Figur 4.12. Linjär variabeltransformation
‐t
t‐värdet
t
3. Nästa steg är att bestämma kritiska värden på t för att avgöra om vi ska avfärda hypotesen eller inte. Det kritiska värdet beror på vilken säkerhetsnivå vi bestämmer och urvalets storlek. I vårt exempel med 95% säkerhet och ett urval på 10 enheter gör att vi väljer kritiska värdet 2,23. 4. Sista steget är att göra ett urval och räkna fram t för att jämföra med satta gränsvärden. Åter till vårt exempel. Anta att vi påstår att medelvärdet är fem miljoner, då är det vår hypotes. Vi väljer att använda t som teststorhet och vi drar samma tio som vi drog allra först. Vi får då lika med 5,08. Vi använder det i teststorheten och får värdet μ ⁄ ⁄√ 5,08 5 / 0,68/√10 0,37. 5. Sista steget är att dra slutsatser om populationen, ska vi förkasta hypotesen eller inte? Och eftersom 0,37 i det här fallet är mindre än det kritiska värdet 2,23 kan vi inte avfärda hypotesen. Vi beslutar oss alltså för att populationens medelvärde är 5 miljoner kronor. Låt oss sammanfatta. Med ett urval på 10 fastigheter med prisobservationer kan slutsatser dras om marknadsvärdet i hela populationen i Norra Ängby. Punktestimering innebär att ett exakt värde på uppskattningen av populationens medelvärde ges. Intervallskattning innebär att slutsatser är att ett visst intervall täcker marknadsvärdet. Slutligen hypotestestning som innebär att bestämmer sig för om ett påstående är korrekt eller inte. Övriga metoder Två andra statistiska metoder är Chi‐två metoden och Teckentest. Chi‐tvåmetoden kan användas vid analys av frekvenstabeller. Anta att hyresgästerna anser att tre typer av lägenheter är lika bra. 30 personer tillfrågas om deras åsikt om lägenheterna. Om lägenheterna är lika bra bör de 30 personerna fördela sina röster jämnt, dvs 10 personer per lägenhet. Om vi däremot noterar på att lägenheterna väljs 9,9 och 12 personer går det med viss sannolikhet säga att hela populationen anser att lägenheterna är olika attraktiva.
3
Se kapitlets appendix.
29
Teckentest är ett analysverktyg man kan användas när data inte är av intervallskala utan ordinal (dvs. det går att rangordna men inte avgöra hur mycket några detaljer skiljer sig från varandra). Anta att vi vill veta om hyresgästerna tycker att två typer av lägenheter är lika bra eller inte. Hyresgästerna får bedöma lägenheterna på en 1‐3 skala. Utifrån detta jämför vi och sätter plus på de som tycker att den ena lägenheten är bättre än den andra. De som satta samma nummer på båda lägenheterna får värdet noll. Det går då att påstå, med Y procents säkerhet, att populationen anser att lägenhet A är bättre än lägenhet B. 4.2.2 Generalisering av beskrivande fråga med intensiv studie Det bästa sättet att erhålla generalitet är att använda extensiva studier enligt ovan. Men anta att det bara finns ett fåtal fall? Det går även då att göra generaliseringar men de blir inte lika bra som vid statistisk slutledning. Vid ett fåtal fall går det att göra ett strategiskt urval, dvs. välja aktivt vilka fall som ska undersökas, istället för att låta slumpen avgöra vilka fall som ska inkluderas. Vid strategiskt urval finns två vägar att gå, antingen ett urval baserat på hög representativitet eller ett urval baserat på förväntningar. Generalisering genom representativitet Representativitet innebär att fall väljs som anses på bästa sätt representerar populationen. Om vi t.ex. vill undersöka fastigheters genomsnittspris i Stockholms innerstad kan två hus från Kungsholmen, två hus från Södermalm och två hus från Östermalm väljas. Dessa har ungefär liknande övriga egenskaper vad gäller ålder, kvalitet mm. Ju fler liknande egenskaper desto bättre. Vi kan med fördel använda klusteranalys för att välja urval, se figur 4.13.
Östermalm
Södermalm
Kungsholmen
Analysenhet Bomba 1 Punchen 12 Setuppen 4 Lineuppen 2 Skohornet 1 Häcklaren 34
Område Kungsholmen Kungsholmen Södermalm Södermalm Östermalm Östermalm
Prisobservation (kr) 150 miljoner 145 miljoner 142 miljoner 140 miljoner 155 miljoner 160 miljoner
Figur 4.13. Klusteranalys är ett sätt att dela upp fallen när flera egenskaper finns. Då läggs ”lika” analysenheter i samma grupp. Observera att ”lika” inte behöver innebära att alla centrala egenskaper är lika för analysenheter i samma grupp. Nu har vi fått ett urval som ungefärligen representerar Stockholms innerstad och det är möjligt att beräkna ett medelvärde, vilket här blir ungefär 149 miljoner. Bästa sättet att få representativitet är ett strategiskt urval. Det finns dock två problem med arbetssättet. För det första måste vi känna till populationens centrala egenskaper. För det andra kanske de egenskaper vi känner till inte är relevanta för vår undersökning. Generalisering genom förväntningar – ”Maximal och minimal sannolikhet4” Ett annat sätt att göra urval är att ta en analysenhet där sannolikheten är stor att ett fenomen existerar. Vi ska bestämma kostnader för nedklottring generellt i Stockholm. Vi väljer att studera kostnader i Fisksätra som är känt för stor nedklottring. Kostnaden där visar sig vara 1000 kronor per 4
”Most different design system”, se Przewurski och Teune (1970).
30
invånare och år. Då kan vi generellt säga att kostnader för nedklottring i Stockholm är lägre än 1000 kr per invånare och år. På samma sätt kan vi göra ett urval där sannolikheten är låg för ett visst fenomen. Anta att vi vill få en uppfattning om renoveringsbehovet för bostäder från miljonprogrammet. Anta att Bredäng är känt för att extra bra material och byggnadsteknik användes vid produktion vilket innebär att området med andra ord borde ha högre kvalitet än ändra områden byggda på 60‐ och 70 talet. Och därmed borde sannolikheten för stora renoveringskostnader vara låga. Om det vid undersökning av Bredäng visar sig att renoveringskostnader är höga, borde renoveringsproblemet generellt i Sverige vara ett stort problem. Nackdelen med generalisering med en intensiv studie jämfört med en extensiv studie är att det inte går att kvantifiera sannolikheten. Metoden blir också svårtolkad om det förväntade utfallet de facto är det man kommer fram till. Om man tänkt undersöka det generella problemet med klotter i förorten och har som tes att klottret inte är speciellt utbrett, och väljer en förort där mycket klotter förväntas finnas, och det visar sig att mycket klotter finns där, då är det svårt att dra slutsatser om klotter är ett generellt problem eller inte.
31
5. Analys av förklarande fråga med både extensiv och intensiv studie. I det här kapitlet ska vi studera hur data kan användas för att besvara en förklarande fråga. Vi utgår från det tidigare exemplet med boyta och betalda priser i Norra Ängby. För att kunna argumentera för att boyta påverkar priser ska vi använda de fyra orsakskriterierna. Vi börjar med kontrafaktisk skillnad och isolering genom att använda en extensiv studie. Vi använder därefter en intensiv studie för att se på tidsordning och orsakssamband.
5.1 Kontrafaktisk skillnad med extensiv studie Anta att vi har en stor mängd data på transaktioner av villor. I datan ingår priser och boyta. Vi börjar analysen genom att markera data om boyta och prisobservationer för hela populationen i Norra Ängby i ett diagram, se figur 5.1.
40 000 Pris (Y)
Bostadsyta (x)
Figur 5.1. Svarta linjen visar på bästa sätt, bättre än den blåa och röda, relationen mellan pris och bostadsyta.
Med boyta (x) på ena axeln och pris (y) på den andra axeln får vi observationer i form av små punkter. Varje punkt motsvarar ett hus med boyta (x) som sålts till priset (y). Om vi studerar observationernas inbördes placering verkar det finnas ett samband. Ju större boyta desto högre pris. Vi kan tydliggöra sambandet med den heldragna svarta linjen. Vad vi kan konstatera är att den bättre än andra alternativa linjer visar på sambandet mellan boyta och pris. Den blå linjen är brantare och den röda linjen är flackare än hur punkterna breder ut sig i diagrammet. Nästa steg i vår strävan att finna 40 000 , se kontrafaktisk skillnad är att härleda den svarta linjens funktion ekvation som är figur 5.2.
32
40 000
Priser (Y)
4,9 4,0
100
Bostadsyta (x)
Figur 5.2. Med regressionslinjen kan vi hitta ett samband mellan boyta och priser. Linjen förklarar en stor del av denna förändring.
Vi avstår i den här texten att förklara hur linjen härleds. Det är relativt komplicerat. Tolkningen av ekvationen är att för varje ytterligare kvadratmeter boyta ökar husets pris med 40 000 kronor. Vi har här ett argument för kontrafaktisk skillnad. Med ökad eller minskad boyta stiger eller sjunker priset med en viss faktor. Vi kan konstatera att nästan ingen observation ligger på linjen. Avståndet mellan linjen och faktiskt utfall kallas för feltermen och är den del av priset som boytan inte lyckas förklara. Se observation i fig. 5.2, den röda punkten. Boytan är 100 kvm och huset såldes för 4 900 000 kronor. Vi kan med boytan förklara, med hjälp av ekvationen, 4 000 000 kronor av priset. Övriga 900 000 kronor förklaras av andra faktorer. Hur mycket av priset som förklaras av boytan, kan göras för samtliga observationer och vi erhåller då boytans (och hela modellens) samlade förklaringskraft av priset. Det går att beräkna förklaringskraften med hjälp av modellen, vilket jag i den här texten inte beskriver. Vi har nu två uttryck för om vår ekvation förklarar sambanden mellan boyta och priser på ett bra sätt. Dels genom den kausala effekten, dvs. lutningen på linjen. Ju högre lutning desto större kausal effekt. Och ju lägre lutning eller noll så är den kausala effekten liten eller obefintlig. Dels förklaringskraft, om ekvationen förklarar hela prisförändringen eller delar av prisförändringen. Ju närmare linjen samtliga observationer befinner sig desto högre förklaringskraft. I figur 5.3 visas exempel på låg kausalitet och förklaringskraft samt hög kausal effekt och förklaringskraft.
33
Prisnivå
Prisnivå
boyta boyta Figur 5.3. Till vänster observationer som ger både låg kausalitet och låg förklaringsgrad. Priset ändras inte när boytan ändras och
=noll.
Till höger observationer som ger hög kausalitet och hög förklaringsgrad. Priset ändras när boytan ändras och
=ett.
5.2 Isolering med extensiv studie Vi vill veta om vi har fångat rätt faktor, är det boytan som påverkar priset? Eller är det något annat som påverkar både boytan och priset i samma riktning, så att det tycks finnas ett samband mellan dessa fast det inte gör det. För att göra den kontrollen tillför vi kontrollvariabler, dvs. ytterligare faktorer som vi också tror påverkar priset förutom boyta. Om vi vid sådan körning får ingen eller liten förändring på koefficienten för boyta, 40 000, kan vi anta att x är isolerat. Om däremot koefficienten ändras mycket, finns det risk för att det inte är boyta som påverkar pris utan något annat. Anta att vi i vårt exempel tillför kontrollvariabeln antalet badrum (z). Kanske är det så att antalet badrum är väsentligt mycket viktigare än boytan och därmed är den faktor som förklarar prisskillnader, vilket innebär att boytan enbart är en följd av antalet badrum. Vi behöver alltså information om antalet badrum på samma sätt som vi har samlat information om boyta och priser. Vi adderar sedan den faktorn till ursprungsekvationen och försöker även denna gång hitta en linje som visar på sambanden mellan faktorerna. Vi får ekvationen 30 000 100000 . Om vi jämför den ekvationen med den tidigare ekvationen, då vi hade enbart boyta som förklarande faktor, ser vi att koefficienten för boytan har minskat från 40 000 till 30 000. Det innebär att när vi kontrollerar för antal badrum, påverkar fortfarande boytan priset, nu med 30 000 kronor per kvadratmeter. Hade faktorn minskat från 40 000 till 0 hade vi inte kunnat isolera boyta som påverkande faktor på prisnivå. Det finns ett antal förklaringar till detta. Ett kan vara att sambandet boyta och pris är spuriöst, dvs. det finns inget samband. Det verkar för otroligt. En alternativ förklaring är att antalet badrum har en indirekt effekt på priset via husstorlek, se figur 5.4.
34
.
Boyta
Prisnivå
Boyta
Prisnivå
Antal badrum
Antal badrum
Figur 5.4. Till vänster exempel på ett spuriöst samband där antalet badrum påverkar både boyta och prisnivå. Till höger exempel på indirekt effekt där boyta påverkar prisnivå via antal badrum. På det här sättet kan vi pröva om flera faktorer bör inkluderas i modellen såsom kvaliteten på byggnaden (mått i taxeringspoäng), läget, storlek på tomt mm.
5.3 Kausal generaliserbarhet Nu har vi gått igenom hur det är möjligt att utifrån data från en intensiv studie säga något om kontrafaktisk skillnad och isolering. Men på samma sätt som i beskrivande studier handlar det oftast om att säga något om en population utifrån ett urval. Vi har i avsnittet ovan förutsatt att vi har data om hela populationen. Så är oftast inte fallet i praktiken utan vi har enbart en mindre mängd data, ett urval. Återigen tänker vi oss exemplet med Norra Ängby, men denna gång har vi enbart ett urval av observationer med boyta och priser, de rödmarkerade observationerna i figur 5.5. För att göra förklaringen enklare utelämnar vi i det här stycket antal badrum.
Pris
Bostadsyta Figur 5.5. Populationen visar på ett samband mellan bostadsyta och pris medan urvalet visar att så inte är fallet.
På samma sätt som med hela populationen försöker vi finna en linje som på bästa sätt visar sambandet mellan boyta och pris. Kom ihåg att den heldragna svarta linjen är den sanna relationen 35
och den känner vi inte till. I det här fallet får vi fram den svartprickade linjen. Den visar på bästa sätt hur de röda punkterna är fördelade i diagrammet. Linjen har ekvationen 30 000 . Vår slutsats blir sålunda att om boytan stiger med en kvadratmeter stiger priset med 30 000 kr. Det stämmer inte med den relation vi fick fram när vi har tillgång till hela populationen men är relativt nära. Och framförallt säger den att det finns en kontrafaktisk skillnad. Vi ska därför nöja oss med att försöka konstatera om det finns kontrafaktisk skillnad eller inte. Av den anledningen är vi intresserade av om ekvationen är 0 . Hur ska vi kunna dra slutsatser utifrån vårt urval om populationens ekvation är 0 ? På samma sätt som vi använde oss av ett urval och centrala gränsvärdessatsen för att bestämma en populations medelvärde gör vi på liknande sätt här. Det innebär att om vi kunde gör flera urval och för varje urval beräknar ekvationen så skulle medelvärdet av alla dessa ekvationer, bli 40 000 . Och återigen är problemet att vi bara gör ett urval. Av den anledningen gör vi en hypotestest och säger att koefficienten är lika med noll. 1. 2. 3. 4.
Hypotes Teststorhet Kritisk värde Slutsats
Om hypotesen stämmer finns ingen kontrafaktisk skillnad. Vi beräknar en teststorhet, tar fram ett kritiskt värde. Om vi då kan avfärda hypotesen har vi kontrafaktisk skillnad. Det leder för långt att i denna text utförligen beskriva förfarandet utan jag hänvisar till texter om regressionsanalys.
5.4 Orsaksmekanism och Tidsordningen med intensiv studie I och med ovanstående studier av Norra Ängby med extensiv studie har vi förhoppningsvis lyckats isolera effekten av boyta på betalda priser. Vi är ännu inte klara med våra argument för att förklara vad som påverkar priserna. För att fortskrida och få argument för tidsordning och orsaksmekanismer, utför vi även en intensiv studie. Det innebär att vi väljer en eller flera av de försäljningar som skett för att komplettera vår extensiva studie, se figur 6.6. I dessa fall gör vi djupare studier. Vi intervjuar dem som var spekulanter. Vi vill höra deras argument för att köpa bostaden. Vi jämför ett antal köp där villorna såldes för olika priser och den stora skillnaden var bostadsytan. Vi studerar budgivningen, hur många som deltog. Hur buden stegvis ändrades.
Figur 5.6. Vi studerar ett antal fall och hur prisbildningen har skett. 36
Vi försöker finna en rimlig orsaksförklaring mellan bostadsytan och prisnivån, se figur 5.7. En större bostad gör att fler är intresserade och därmed går på visning så är fler med i budgivningen vilket leder till högre priser. Boytans storlek
Fler intresserade köpare
Fler går på visning
Högre budgivning
Högre pris
Figur 5.7. Orsaksmekanismer som leder till högre pris. Men för att kunna argumentera för orsaksmekanismer behöver vi få orsaksförklaringar. Är det verkligen så att på grund av boytans storlek så går fler på visning? Och att fler är med i budgivningen. Det viktigaste ledet här är från boytan till fler intresserade. Övriga steg avstår vi från i den här texten. De faller sig ganska naturliga. Är man intresserad går man på visning och är gärna med i budgivningen och ju fler som är med i budgivning desto högre pris. Så hur argumenterar vi för att boytans storlek gör att fler är intresserade av att köpa? Det kan förklaras med begreppen motiv och handling.
Motiv ‐ ‐
Föreställning Avsikt
Handling
Figur 5.8. För att finna orsaksmekanismer söker både detektiven och forskaren efter motiv för en handling. Det innebär att varje handling kan förklaras med ett motiv på samma sätt som detektiven söker efter ett motiv till ett mord. Motiv kan i sin tur delas upp i två faktorer. Dels en föreställning och en avsikt. Låt oss studera det genom ett vanligt ”hederligt” mord: Fru Larsson har mördat sin man herr Larsson. För att binda fru Larsson till mordet behöver polisen finna ett motiv, dvs. en föreställning och en avsikt. Fru Larsson föreställde sig att Herr Larsson var otrogen och Fru Larsson ville sätta stopp för det, hon hade en avsikt. Därför mördade hon Herr Larsson, handlingen. På samma sätt som polisen söker hitta motiv för en redan konstaterad handling, söker även vi inom forskningen för motiv till en redan skedd händelse. Men för att kunna belägga att det finns en koppling mellan motivet och handlingen, ska vi på samma sätt som tidigare granska relationen mellan motiv och handling enligt de fyra kausala kriterierna: kontrafaktiskt skillnad, isolering, tidsordning och orsaksmekanism.
37
Om vi konstaterar att fler går på visningar (en handling) när huset är större så måste vi hitta motiv för den handlingen. Motiven består dels i en föreställning hos köpare att ju större boyta desto högre boendekomfort. Dels en avsikt hos köpare att söka en bättre tillvaro. För att bevisa den orsaksmekanismen behöver vi få svar på fyra argument (du känner igen dem) på att handlingen är kopplad till motiven. 5.4.1 Kontrafaktisk skillnad Här ska vi belägga att det var just motivet om att större bostad leder till ökad komfort (föreställningen och avsikten) som ledde till handlingen att gå på visning. Det finns fyra sätt att belägga motivet. Den främsta är motivering från aktören själv: ”Jag går på visning eftersom en större boyta kommer att göra att min nytta ökar.” Ett annat sätt att belägga är allmänna motivutsagor: ”Vi tycker om stora boytor och brukar köpa när tillfälle ges.” Ytterligare sätt att belägga motiv är andra handlingar från samme aktör. Många har en tendens att bygga ut sina hus vilket tyder på att motivet verkar rimligt. Eller andra aktörers handlingar och aktörers motiv för handlingar i allmänhet (så fort det är stora hus till salu tror folk att de ska bli lyckligare genom att försöka köpa) 5.4.2 Isolering Men hur säkra kan vi vara att motivet till att gå på visning var boytan. Det finns säkert andra motiv såsom läget, standarden, antal badrum mm. Ett sätt är att be intervjuade personer att rangordna motiven för att se på styrkan hos vårt motiv. Ett annat sätt är att över tid se om ett visst motiv återkommer och i så fall hur frekvent. 5.4.3 Tidsordning På samma sätt som tidigare är här viktigt att motivet kom före handling. Hur belägger man det. Det bästa är om vi har någon källa som har hög samtidighet, dvs. källan var nära i tid av motivet och händelsen. Om det inte går att belägga finns risk för efterrationalisering. Anta att någon har köpt ett stort hus. Och anta att det var färgen på träfasaden som fick köparen att betala mycket. Det kan i efterhand oövertänkt att låta en sådan mindre detalj påverka ens köp. Av den anledningen försöker man i efterhand hitta argument varför dem betalade ganska mycket. ”Vi betalade mycket eftersom huset är stort” Det vill säga det är en efterrationalisering. 5.4.4 Orsaksmekanism Har vi argument för kontrafaktisk skillnad, isolering och tidsordning för att ett visst motiv har utlöst en viss handling, så har vi goda belägg för att förklara en handling. Men trots det kan handlingen ändå bero på något annat än sökt motiv. Kan det vara så att både händelse och motiv finns, men den international förklaringen (medvetna mänskliga beteendet) ändå inte var anledningen till att händelsen inträffade. Det här är ganska komplicerat. Låt mig förklara med en version på ett klassiskt exempel. Du och din kompis bergsklättraren. Din kompis tappar greppet och han hänger i en ögla som är kopplad till dina öglor. Det går inte att rädda din kompis. Om inte han kopplas loss för att falla till marken och dö, kommer ni båda att falla till marken och dö. Du försöker därför lossa på hans rep för att han ska falla utan att dra med dig. I den psykologiskt stressade situationen slinter du med handen och din kniv skär av repet till din kompis. Han faller ned och dör. I det här exemplet finns inget medvetet mänskligt beteende i att din kompis trillade ned. Du hann inte genomföra din plan utan ett stresstillstånd gjorde att repet skars av och han föll till marken. 38
Samma händelse i båda fallen men med en strukturell förklaring (icke medveten mänsklig) och en avsiktlig förklaring (medveten mänsklig).
Sammanfattning Låt oss sammanfatta. Vi samlar bevis för att boyta är den förklarande orsaken till prisökning genom att i en extensiv studie peka på kontrafaktisk skillnad och isolering, och att i en intensiv studie peka på tidsordning och orsakssamband.
Appendix Linjär variabel transformation Vi har den slumpmässiga variabeln stickprovsmedelvärdet ( ) som är normalfördelad med väntevärde µ och standardavvikelse ⁄√ , dvs ~ μ, ⁄√ . Vi vill transformera stickprovsmedelvärdet till teststorheten t som är standardiserat normalfördelad med väntevärdet noll och standardavvikelsen 1. För att göra det definierar vi t som μ ⁄ . Vi har då gjort en linjär variabel transformation av ( ) till t. Vi kan bevisa att t kommer att ha väntevärdet noll och standardavvikelsen 1, dvs. t~ μ ⁄ 1⁄ μ 1⁄ μ μ 0 VAR
μ ⁄
1⁄
μ
1⁄
0
⁄
0,1 .
1.
Antaganden vid antaganden om parametrar i en regressionsanalys För att kunna dra slutsatser om β utifrån ett framräknat b med hjälp av ett urval gör vi ett antal antaganden: 1. Den oberoende faktorn (x) är av oss bestämda värden och därmed inte slumpmässiga. 2. Den beroende faktorn (Y) är slumpmässig med en viss fördelning, dvs. med ett bestämt väntevärde och standardavvikelse. 3. Feltermen är fördelad oberoende av varandra. 4. Feltermens standardavvikelse är lika stor för samtliga nivåer. 5. Feltermen för varje nivå är normalfördelad. Slumpvariablen (ɛ) får olika värden vid varje observation, se figur A1. Vad som är viktigt för att vi ska kunna göra slutsatser om α och β är att slumpvariabeln har samma standardavvikelse oavsett observation (homoskedastisk) och att den är oberoende (ej autokorrelerad), dvs. den påverkas inte av värdet på andra slumpvariabler, se figur A2. Om dessa fel uppstår kan det bero på mätfel, modellfel eller faktiska variationer i verkligheten.
39
Prisnivå (kr)
Feltermen
Boyta Boyta Figur A1. Hetroskedacitet innebär att feltermens spridning är beroende av den oberoende variabelns storlek.
Prisnivå (kr)
Feltermen
Boyta
Boyta
Figur A2. Autokorrelation innebär att feltermen följer ett mönster där den är beroende av tidigare feltermer.
40
6. Svaren (Inferensen) och osäkerheten Till att börja med är rekommendationen att en forskningsrapport tydligt ska försöka besvara sin forskningsfråga. Men hur säkra kan vi överhuvudtaget vara på att det svar vi levererar stämmer? Osäkerheten kan härledas ur de krav vi ställde på våra argument i kapitel fyra om hög nivå på mätningar, intern validitet och empirisk generaliserbarhet, se figur 6.1.
Construct
Intern
Validitet
Validitet
Resultatets
styrka
Empirisk
generaliserbarhet
Figur 6.1. Osäkerhetsaspekter när forskaren vill säga något om ett fenomen.
Om begreppen på ett tillfredsställande sätt motsvarar fenomenet och har mäts på ett korrekt sätt har vi uppnått hög kvalitet på mätning (construct validitet). Om urvalet sedan är valt med omsorg och slutsatser rent statistiskt har gjorts på ett bra sätt har vi erhållit hög empririsk generaliserbarhet. Om vi då dessutom har lyckats argumentera för de fyra kausalitetskraven (kontrafaktisk skillnad, isolering, tidsordning och orsaksmekanismer) har hög intern validitet uppnåtts. Om allt detta är tillfredsställande har vi nått en god säkerhet i studien. Men tyvärr kan vi inte vara säkra på att ha funnit sanningen även om ovanstående är uppfyllt, de vetenskapliga metoder vi har presenterat har begränsningar. Vi ska därför undesöka svagheterna hos induktion och deduktion.
6.1 Problem med induktion Anta att vi påstår att alla svanar är vita eftersom vi har en mängd observationer för det påståendet. Den naive induktivisten (uttryck lånat av Chalmers) påstår att vetenskapen föds ur observationerna och att detta räcker, om vetenskapens mål är att göra generella påståenden. Hur vet vi att vi har observerat tillräckligt många svanar? Hur många svanar måste vi observera för att kunna säkert säga att alla svanar är vita? Räcker 100, 1000, 10 000? Frågan är omöjlig att besvara. Vad induktivisterna gjorde för att i viss mån överbrygga problemet var att använda sannolikhetsteorin. Med fler observationer borde sannolikheten öka för ett påstående är sant även om populationen är oändlig. Men hur ska gränsen sättas för antalet observationer för att något ska anses säkert? Inom statistik analys används oftast en 95 % konfidensintervall. Det innebär inte att vi är säkra på vårt utfall en att vi har gissat rätt 19 gånger av 20, medan vi en gång av 20 har gissat fel. 41
Det 95 % konfidensintervallet är godtyckligt satt, det finns inget vetenskapligt belägg utan skulle lika gärna kunna vara 90 eller 99 %. Det här godtyckliga är en nackdel med induktionen. Låt oss ta ett nationalekonomiskt exempel. Vi antar att vi vill säga något om alla transaktioner som sker i världen och påstår att i samtliga fall görs dessa för att maximera nyttan hos en individ. Om vi observerar 100, 1 000 eller 10 000 transaktioner, kan vi då säga att alla transaktioner kännetecknas av individens nyttomaximering, och att alla människor i framtiden alltid kommer att härledas av nyttomaximering. Den totala populationen blir därmed oändlig. Om vi relaterar 100, 1000 eller 10 000 observationer till denna oändliga mängd så blir kvoten i samtliga fall oändligt liten. Slutsatsen utifrån ovanstående resonemang är att vi inte kan säga något alls utifrån observationer, om målet med forskning är att få fram sanningen. Här finns ett val för vetenskapsmannen. Antingen, enligt rationalister, dömer man ut hela metoden med induktion eftersom den inte når fram till sanningen. Eller så nöjer man sig med en viss osäkerhet, enligt relativister. Min tolkning av vetenskapen är att vi bör sträva mot rationalism, men eftersom det är svåruppnåeligt blir vi alla mer eller mindre relativister. En annan kritik mot induktivismen är att den påstår att all vetenskap/teori kommer från observationer. Vid en historisk tillbakablick på olika forskningsområden visar att så ofta inte varit fallet. För att kunna göra rimliga observationer måste forskaren ha en viss teoretisk kunskap för att kunna veta vilka observationer han/hon ska leta efter.
6.2 Problem med deduktion Deduktion utgår från logiken där slutsatser bygger på premisser. Anta att alla människor kan välja och antas göra val utifrån sitt eget bästa. Vi antar även att det endast finns en vara, en banan, som kostar tio kronor. Individen har 100 kronor och spenderar alltid all sin inkomst på tillgängliga varor. Förutsägelsen blir då att individen kommer att inhandla tio bananer. Om vi dessutom antar att samtliga människor ställs inför samma situation kan vi förutsäga antalet inhandlade bananer. Vi har: 1. Premiss 1 – Nyttomaximerade individer 2. Premiss 2 – Budgetrestriktion
Individerna kan välja och väljer det bästa. Inkomst 100 kronor och pris 10 kronor.
3. Slutsats – Individen köper X antal bananer.
10 bananer kommer att konsumeras.
Ovanstående kan även formuleras enligt deduktionens grundform: 1. Lagar och teorier 2. Initialvillkor 3. Förutsägelser och förklaringar Styrkan i deduktionen är att om 1. och 2 stämmer är det omöjligt att påstå att 3. är felaktig. Följaktligen ligger svagheten hos deduktionen i säkerheten hos lagar och teorier samt initialvillkor. Lagar och teorier är påståenden, inom varje forskningsområde, som anses säkra. I en vetenskap som fysik med relativt starka teorier blir deduktionen säkrare än t.ex. nationalekonomi med relativt svaga teorier. Nationalekonomins svaghet ligger bl.a. i antagandet om rationella aktörer, dvs. alla aktörer gör val som är bäst för de själva i alla situationer. Det har visats inom forskningsfältet Behavioural Economics att individer i många sammanhang inte är rationella, se Kahneman (2013).
42
Även initialvillkoren innehåller osäkerhet som påverkar förutsägelsen. I exemplet ovan finns två initialvillkor: vilken inkomst varje medborgare har samt vad en banan kostar. Förutsägelsen blir beroende på storleken av de två villkoren. Lösningen är att inte bestämma initialvillkorens storlek utan beskriva de som två vektorer som kan anta olika värden. Då kan man visa hur mycket banankonsumtionen kommer att vara vid olika inkomst‐ och prisnivåer. Vi kan dock fortfarande inte göra exakta förutsägelser eftersom vi inte exakt kan bestämma initialvillkoren.
43
7. Bidraget Slutligen ska vi utifrån vår frågeställning och vårt svar fundera på vilket bidrag vår studie har gett. Det kan vara externt bidrag, dvs. till praktiker i branschen eller internt bidrag (kumulativitet) vilket avser bidrag till teoribyggandet på området. För att kunna förklara hur det sker måste vi först beskriva vad en teori är. Sedan hur den utvecklas genom bidrag från ny forskning. Teori kan enkelt förklaras som en mängd påståenden. Den kan dels vara beskrivande, där påståenden förhållanden görs. Den kan också vara förklarande där påståenden görs om kausala samband. Nationalekonomin är både en beskrivande och förklarande teori. Den baseras bland annat på beskrivande påståenden om individer: individer kan välja, individer önskar nyttomaximera mm. Den baseras även på påståenden om företag: att de försöker vinstmaximera. Inom nationalekonomin är ett förklarande påstående: att en marknad som kännetecknas av perfekt konkurrens utan externa effekter kommer att tillverka en kvantitet som är samhällsekonomiskt effektiv. Man kan se utvecklingen av teorier utifrån en mängd forskningsstudier som pekar åt samma håll, se figur 7.1.
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + ‐ ‐ + + + + + + + + + + + + + + + + + + + + + + + + + + Figur 7.1. Många studier leder fram till en härskande kärna av påståenden. Den kärnan är skyddad av ett hölje av hjälpande påståenden. Här visar boxen till vänster de studier som genomförs i ett forskningsområde. Till höger illustreras teorin inom forskningsfältet, en härskande kärna, den svarta cirkeln, och en mängd hjälpteser i den yttre ringen. Pilen visar hur studier till vänster antingen stärker eller försvagar rådande teorier. Anta att forskningsfältet är nationalekonomi och studierna till vänster studerar individers val. Ett plus betyder att studiens slutsats följer nationalekonomins härskande teorier, att individer nyttomaximerar. Vi har dessutom ett antal minustecken som motsäger teorin. Om vi skulle hålla oss till Karl Poppers5 strikta syn på vetenskap ska sålunda hela teorin anses falsifierad dvs. bevisad osann pga. några motsägande studier. Imre Lakatos6 och Thomas Kuhn7 anser istället att man ska se en studie som en del i en större struktur av studier. Det innebär att studier som stödjer rådande teorier stärker dessa. Och observationer som motsäger teorin läggs i observationslådan. Kanske visar det sig att dessa undersökningar inte håller i längden, de var dåligt utförda. Eller så kanske nya hypoteser inom den härskande teorin uppstår. Inom nationalekonomin har det visat sig att människor inte alltid agerar för att nyttomaximera. Utifrån den forskningen har delområdet Behavioural Econoimcs vuxit fram som pekar på individers brister vid beslutsfattandet. 5
Karl Popper är en av de mest inflytelserika vetenskapsteoretikerna under 1900-talet. Imre Lakatos är en av de mest inflytelserika vetenskapsteoretikerna under 1900-talet. 7 Thomas Kuhn är en av de mest inflytelserika vetenskapsteoretikerna under 1900-talet. 6
44
Behavioural Economics har inte ersatt grundstenarna i nationalekonomins teori utan snarare berikat den genom att förklara avvikelser. Men om avvikelserna blir fler kommer hela det teoretiska bygget inom paradigmet att försvagas och paradigmet hamnar i en kris, se figur 7.2.
För‐
Normal‐
Kris‐
Ny normal‐
Ny kris och
vetenskap
vetenskap
revolution
vetenskap
revolution
Figur 7.2. Kuhns syn på vetenskaplig utveckling. Här visas den vetenskapliga utvecklingen enligt Kuhn. Ämnesområdet börjar med en förvetenskap där forskningen ännu inte har bestämt några tydliga teorier. Med ökad forskning når fältet en normalvetenskap med en härskande kärna av teorier. Om många studier pekat mot normalvetenskapen uppstår en revolution med, förhoppningsvis, ny normalvetenskap. Det paradigmskifte som beskrivits ovan är ganska ovanligt, och stor del av forskningsarbetet handlar mer om att förklara ännu ej testade frågor inom rådande teorier, se figur 7.3.
Figur 7.3. Vita luckor i forskningens kärna.
Teoretisk generaliserbarhet – hur väl bidrar studien till teorin? Vi ska här ge en kort beskrivning av teoretisk generalisering. Rent praktiskt kan vi se det som att vi får drar slutsatser om en teoretisk population utifrån vårt projekt, vårt urval. Frågan är på vilken abstraktionsgrad vår studie bidrar till teorin, se figur 7.4.
45
Teoretisk population: Individers agerande
Teoretisk population: Prisbildning på fastighetsmarknaden generellt. Teoretisk population: Prisbildning i Sverige.
Figur 7.4. Teorianknytning, som fall av teoretisk population, nederst deskrivptiv beskrivning, de två övre stegen som bidrag till förklarande teori.
I det enklaste fallet kan vi med vår studie säga något om hur prisbildningen sker på småhusmarknaden. Med en regressionsanalys tolkar vi att inkomstförändringar påverkar pris med 10 %. Kanske säger vår studie något om hur priser sätts på en marknad med olika starka aktörer. Vi är då inne på asymmetrisk information och prissättning vilket är en del av nationalekonomin. Slutligen kanske vi kan säga något om individers agerande generellt, den översta klossen i pyramiden.
46
References Bhattacherjee, A., (2012) Social Science Research: Principles, Methods and Practices. University of South Florida Scholar Commons Björnsson, G., Kihlbom, U., Tersman, F. och Ullholm, A., (1994) Argumentationsanalys. Natur och Kultur Chalmers, A.F., (1995) Vad är vetenskap egentligen? Bokförlaget Nya Doxa. Fangen, K., (2005). Deltagande observation. Liber Flyvbjerg, B., Skamris Holm, M. and Buhl, S., (2002) Underestimating costs in Public Works Projects Error or Lie? Journal of the American Planning Association Vol. 68, No 3. Flyvbjerg, B., Skamris Holm, M. and Buhl, S., (2003) How common and how large are cost overruns in transport infrastructure projects? Transport Reveiws Vol 23, No 1, 71‐88 Kahneman, D. (2013). Tänka, Snabbt och Långsamt. Volante Kahneman, D. and Tversky, A. (1973) Availibility: A Heuristic for Judging Frequency and Probability. Cognitive Phsychology 5 page 207‐232. Körner, S. och Wahlgren, L., Statistisk Dataanalys. Studentlitteratur Maltén A., (1998). Kommunikation och konflikthantering – en introduktion. Studentlitteratur Murray, N. och Begler. D., (2009) Writing Dissertations & Theses. Pearson Nijkamp P. and Ubbels B., (1999) How Reliable are Estimates of Infrastructure Costs? A Comparative Analysis. International Journal of Transport Economics, 26, 23‐53 Salzman, D. and Zwinkels, R., (2013) Behavioural Real Estate. Duisenberg school of finance – Tinbergen Institute Discussion Paper. Teorell, J. och Svensson T. (2007). Att fråga och att svara. Liber AB Thurén T., (2007). Vetenskapsteori för nybörjare. Liber AB Wärneryd m fl. (1993). att fråga ? SCB Statistiska Centralbyrån
47