Binärvalsmodeller, där den beroende variabeln antar värdena 0 eller 1, är mycket vanliga i empirisk forskning, men bygger på starka statistiska antaganden. Den klassiska estimatorn undviker flera av dessa antaganden och är den teoretiskt mest effektiva – men i praktiken ofta svår att implementera. Denna uppsats föreslår en alternativ och enklare variant av denna estimator.
Den klassiska semiparametriska Klein-Spady (KS)-estimatorn visar hur binärvalsmodeller kan skattas under minimala statistiska antaganden. Den har dock visats vara numeriskt instabil då beräknade sannolikheter inte är begränsade att ta värden mellan 0 och 1. Denna uppsats föreslår en förenklad variant av Klein-Spady-estimatorn, vilken vi kallar SKS (”simplified Klein-Spady”). Den nya metoden är lätt att implementera, numeriskt stabil och har mycket goda egenskaper i små stickprov. Dessutom är den konsistent, asymptotiskt normal och uppnår under standardantaganden den semiparametriska effektivitetsgränsen.
Simuleringar visar nya estimatorns fördelar
Storskaliga simuleringsstudier visar att SKS presterar bättre än KS över många olika datagenererande processer och startvärden. Den konvergerar oftast till samma estimerade parametrar oberoende av startvärden. Probitmodellen, en vanlig icke-linjär binärvalsmodell, fungerar utmärkt endast när den stokastiska feltermen är normalfördelad; annars försämras de skattade parametrarna med stickprovsstorleken. Minsta kvadratmetoden, en vanlig linjär binärvalsmodell, är stabil men inkonsistent i allmänhet. SKS är däremot endast marginellt sämre än probitmodellen när den stokastiska feltermen är normalfördelad.
Empirisk tillämpning på ungas sparande
Uppsatsen applicerar den nya estimatorn på data från ett experiment i syfte att undersöka ungdomars sparbeteenden. Resultaten visar att KS ger instabila parameterestimat medan SKS är mycket stabil. Med resultaten från SKS bekräftas att otålighet minskar sannolikheten att ungdomar sparar pengar. Samtidigt faller den tidigare rapporterade positiva effekten av höga betyg i matematik bort – en skillnad som förklaras av att probitmodellen antar normalitet och kan därför ge vilseledande information om statistisk säkerställdhet när den sanna stokastiska feltermen inte är normalfördelad.