Eins og ef til vill einhverjir vita var síðastliðinn miðvikudag gefin út skýrsla um fjölda dauðra í Íraksstríðinu. Niðurstöður þessarar skýrslu benda til þess að mannfall í Íraksstríðinu sé langt um meira en tölur frá Bandaríkjastjórn gefa til kynna. Þar af leiðandi hafa margir gagnrýnt skýrsluna er fáir leggja fram rök og þau rök sem fram hafa komið hafa felst verið byggð á misskilningi um framkvæmd rannsóknarinnar. Ég tel því að það sé allra þágu að taka hér saman nokkrar upplýsingar um á hverju þessi skýrsla byggir niðurstöður sínar.

Í stuttu máli var rannsóknin gerð með því að heimsækja 1.849 heimili um allt Írak og spyrja heimilisfólkið hvort einhverrir ábúenda síðustu (1) ára hefðu látist. Einnig var skráð ástæða látsins og þá sérstaklega hvort það hafi verið af náttúrulegum ástæðum (2) eða völdum ofbeldisverka. Með þessu telja rannsakendur sig hafa fengið raunsæja mynd af fjölda látinna og mynd sem er algerlega óháð opinberum tölum og öllum skrám.

Út frá þessum úrtaki voru svo fengnar niðurstöður með tölfræðilegum aðferðum. Ég hef orðið var við að margir eiga erfitt með að sætta sig við þær aðferðir en þá vil ég upplýsa um að tölfræði er útbreytt tól og notuð í velflestum vísindagreinum. Ásakanir um að úrtak sé lítið og að litlar sveiflur muni gjörbreyta niðurstöðunum eru líka einfaldlega rangar. Stærð úrtaks var nefnilega valið þannig að niðurstöðurnar verða að öllum líkindum nákvæmar og óháðar sveiflum svona sveiflum. (3)

Þessar tölfræðilegu aðferðir skiluðu því að líklegast er að fjöldi látinna sökum ofbeldisverka í stríðinu í Írak er 601.027. “95%-öryggisbilið” (4) um þessa tölu er 426.369 upp í 793.663. Það er nákvæmlega hér sem stærð úrtaksins kemur inn í reikningana því þetta bil minnkar eftir því sem úrtakið stækkar. Það er svo svolítill vandi að túlka þetta bil. Í skýrslunni er sagt að 95% líkur séu á að rétt dánartala sé innan þessa bils og sumir fjölmiðlar halda því fram að þetta sé eins konar skekkja og að dánartalan gæti verið hvar sem er innan þessa bils.

Báðar þessar túlkanir eru rangar. Fyrir það fyrsta er eins og áður sagði líklegast að dánartalan sé 601.027. Hins vegar er málum svo háttað að mun líklegra sé að rétt gildi sé nálægt 601.027 heldur en nálægt 426.369. Það er svo heldur ekkert útilokað að talan sé utan við þetta bil og því ekki hægt að líta á þetta sem plús/mínus óvissu. Nú stefna þessar útskýringar þó í sömu gildru og útskýringar skýrsluhöfunda. Það ku nefnilegalega vera röng eða í það minnsta ónákvæm túlkun á öryggisbilum að segja að 95% líkur séu á að stærðin sé innan bilsins. Hugsunin sleppur en fræðin byggjast á því að ef við gætum gert tilraunina óendanlega oft þá myndi rétt tala lenda í bilinu í 95% tilvika og oftar nálægt 601.027 heldur en fjær.

Tölfræðin bakvið niðurstöður tilraunarinnar er í stuttu máli svona upp sett og niðurstaðan rétt að einu skilyrði uppfylltu. Það skilyrði er að úrtakið sé réttilega slembið. Þetta skilyrði er jafnframt eina skottmarkið sem gagnrýnendur ættu að hafa á skýrsluna.

Hins vegar stendur skýrslan af sér þessi skot því við val úrtaksins var beitt velþekktri aðferð. Þetta er svonefnd “cluster survey method” og er henni lýst ágætlega ágætlega í viðauka við skýrsluna. Hún er heldur ekkert ný af nálinni og er studd af m.a. Bandaríkjastjórn, Kandastjórn og Sameinuðuþjóðunum og hefur verið notuð við mat mannsfalls í fleiri styrjöldum. Til frekari staðfestingar á að aðferðin sé vel heppnuð má benda á að sömu menn beittu sömu aðferð í svipaðri en minni rannsókn í Írak 2004. Þá var úrtakið annað en niðurstöðurnar passa saman. (5)

Meira ætla ég ekki að segja í bili en vil bara enn ítreka hvatningu mína til fólks um að lesa skýrsluna. Hana má finna á http://web.mit.edu/CIS/pdf/Human_Cost_of_War.pdf . Áróður má alltaf lita og ekkert kemur í staðinn fyrir að kynna sér málin sjálfur.

(1) Til að teljast ábúandi þurfti viðkomandi að hafa búið á heimilinu í þrjá mánuði samfellt fyrir lát sitt.
(2) Náttúrulegar ástæður fela einnig í sér slys, svo sem umferðarslys.
(3) Eins og með margt annað eru ákveðin skynsamleg mörk á stærð úrtaks. Munurinn á úrtaki af stærð 1 og 2 er eins og gefur að skilja gríðarlegur en hins vegar er munurinn á 1.849 og 1.850 óverulegur. Það hefði því sem dæmi þjónað litlum tilgangi að fara með úrtakið úr 1.849 upp í 2.849 og litlar auka upplýsingar hefðu falist í því.
(4) 95% er velþekkt minni í tölfræði og er sú nákvæmni sem algengast er að krefjast í félagsfræðilegum rannsóknum. Til gamans má svo geta að af þessari ástæðu telja margir félagsfræðingar töluna 1.964 (sem er tala sem kemur fram þegar reiknað er með 95% nákvæmninni) jafn merkilega og pí. Það á vitaskuld ekki við nein rök að styðjast.
(5) Samkvæmt rannsókninni 2004 dóu rúmlega 100.000 frá upphafi styrjaldar til ágústs 2004 og samkvæmt rannsókninni nú dóu 112.000 á sama tímabili.