Kontakty

Intervaly spoľahlivosti pre frekvencie a proporcie. Vzorky a intervaly spoľahlivosti

INTERVALY dôvery pre FREKVENCIE A ZLOMKY

© 2008

Národný inštitút verejného zdravia, Oslo, Nórsko

Článok popisuje a rozoberá výpočet intervalov spoľahlivosti pre frekvencie a proporcie pomocou metód Wald, Wilson, Clopper - Pearson, pomocou uhlovej transformácie a Waldovej metódy s korekciou Agresti - Coull. Predložený materiál dáva všeobecné informácie o metódach výpočtu intervalov spoľahlivosti pre frekvencie a podiely a má vzbudiť záujem čitateľov časopisov nielen o využívanie intervalov spoľahlivosti pri prezentovaní výsledkov vlastného výskumu, ale aj o prečítanie odbornej literatúry pred začatím prác na budúcich publikáciách.

Kľúčové slová : interval spoľahlivosti, frekvencia, podiel

Jedna z predchádzajúcich publikácií stručne spomenula popis kvalitatívnych údajov a uviedla, že ich intervalový odhad je vhodnejší ako bodový odhad na popis frekvencie výskytu sledovanej charakteristiky v populácii. Keďže výskum sa vykonáva s použitím vzorových údajov, projekcia výsledkov na populáciu musí obsahovať prvok nepresnosti výberu vzoriek. Interval spoľahlivosti je mierou presnosti odhadovaného parametra. Je zaujímavé, že niektoré knihy o základných štatistikách pre lekárov úplne ignorujú tému intervalov spoľahlivosti pre frekvencie. V tomto článku sa pozrieme na niekoľko spôsobov, ako vypočítať intervaly spoľahlivosti pre frekvencie, čo zahŕňa také charakteristiky vzorky, ako je neopakovanie sa a reprezentatívnosť, ako aj nezávislosť pozorovaní od seba navzájom. V tomto článku sa frekvencia chápe nie ako absolútne číslo, ktoré ukazuje, koľkokrát sa určitá hodnota vyskytuje v súhrne, ale ako relatívna hodnota, ktorá určuje podiel účastníkov štúdie, u ktorých sa študovaná charakteristika vyskytuje.

V biomedicínskom výskume sa najčastejšie používajú 95% intervaly spoľahlivosti. Tento interval spoľahlivosti je oblasť, do ktorej skutočný podiel spadá 95 % času. Inými slovami, s 95% spoľahlivosťou môžeme povedať, že skutočná hodnota frekvencie výskytu znaku v populácii bude v rámci 95% intervalu spoľahlivosti.

Väčšina štatistických príručiek pre medicínskych výskumníkov uvádza, že frekvenčná chyba sa vypočítava pomocou vzorca

kde p je frekvencia výskytu charakteristiky vo vzorke (hodnota od 0 do 1). Väčšina domácich vedeckých článkov uvádza frekvenciu výskytu znaku vo vzorke (p), ako aj jeho chybu (s) v tvare p ± s. Vhodnejšie je však prezentovať 95 % interval spoľahlivosti pre frekvenciu výskytu znaku v populácii, ktorý bude zahŕňať hodnoty od

predtým.

Niektoré príručky odporúčajú pre malé vzorky nahradiť hodnotu 1,96 hodnotou t pre N – 1 stupeň voľnosti, kde N je počet pozorovaní vo vzorke. Hodnota t sa zistí pomocou tabuliek pre rozdelenie t, ktoré sú dostupné takmer vo všetkých učebniciach štatistiky. Použitie t distribúcie pre Waldovu metódu neposkytuje viditeľné výhody v porovnaní s inými metódami diskutovanými nižšie, a preto ho niektorí autori neodporúčajú.

Vyššie uvedená metóda na výpočet intervalov spoľahlivosti pre frekvencie alebo proporcie sa nazýva Wald na počesť Abrahama Walda (1902–1950), pretože široké uplatnenie začalo to po vydaní Walda a Wolfowitza v roku 1939. Samotnú metódu však navrhol Pierre Simon Laplace (1749–1827) už v roku 1812.

Waldova metóda je veľmi populárna, no jej aplikácia je spojená so značnými problémami. Metóda sa neodporúča pre malé veľkosti vzoriek, ako aj v prípadoch, keď frekvencia výskytu charakteristiky má tendenciu k 0 alebo 1 (0 % alebo 100 %) a je jednoducho nemožná pre frekvencie 0 a 1. aproximácia normálneho rozdelenia, ktorá sa používa pri výpočte chyby, „nefunguje“ v prípadoch, keď n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Keďže nová premenná je normálne rozdelená, dolná a horná hranica 95 % intervalu spoľahlivosti pre premennú φ bude φ-1,96 a φ+1,96 vľavo">

Namiesto 1,96 pre malé vzorky sa odporúča nahradiť hodnotu t za N – 1 stupeň voľnosti. Táto metóda neprodukuje záporné hodnoty a umožňuje presnejšie odhady intervalov spoľahlivosti pre frekvencie ako Waldova metóda. Okrem toho je opísaný v mnohých domácich referenčných knihách lekárske štatistiky, čo však neviedlo k jeho širokému použitiu v medicínskom výskume. Výpočet intervalov spoľahlivosti pomocou uhlovej transformácie sa neodporúča pre frekvencie blížiace sa k 0 alebo 1.

Tu popis metód na odhadovanie intervalov spoľahlivosti vo väčšine kníh o základoch štatistiky pre medicínskych výskumníkov zvyčajne končí a tento problém je typický nielen pre domácich, ale aj pre zahraničnej literatúry. Obe metódy sú založené na centrálnej limitnej vete, čo znamená veľkú vzorku.

Berúc do úvahy nedostatky odhadovania intervalov spoľahlivosti pomocou vyššie uvedených metód, Clopper a Pearson navrhli v roku 1934 metódu na výpočet takzvaného presného intervalu spoľahlivosti, vzhľadom na binomické rozdelenie skúmaného znaku. Táto metóda je dostupná v mnohých online kalkulačkách, ale takto získané intervaly spoľahlivosti sú vo väčšine prípadov príliš široké. Zároveň sa táto metóda odporúča použiť v prípadoch, keď je potrebné konzervatívne posúdenie. Stupeň konzervatívnosti metódy sa zvyšuje so znižovaním veľkosti vzorky, najmä keď N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в tabuľky nie je „tabuľkový“ v užívateľsky príjemnej forme, a preto ho pravdepodobne väčšina výskumníkov nepoužíva.

Podľa mnohých štatistikov sa najoptimálnejšie hodnotenie intervalov spoľahlivosti pre frekvencie vykonáva Wilsonovou metódou, navrhnutou už v roku 1927, ale prakticky sa nepoužíva v domácom biomedicínskom výskume. Táto metóda nielenže umožňuje odhadnúť intervaly spoľahlivosti pre veľmi malé aj veľmi veľké frekvencie, ale je použiteľná aj pre malý počet pozorovaní. IN všeobecný pohľad Interval spoľahlivosti podľa Wilsonovho vzorca má tvar



kde pri výpočte 95 % intervalu spoľahlivosti nadobúda hodnotu 1,96, N je počet pozorovaní a p je frekvencia výskytu charakteristiky vo vzorke. Táto metóda je dostupná v online kalkulačkách, takže jej použitie nie je problematické. a neodporúčame používať túto metódu pre n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Okrem Wilsonovej metódy sa predpokladá, že Waldova metóda s korekciou Agresti–Coll poskytuje optimálny odhad intervalu spoľahlivosti pre frekvencie. Korekcia Agresti-Coll je vo Waldovom vzorci nahradením frekvencie výskytu charakteristiky vo vzorke (p) za p`, pri výpočte, ktorá 2 sa pripočíta k čitateľovi a 4 k menovateľovi, tj. p` = (X + 2) / (N + 4), kde X je počet účastníkov štúdie, ktorí majú skúmanú charakteristiku, a N je veľkosť vzorky. Táto modifikácia poskytuje výsledky veľmi podobné Wilsonovmu vzorcu, s výnimkou prípadov, keď sa frekvencia udalostí blíži k 0 % alebo 100 % a vzorka je malá. Okrem vyššie uvedených metód na výpočet intervalov spoľahlivosti pre frekvencie boli navrhnuté korekcie kontinuity pre Waldovu aj Wilsonovu metódu pre malé vzorky, ale štúdie ukázali, že ich použitie je nevhodné.

Uvažujme o použití vyššie uvedených metód na výpočet intervalov spoľahlivosti pomocou dvoch príkladov. V prvom prípade študujeme veľkú vzorku 1 000 náhodne vybraných účastníkov štúdie, z ktorých 450 má skúmanú vlastnosť (môže to byť rizikový faktor, výsledok alebo akákoľvek iná vlastnosť), čo predstavuje frekvenciu 0,45 alebo 45 %. V druhom prípade sa štúdia uskutočňuje na malej vzorke, povedzme, iba 20 ľudí a iba 1 účastník štúdie (5 %) má skúmanú vlastnosť. Intervaly spoľahlivosti podľa Waldovej metódy, podľa Waldovej metódy s Agresti-Coll korekciou, podľa Wilsonovej metódy boli vypočítané pomocou online kalkulačky vyvinutej Jeffom Saurom (http://www. /wald. htm). Wilsonove intervaly spoľahlivosti korigované na kontinuitu boli vypočítané pomocou kalkulačky poskytnutej Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Výpočty uhlovej Fisherovej transformácie sa uskutočnili manuálne s použitím kritickej hodnoty t pre 19 a 999 stupňov voľnosti. Výsledky výpočtu sú uvedené v tabuľke pre oba príklady.

Intervaly spoľahlivosti vypočítané šiestimi rôzne cesty pre dva príklady opísané v texte

Metóda výpočtu intervalu spoľahlivosti

P = 0,0500 alebo 5 %

95 % CI pre X = 450, N = 1 000, P = 0,4500 alebo 45 %

–0,0455–0,2541

Wald s korekciou Agresti–Coll

<,0001–0,2541

Wilson s korekciou kontinuity

Clopper-Pearson "presná metóda"

Uhlová transformácia

<0,0001–0,1967

Ako je možné vidieť z tabuľky, v prvom príklade interval spoľahlivosti vypočítaný pomocou „všeobecne akceptovanej“ Waldovej metódy vstupuje do zápornej oblasti, čo nemôže byť prípad frekvencií. Bohužiaľ, takéto incidenty nie sú v ruskej literatúre nezvyčajné. Tradičný spôsob prezentácie údajov z hľadiska frekvencie a jeho chybovosť tento problém čiastočne maskuje. Napríklad, ak je frekvencia výskytu znaku (v percentách) prezentovaná ako 2,1 ± 1,4, potom to nie je také „urážlivé pre oči“ ako 2,1 % (95 % CI: –0,7; 4,9), hoci a znamená to isté. Waldova metóda s Agresti–Coll korekciou a výpočtom pomocou uhlovej transformácie poskytuje dolnú hranicu smerujúcu k nule. Wilsonova metóda korigovaná na kontinuitu a „presná metóda“ vytvárajú širšie intervaly spoľahlivosti ako Wilsonova metóda. V druhom príklade všetky metódy poskytujú približne rovnaké intervaly spoľahlivosti (rozdiely sa objavujú iba v tisícinách), čo nie je prekvapujúce, pretože frekvencia výskytu udalosti v tomto príklade sa príliš nelíši od 50 % a veľkosť vzorky je celkom veľké.

Čitateľom, ktorí sa zaujímajú o tento problém, môžeme odporučiť práce R. G. Newcomba a Browna, Caia a Dasguptu, ktoré poskytujú výhody a nevýhody použitia 7 a 10 rôznych metód na výpočet intervalov spoľahlivosti, resp. Z domácich príručiek radíme knihu a, ktorá okrem podrobného popisu teórie predstavuje metódy Walda a Wilsona, ako aj metódu výpočtu intervalov spoľahlivosti s prihliadnutím na binomické rozdelenie frekvencií. Okrem bezplatných online kalkulačiek (http://www. /wald. htm a http://faculty. vassar. edu/lowry/prop1.html) možno intervaly spoľahlivosti pre frekvencie (nielen!) vypočítať pomocou Program CIA (Confidence Intervals Analysis), ktorý si môžete stiahnuť z http://www. lekárska škola. soton. ac. uk/cia/ .

Nasledujúci článok sa bude zaoberať jednorozmernými spôsobmi porovnávania kvalitatívnych údajov.

Bibliografia

Banerji A. Lekárska štatistika jasným jazykom: úvodný kurz / A. Banerjee. – M.: Praktické lekárstvo, 2007. – 287 s. Lekárska štatistika / . – M.: Lekárska informačná agentúra, 2007. – 475 s. Glanz S. Lekárska a biologická štatistika / S. Glanz. – M.: Praktika, 1998. Dátové typy, testovanie distribúcie a popisná štatistika // Human Ecology – 2008. – No. 1. – S. 52–58. Zhizhin K.S.. Lekárska štatistika: učebnica / . – Rostov n/d: Phoenix, 2007. – 160 s. Aplikovaná lekárska štatistika / , . - St. Petersburg. : Foliot, 2003. – 428 s. Lakin G. F. Biometria / . – M.: Vyššia škola, 1990. – 350 s. Medik V. A. Matematická štatistika v medicíne / , . – M.: Financie a štatistika, 2007. – 798 s. Matematická štatistika v klinickom výskume / , . – M.: GEOTAR-MED, 2001. – 256 s. Junkerov V. A. Lekárske a štatistické spracovanie údajov lekárskeho výskumu / , . - St. Petersburg. : VmedA, 2002. – 266 s. Agresti A. Pre intervalový odhad binomických proporcií je približné lepšie ako presné / A. Agresti, B. Coull // Americký štatistik. – 1998. – N 52. – S. 119–126. Altman D.Štatistika s istotou // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londýn: BMJ Books, 2000. – 240 s. Brown L.D. Intervalový odhad pre binomický podiel / L. D. Brown, T. T. Cai, A. Dasgupta // Štatistická veda. – 2001. – N 2. – S. 101–133. Clopper C. J. Použitie spoľahlivosti alebo fiduciálnych limitov ilustrované v prípade binomickej / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – S. 404–413. Garcia-Perez M.A. O intervale spoľahlivosti pre binomický parameter / M. A. Garcia-Perez // Kvalita a kvantita. – 2005. – N 39. – S. 467–481. Motulsky H. Intuitívna bioštatistika // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 s. Newcombe R.G. Obojstranné intervaly spoľahlivosti pre jednu proporciu: Porovnanie siedmich metód / R. G. Newcombe // Štatistika v medicíne. – 1998. – N. 17. – S. 857–872. Sauro J. Odhadovanie miery dokončenia z malých vzoriek pomocou binomických intervalov spoľahlivosti: porovnania a odporúčania / J. Sauro, J. R. Lewis // Zborník výročného stretnutia spoločnosti pre ľudské faktory a ergonómiu. – Orlando, FL, 2005. Wald A. Limity spoľahlivosti pre spojité distribučné funkcie // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – S. 105–118. Wilson E.B. Pravdepodobná inferencia, zákon nástupníctva a štatistická inferencia / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – S. 209–212.

INTERVALY DÔVERY PRE PROPORCIE

A. M. Grjibovski

Národný inštitút verejného zdravia, Oslo, Nórsko

Článok predstavuje niekoľko metód na výpočty intervalov spoľahlivosti pre binomické proporcie, a to Waldovu, Wilsonovu, arcsínusovú, Agresti-Coullovu a presnú Clopper-Pearsonovu metódu. Príspevok poskytuje len všeobecný úvod do problematiky odhadu intervalu spoľahlivosti binomickej proporcie a jeho cieľom je nielen podnietiť čitateľov k používaniu intervalov spoľahlivosti pri prezentácii výsledkov vlastného empirického výskumu, ale aj podnietiť ich k nahliadnutiu do štatistických kníh. pred analýzou vlastných údajov a prípravou rukopisov.

Kľúčové slová: interval spoľahlivosti, podiel

Kontaktné informácie:

Senior Advisor, National Institute of Public Health, Oslo, Nórsko

"Katren-Style" pokračuje vo vydávaní série Konstantina Kravchika o lekárskej štatistike. V dvoch predchádzajúcich článkoch sa autor zaoberal vysvetlením pojmov ako a.

Konštantín Kravčík

Matematik-analytik. Špecialista na štatistický výskum v medicíne a humanitných vedách

Mesto Moskva

Veľmi často v článkoch o klinických štúdiách nájdete záhadnú frázu: „interval spoľahlivosti“ (95 % CI alebo 95 % CI - interval spoľahlivosti). Napríklad článok môže napísať: „Na posúdenie významnosti rozdielov sa použil Studentov t-test na výpočet 95 % intervalu spoľahlivosti.“

Aká je hodnota „95 % intervalu spoľahlivosti“ a prečo ho počítať?

Čo je interval spoľahlivosti? - Toto je rozsah, v ktorom ležia skutočné populačné prostriedky. Existujú „nepravdivé“ priemery? V istom zmysle áno, robia. Vysvetlili sme, že nie je možné merať parameter záujmu v celej populácii, takže výskumníci si vystačia s obmedzenou vzorkou. V tejto vzorke (napríklad na základe telesnej hmotnosti) existuje jedna priemerná hodnota (určitá hmotnosť), podľa ktorej posudzujeme priemernú hodnotu v celej populácii. Je však nepravdepodobné, že by sa priemerná hmotnosť vo vzorke (najmä malej) zhodovala s priemernou hmotnosťou vo všeobecnej populácii. Preto je správnejšie vypočítať a použiť rozsah priemerných hodnôt populácie.

Predstavte si napríklad, že 95 % interval spoľahlivosti (95 % CI) pre hemoglobín je 110 až 122 g/l. To znamená, že existuje 95% šanca, že skutočná stredná hodnota hemoglobínu v populácii bude medzi 110 a 122 g/l. Inými slovami, nepoznáme priemernú hodnotu hemoglobínu v populácii, ale môžeme s 95 % pravdepodobnosťou uviesť rozsah hodnôt pre túto vlastnosť.

Intervaly spoľahlivosti sú obzvlášť dôležité pre rozdiely v priemeroch medzi skupinami alebo veľkosti účinku, ako sa nazývajú.

Povedzme, že sme porovnali účinnosť dvoch prípravkov železa: jedného, ​​ktorý je na trhu už dlho, a jedného, ​​ktorý je práve zaregistrovaný. Po ukončení terapie sme hodnotili koncentráciu hemoglobínu v skúmaných skupinách pacientov a štatistický program vypočítal, že rozdiel medzi priemernými hodnotami oboch skupín bol s 95 % pravdepodobnosťou v rozmedzí od 1,72 do 14,36 g/l (tabuľka 1).

Tabuľka 1. Test na nezávislé vzorky
(skupiny sa porovnávajú podľa hladiny hemoglobínu)

Treba to interpretovať nasledovne: u niektorých pacientov v bežnej populácii, ktorí užívajú nový liek, bude hemoglobín vyšší v priemere o 1,72–14,36 g/l ako u tých, ktorí užili už známy liek.

Inými slovami, vo všeobecnej populácii je rozdiel v priemerných hodnotách hemoglobínu medzi skupinami v rámci týchto limitov s pravdepodobnosťou 95 %. Či je to veľa alebo málo, posúdi výskumník. Pointou toho všetkého je, že nepracujeme s jednou priemernou hodnotou, ale s rozsahom hodnôt, preto spoľahlivejšie odhadneme rozdiel v parametri medzi skupinami.

V štatistických balíkoch môžete podľa uváženia výskumníka nezávisle zúžiť alebo rozšíriť hranice intervalu spoľahlivosti. Znižovaním pravdepodobností intervalu spoľahlivosti zužujeme rozsah priemerov. Napríklad pri 90 % CI bude rozsah priemerov (alebo rozdiel v priemeroch) užší ako pri 95°%.

Naopak, zvýšenie pravdepodobnosti na 99 % rozširuje rozsah hodnôt. Pri porovnávaní skupín môže spodná hranica CI prekročiť nulovú značku. Napríklad, ak sme rozšírili hranice intervalu spoľahlivosti na 99 %, potom sa hranice intervalu pohybovali od –1 do 16 g/l. To znamená, že vo všeobecnej populácii existujú skupiny, medzi ktorými je rozdiel v priemeroch pre skúmanú charakteristiku rovný 0 (M = 0).

Pomocou intervalu spoľahlivosti môžete testovať štatistické hypotézy. Ak interval spoľahlivosti prekročí nulovú hodnotu, potom je pravdivá nulová hypotéza, ktorá predpokladá, že skupiny sa nelíšia v skúmanom parametri. Príklad je opísaný vyššie, kde sme rozšírili hranice na 99 %. Niekde v bežnej populácii sme našli skupiny, ktoré sa nijako nelíšili.

95 % interval spoľahlivosti rozdielu hemoglobínu, (g/l)


Obrázok ukazuje 95% interval spoľahlivosti pre rozdiel v stredných hodnotách hemoglobínu medzi týmito dvoma skupinami. Čiara prechádza cez nulovú značku, preto je medzi priemermi nuly rozdiel, čo potvrdzuje nulovú hypotézu, že skupiny sa nelíšia. Rozdiel medzi skupinami je od –2 do 5 g/l, čo znamená, že hemoglobín sa môže znížiť o 2 g/l alebo zvýšiť o 5 g/l.

Interval spoľahlivosti je veľmi dôležitým ukazovateľom. Vďaka nej môžete vidieť, či rozdiely v skupinách boli skutočne spôsobené rozdielom v priemeroch alebo veľkou vzorkou, keďže pri veľkej vzorke je šanca nájsť rozdiely väčšia ako pri malej.

V praxi to môže vyzerať takto. Odobrali sme vzorku 1000 ľudí, zmerali sme hladiny hemoglobínu a zistili sme, že interval spoľahlivosti pre rozdiel v priemeroch sa pohyboval od 1,2 do 1,5 g/l. Hladina štatistickej významnosti na tejto p

Vidíme, že koncentrácia hemoglobínu sa zvýšila, ale takmer nebadateľne, preto sa štatistická významnosť objavila práve kvôli veľkosti vzorky.

Intervaly spoľahlivosti možno vypočítať nielen pre priemer, ale aj pre proporcie (a pomery rizika). Zaujíma nás napríklad interval spoľahlivosti podielov pacientov, ktorí dosiahli remisiu pri užívaní vyvinutého lieku. Predpokladajme, že 95 % CI pre proporcie, t.j. pre podiel takýchto pacientov, leží v rozmedzí 0,60–0,80. Dá sa teda povedať, že náš liek má terapeutický účinok v 60 až 80 % prípadov.

Intervaly spoľahlivosti ( Angličtina Intervaly spoľahlivosti) jeden z typov intervalových odhadov používaných v štatistike, ktoré sa počítajú pre danú hladinu významnosti. Umožňujú nám konštatovať, že skutočná hodnota neznámeho štatistického parametra populácie je v získanom rozsahu hodnôt s pravdepodobnosťou, ktorú určuje zvolená hladina štatistickej významnosti.

Normálne rozdelenie

Keď je známy rozptyl (σ 2) súboru údajov, z-skóre sa môže použiť na výpočet hraníc spoľahlivosti (koncových bodov intervalu spoľahlivosti). V porovnaní s použitím t-distribúcie vám použitie z-skóre umožní zostaviť nielen užší interval spoľahlivosti, ale aj spoľahlivejšie odhady očakávanej hodnoty a štandardnej odchýlky (σ), keďže z-skóre je založené na normálne rozdelenie.

Vzorec

Na určenie hraničných bodov intervalu spoľahlivosti za predpokladu, že je známa štandardná odchýlka súboru údajov, sa používa nasledujúci vzorec

L = X - Za/2 σ
√n

Príklad

Predpokladajme, že veľkosť vzorky je 25 pozorovaní, očakávaná hodnota vzorky je 15 a štandardná odchýlka populácie je 8. Pre hladinu významnosti α=5% je Z-skóre Zα/2=1,96. V tomto prípade bude dolná a horná hranica intervalu spoľahlivosti

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Môžeme teda povedať, že s 95% pravdepodobnosťou bude matematické očakávanie populácie spadať do intervalu od 11,864 do 18,136.

Metódy na zúženie intervalu spoľahlivosti

Predpokladajme, že rozsah je príliš široký na účely našej štúdie. Existujú dva spôsoby, ako znížiť rozsah intervalu spoľahlivosti.

  1. Znížte hladinu štatistickej významnosti α.
  2. Zvýšte veľkosť vzorky.

Znížením hladiny štatistickej významnosti na α=10% dostaneme Z-skóre rovné Z α/2 =1,64. V tomto prípade bude dolná a horná hranica intervalu

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

A samotný interval spoľahlivosti možno zapísať ako

V tomto prípade môžeme predpokladať, že s 90% pravdepodobnosťou budú matematické očakávania populácie spadať do rozsahu .

Ak nechceme znížiť hladinu štatistickej významnosti α, tak jedinou alternatívou je zväčšiť veľkosť vzorky. Zvýšením na 144 pozorovaní získame nasledujúce hodnoty hraníc spoľahlivosti

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Samotný interval spoľahlivosti bude mať nasledujúci tvar

Zúženie intervalu spoľahlivosti bez zníženia úrovne štatistickej významnosti je teda možné len zväčšením veľkosti vzorky. Ak nie je možné zväčšiť veľkosť vzorky, zúženie intervalu spoľahlivosti možno dosiahnuť výlučne znížením úrovne štatistickej významnosti.

Zostrojenie intervalu spoľahlivosti pre iné ako normálne rozdelenie

Ak nie je známa štandardná odchýlka populácie alebo je distribúcia odlišná od normálneho, t-distribúcia sa použije na vytvorenie intervalu spoľahlivosti. Táto technika je konzervatívnejšia, čo sa odráža v širších intervaloch spoľahlivosti v porovnaní s technikou založenou na Z-skóre.

Vzorec

Na výpočet dolnej a hornej hranice intervalu spoľahlivosti na základe t-rozdelenia použite nasledujúce vzorce

L = X - tα σ
√n

Študentské rozdelenie alebo t-rozdelenie závisí iba od jedného parametra - počtu stupňov voľnosti, ktorý sa rovná počtu jednotlivých hodnôt atribútu (počet pozorovaní vo vzorke). Hodnotu Studentovho t-testu pre daný počet stupňov voľnosti (n) a hladinu štatistickej významnosti α nájdete v referenčných tabuľkách.

Príklad

Predpokladajme, že veľkosť vzorky je 25 individuálnych hodnôt, očakávaná hodnota vzorky je 50 a smerodajná odchýlka vzorky je 28. Je potrebné zostrojiť interval spoľahlivosti pre hladinu štatistickej významnosti α=5 %.

V našom prípade je počet stupňov voľnosti 24 (25-1), preto zodpovedajúca tabuľková hodnota Studentovho t-testu pre hladinu štatistickej významnosti α=5 % je 2,064. Preto bude dolná a horná hranica intervalu spoľahlivosti

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

A samotný interval môže byť zapísaný vo forme

Môžeme teda povedať, že s 95% pravdepodobnosťou budú matematické očakávania populácie v rozmedzí .

Použitie t distribúcie vám umožňuje zúžiť interval spoľahlivosti buď znížením štatistickej významnosti alebo zvýšením veľkosti vzorky.

Znížením štatistickej významnosti z 95 % na 90 % v podmienkach nášho príkladu dostaneme zodpovedajúcu tabuľkovú hodnotu Studentovho t-testu 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

V tomto prípade môžeme povedať, že s 90% pravdepodobnosťou budú matematické očakávania populácie v rozmedzí .

Ak nechceme znížiť štatistickú významnosť, tak jedinou alternatívou je zväčšiť veľkosť vzorky. Povedzme, že ide o 64 jednotlivých pozorovaní, a nie 25 ako v pôvodnom stave príkladu. Tabuľková hodnota Studentovho t-testu pre 63 stupňov voľnosti (64-1) a hladina štatistickej významnosti α=5 % je 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

To nám umožňuje povedať, že s 95% pravdepodobnosťou budú matematické očakávania populácie v rozmedzí .

Veľké vzorky

Veľké vzorky sú vzorky z populácie údajov, v ktorej počet jednotlivých pozorovaní presahuje 100. Štatistické štúdie ukázali, že väčšie vzorky majú tendenciu byť normálne rozdelené, aj keď rozdelenie populácie nie je normálne. Okrem toho pri takýchto vzorkách poskytuje použitie z-skóre a t-distribúcie približne rovnaké výsledky pri konštrukcii intervalov spoľahlivosti. Pre veľké vzorky je teda prijateľné použiť z-skóre pre normálne rozdelenie namiesto t-distribúcie.

Poďme si to zhrnúť

Interval spoľahlivosti

Interval spoľahlivosti- termín používaný v matematickej štatistike pre intervalový (na rozdiel od bodového) odhad štatistických parametrov, ktorý sa uprednostňuje, keď je veľkosť vzorky malá. Interval spoľahlivosti je interval, ktorý pokrýva neznámy parameter s danou spoľahlivosťou.

Metódu intervalov spoľahlivosti vyvinul americký štatistik Jerzy Neumann na základe myšlienok anglického štatistika Ronalda Fishera.

Definícia

Interval spoľahlivosti parametra θ rozdelenie náhodných premenných X s úrovňou spoľahlivosti 100 p%, generované vzorkou ( X 1 ,…,X n), sa nazýva interval s hranicami ( X 1 ,…,X n) a ( X 1 ,…,X n), čo sú realizácie náhodných premenných L(X 1 ,…,X n) a U(X 1 ,…,X n), také, že

.

Hraničné body intervalu spoľahlivosti sa nazývajú hranice spoľahlivosti.

Interpretácia intervalu spoľahlivosti založená na intuícii by bola: ak p je veľký (povedzme 0,95 alebo 0,99), potom interval spoľahlivosti takmer určite obsahuje skutočnú hodnotu θ .

Ďalší výklad pojmu interval spoľahlivosti: možno ho považovať za interval hodnôt parametrov θ kompatibilné s experimentálnymi údajmi a nie sú v rozpore s nimi.

Príklady

  • Interval spoľahlivosti pre matematické očakávanie normálnej vzorky;
  • Interval spoľahlivosti pre normálny rozptyl vzorky.

Bayesovský interval spoľahlivosti

V Bayesovskej štatistike existuje podobná, ale odlišná definícia intervalu spoľahlivosti v niektorých kľúčových detailoch. Tu sa samotný odhadovaný parameter považuje za náhodnú premennú s určitým daným predchádzajúcim rozdelením (v najjednoduchšom prípade rovnomerným) a vzorka je pevná (v klasickej štatistike je všetko presne naopak). Bayesovský interval spoľahlivosti je interval pokrývajúci hodnotu parametra so zadnou pravdepodobnosťou:

.

Vo všeobecnosti sú klasické a Bayesovské intervaly spoľahlivosti odlišné. V anglickojazyčnej literatúre sa Bayesovský interval spoľahlivosti zvyčajne nazýva termínom dôveryhodný interval a ten klasický - interval spoľahlivosti.

Poznámky

Zdroje

Nadácia Wikimedia. 2010.

  • deti (film)
  • Kolonista

Pozrite si, čo je „Interval spoľahlivosti“ v iných slovníkoch:

    Interval spoľahlivosti- interval vypočítaný z údajov vzorky, ktorý s danou pravdepodobnosťou (spoľahlivosťou) pokrýva neznámu skutočnú hodnotu odhadovaného distribučného parametra. Zdroj: GOST 20522 96: Pôdy. Metódy štatistického spracovania výsledkov... Slovník-príručka termínov normatívnej a technickej dokumentácie

    interval spoľahlivosti- pre skalárny parameter populácie je to segment, ktorý s najväčšou pravdepodobnosťou obsahuje tento parameter. Táto fráza nemá bez ďalšieho upresnenia zmysel. Keďže hranice intervalu spoľahlivosti sú odhadované zo vzorky, je prirodzené... ... Slovník sociologickej štatistiky

    INTERVAL SPOĽAHLIVOSTI- metóda odhadu parametrov, ktorá sa líši od bodového odhadu. Nechajte vzorku x1, . . ., xn z distribúcie s hustotou pravdepodobnosti f(x, α) a a*=a*(x1, . . ., xn) odhadujú α, g(a*, α) odhad hustoty pravdepodobnosti. Hľadáte…… Geologická encyklopédia

    INTERVAL SPOĽAHLIVOSTI- (interval spoľahlivosti) Interval, v ktorom má spoľahlivosť hodnoty parametra pre populáciu získanú na základe výberového zisťovania určitú mieru pravdepodobnosti, napríklad 95 %, čo je spôsobené samotnou vzorkou. Šírka…… Ekonomický slovník

    interval spoľahlivosti- je interval, v ktorom sa nachádza skutočná hodnota určovanej veličiny s danou pravdepodobnosťou spoľahlivosti. Všeobecná chémia: učebnica / A. V. Zholnin ... Chemické termíny

    Interval spoľahlivosti CI- Interval spoľahlivosti, CI * interval údajov, CI * interval intervalu spoľahlivosti charakteristickej hodnoty, vypočítaný pre k.l. distribučný parameter (napríklad priemerná hodnota charakteristiky) vo vzorke as určitou pravdepodobnosťou (napríklad 95% pre 95% ... genetika. encyklopedický slovník

    INTERVAL SPOĽAHLIVOSTI- pojem, ktorý vzniká pri odhade štatistického parametra. rozdelenie podľa intervalu hodnôt. D. a. pre parameter q, zodpovedajúci tomuto koeficientu. dôvera P sa rovná takému intervalu (q1, q2), že pre akékoľvek rozdelenie pravdepodobnosti nerovnosti... ... Fyzická encyklopédia

    interval spoľahlivosti- - Telekomunikačné témy, základné pojmy EN interval spoľahlivosti ... Technická príručka prekladateľa

    interval spoľahlivosti- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: angl. interval spoľahlivosti vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

    interval spoľahlivosti- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: angl. interval spoľahlivosti rus. oblasť dôvery; interval spoľahlivosti... Chemijos terminų aiškinamasis žodynas

Z tohto článku sa dozviete:

    Čo sa stalo interval spoľahlivosti?

    Aký to má zmysel pravidlá 3 sigma?

    Ako môžete tieto poznatky uplatniť v praxi?

V dnešnej dobe kvôli prebytku informácií spojených s veľkým sortimentom produktov, smerov predaja, zamestnancov, oblastí činnosti atď. môže byť ťažké zdôrazniť to hlavné, ktorý v prvom rade stojí za pozornosť a snahu zvládnuť. Definícia interval spoľahlivosti a analýza skutočných hodnôt presahujúcich jej hranice - technika, ktorá vám pomôže upozorniť na situácie, ovplyvňovanie meniacich sa trendov. Budete schopní rozvíjať pozitívne faktory a znižovať vplyv negatívnych. Táto technológia sa používa v mnohých známych svetových spoločnostiach.

Existujú tzv. upozornenia", ktorý informovať manažérovže ďalšia hodnota je v určitom smere išiel ďalej interval spoľahlivosti. Čo to znamená? Je to signál, že došlo k nejakej nezvyčajnej udalosti, ktorá môže zmeniť doterajší trend v tomto smere. Toto je signál k tomu prísť na to v danej situácii a pochopiť, čo ju ovplyvnilo.

Zvážte napríklad niekoľko situácií. Vypočítali sme prognózu predaja s predpovednými limitmi pre 100 produktov na rok 2011 podľa mesiacov a skutočných predajov v marci:

  1. Pre Sunflower Oil prerazili hornú hranicu prognózy a nespadli do intervalu spoľahlivosti.
  2. Pre „Suché droždie“ sme prekročili spodnú hranicu predpovede.
  3. „Ovsená kaša“ prekročila hornú hranicu.

Pri ostatných produktoch bol skutočný predaj v rámci daných prognózovaných limitov. Tie. ich predaj bol v rámci očakávaní. Identifikovali sme teda 3 produkty, ktoré prekročili hranice, a začali sme zisťovať, čo ich ovplyvnilo, aby prekročili hranice:

  1. V prípade Slnečnicového oleja sme vstúpili do novej distribučnej siete, čím sme získali ďalší objem predaja, čo viedlo k prekročeniu hornej hranice. Pre tento produkt sa oplatí prepočítať prognózu do konca roka s prihliadnutím na prognózu predaja pre túto sieť.
  2. Za „suché kvasnice“ auto uviazlo na colnici a do 5 dní došlo k nedostatku, čo ovplyvnilo pokles predaja a prekročilo spodnú hranicu. Možno by stálo za to zistiť, čo to spôsobilo a pokúsiť sa túto situáciu neopakovať.
  3. Bola spustená akcia na podporu predaja pre ovsenú kašu, ktorá výrazne zvýšila predaj a viedla k tomu, že spoločnosť prekročila prognózu.

Identifikovali sme 3 faktory, ktoré ovplyvnili prekročenie limitov prognózy. V živote ich môže byť oveľa viac Aby sa zvýšila presnosť prognóz a plánovania, faktorov, ktoré vedú k tomu, že skutočné tržby môžu presahovať prognózu, stojí za to zdôrazniť a zostaviť prognózy a plány pre ne samostatne. A potom zvážte ich vplyv na hlavnú prognózu predaja. Môžete tiež pravidelne hodnotiť vplyv týchto faktorov a meniť situáciu k lepšiemu. znížením vplyvu negatívnych a zvýšením vplyvu pozitívnych faktorov.

S intervalom spoľahlivosti môžeme:

  1. Vyberte trasu, ktoré stoja za pozornosť, pretože v týchto smeroch nastali udalosti, ktoré môžu ovplyvniť zmena trendu.
  2. Identifikujte faktory, ktoré skutočne ovplyvňujú zmenu situácie.
  3. súhlasiť informované rozhodnutie(napríklad o nákupe, plánovaní atď.).

Teraz sa pozrime na to, čo je interval spoľahlivosti a ako ho vypočítať v programe Excel pomocou príkladu.

Čo je interval spoľahlivosti?

Interval spoľahlivosti je hranica prognózy (horná a dolná), v rámci ktorej s danou pravdepodobnosťou (sigma) objavia sa skutočné hodnoty.

Tie. Vypočítame predpoveď - to je naše hlavné usmernenie, ale chápeme, že skutočné hodnoty sa pravdepodobne nebudú 100% rovnať našej predpovedi. A vyvstáva otázka, v akých hraniciach skutočné hodnoty môžu klesnúť, ak bude súčasný trend pokračovať? A táto otázka nám pomôže odpovedať výpočet intervalu spoľahlivosti, t.j. - horná a dolná hranica prognózy.

Čo je daná pravdepodobnosť sigma?

Pri výpočte interval spoľahlivosti môžeme nastaviť pravdepodobnosť hity skutočné hodnoty v rámci daných predpovedných limitov. Ako to spraviť? Aby sme to dosiahli, nastavíme hodnotu sigma a ak sa sigma rovná:

    3 sigma- potom pravdepodobnosť ďalšej skutočnej hodnoty spadajúcej do intervalu spoľahlivosti bude 99,7 % alebo 300 ku 1, alebo je pravdepodobnosť prekročenia hraníc 0,3 %.

    2 sigma- potom pravdepodobnosť ďalšej hodnoty spadajúcej do hraníc je ≈ 95,5 %, t.j. šance sú asi 20 ku 1, alebo je 4,5% šanca, že to prekročíte.

    1 sigma- potom je pravdepodobnosť ≈ 68,3 %, t.j. pravdepodobnosť je približne 2 ku 1 alebo existuje 31,7 % šanca, že ďalšia hodnota bude mimo intervalu spoľahlivosti.

Formulovali sme pravidlo 3 sigma,ktorý hovorí, že pravdepodobnosť zásahu iná náhodná hodnota do intervalu spoľahlivosti s danou hodnotou tri sigma je 99,7%.

Veľký ruský matematik Čebyšev dokázal vetu, že existuje 10% pravdepodobnosť prekročenia predpovedných limitov s danou hodnotou troch sigma. Tie. pravdepodobnosť spadnutia do 3-sigma intervalu spoľahlivosti bude minimálne 90 %, pričom pokus o výpočet prognózy a jej hraníc „od oka“ je plný oveľa výraznejších chýb.

Ako vypočítať interval spoľahlivosti sami v Exceli?

Pozrime sa na príklade výpočtu intervalu spoľahlivosti v Exceli (t. j. hornej a dolnej hranice prognózy). Máme časový rad - predaj podľa mesiacov za 5 rokov. Pozri si prílohu.

Na výpočet limitov prognózy vypočítame:

  1. Prognóza predaja().
  2. Sigma - štandardná odchýlka predpovedné modely zo skutočných hodnôt.
  3. Tri sigma.
  4. Interval spoľahlivosti.

1. Prognóza predaja.

=(RC[-14] (údaje z časových radov)- RC[-1] (hodnota modelu))^2 (štvorec)


3. Za každý mesiac spočítajme hodnoty odchýlok od štádia 8 Sum((Xi-Ximod)^2), t.j. Zhrňme si január, február... za každý rok.

Ak to chcete urobiť, použite vzorec =SUMIF()

SUMIF(pole s číslami období vo vnútri cyklu (pre mesiace od 1 do 12); prepojenie na číslo obdobia v cykle; prepojenie na pole so štvorcami rozdielu medzi zdrojovými údajmi a hodnotami obdobia)


4. Vypočítajte štandardnú odchýlku pre každé obdobie v cykle od 1 do 12 (10. fáza v priloženom súbore).

Aby sme to dosiahli, extrahujeme koreň z hodnoty vypočítanej v štádiu 9 a vydelíme počtom období v tomto cykle mínus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Použime vzorce v Exceli =ROOT(R8 (odkaz na (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (odkaz na pole s číslami cyklov); O8 (odkaz na konkrétne číslo cyklu, ktoré počítame v poli))-1))

Pomocou vzorca Excel = COUNTIF spočítame číslo n


Po vypočítaní štandardnej odchýlky skutočných údajov z predpovedného modelu sme získali hodnotu sigma pre každý mesiac - fáza 10 v priloženom súbore.

3. Vypočítajme 3 sigma.

V štádiu 11 nastavíme počet sigmov - v našom príklade „3“ (fáza 11 v priloženom súbore):

Vhodné aj na precvičovanie sigma hodnôt:

1,64 sigma - 10% šanca na prekročenie limitu (1 šanca z 10);

1,96 sigma – 5 % šanca na prekročenie limitov (1 šanca z 20);

2,6 sigma - 1% šanca na prekročenie limitov (1 šanca zo 100).

5) Výpočet troch sigma, na tento účel vynásobíme hodnoty „sigma“ za každý mesiac „3“.

3. Určite interval spoľahlivosti.

  1. Horný limit predpovede- prognóza predaja zohľadňujúca rast a sezónnosť + (plus) 3 sigma;
  2. Dolný limit predpovede- prognóza predaja zohľadňujúca rast a sezónnosť – (mínus) 3 sigma;

Na uľahčenie výpočtu intervalu spoľahlivosti na dlhé obdobie (pozri priložený súbor) použijeme vzorec Excel =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), Kde

Y8- prognóza predaja;

W8- číslo mesiaca, pre ktorý budeme brať hodnotu 3-sigma;

Tie. Horný limit predpovede= „predpoveď predaja“ + „3 sigma“ (v príklade VLOOKUP(číslo mesiaca; tabuľka s 3 hodnotami sigma; stĺpec, z ktorého extrahujeme hodnotu sigma rovnajúcu sa číslu mesiaca v príslušnom riadku; 0)).

Dolný limit predpovede= „predpoveď predaja“ mínus „3 sigma“.

V Exceli sme teda vypočítali interval spoľahlivosti.

Teraz máme predpoveď a rozsah s hranicami, do ktorých budú skutočné hodnoty spadať s danou sigma pravdepodobnosťou.

V tomto článku sme sa pozreli na to, čo je sigma a pravidlo troch sigma, ako určiť interval spoľahlivosti a prečo môžete túto techniku ​​použiť v praxi.

Prajeme vám presné predpovede a úspech!

Ako Forecast4AC PRO vám môže pomôcťpri výpočte intervalu spoľahlivosti?:

    Forecast4AC PRO automaticky vypočíta hornú alebo dolnú hranicu predpovede pre viac ako 1000 časových radov súčasne;

    Schopnosť analyzovať hranice prognózy v porovnaní s prognózou, trendom a skutočným predajom na grafe jedným stlačením klávesu;

V programe Forcast4AC PRO je možné nastaviť hodnotu sigma od 1 do 3.

Pripoj sa k nám!

Stiahnite si bezplatné aplikácie na prognózovanie a analýzu podnikania:


  • Novo Forecast Lite- automatický predpovedný výpočet V Excel.
  • 4analytics - Analýza ABC-XYZ a analýzu emisií Excel.
  • Qlik Sense Desktop a QlikViewPersonal Edition - BI systémy pre analýzu a vizualizáciu dát.

Otestujte možnosti platených riešení:

  • Novo Forecast PRO- prognózovanie v Exceli pre veľké súbory údajov.
Páčil sa vám článok? Zdieľaj to