Kontakty

Interval spoľahlivosti pre odhad priemeru (rozptyl je známy) v MS EXCEL. Výpočet intervalu spoľahlivosti v programe Microsoft Excel

Interval spoľahlivosti (CI; v angličtine interval spoľahlivosti - CI) získaný v štúdii so vzorkou poskytuje mieru presnosti (alebo neistoty) výsledkov štúdie s cieľom vyvodiť závery o populácii všetkých takýchto pacientov (všeobecná populácia). Správna definícia 95 % CI možno formulovať takto: 95 % takýchto intervalov bude obsahovať skutočnú hodnotu v populácii. Táto interpretácia je o niečo menej presná: CI je rozsah hodnôt, v rámci ktorého si môžete byť na 95 % istí, že obsahuje skutočnú hodnotu. Pri použití CI sa kladie dôraz na stanovenie kvantitatívneho účinku, na rozdiel od hodnoty P, ktorá je výsledkom testovania štatistickej významnosti. Hodnota P neodhaduje žiadne množstvo, ale skôr slúži ako miera sily dôkazu proti nulovej hypotéze „žiadny účinok“. Samotná hodnota P nám nehovorí nič o veľkosti rozdielu, dokonca ani o jeho smere. Preto sú nezávislé hodnoty P v článkoch alebo abstraktoch absolútne neinformatívne. Na rozdiel od toho CI označuje veľkosť účinku bezprostredného záujmu, ako je prínos liečby, ako aj silu dôkazov. Preto DI priamo súvisí s praxou EBM.

Odhadový prístup k štatistickej analýze, ktorého príkladom je CI, je zameraný na meranie kvantity požadovaného účinku (citlivosť diagnostického testu, miera predpovedaných prípadov, zníženie relatívneho rizika s liečbou atď.) a tiež na meranie neistoty v tom, že účinok. Najčastejšie je CI rozsah hodnôt na oboch stranách odhadu, v ktorom pravdepodobne leží skutočná hodnota, a môžete si byť tým 95% istý. Dohoda o použití 95 % pravdepodobnosti je ľubovoľná, rovnako ako hodnota P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI je založená na myšlienke, že rovnaká štúdia vykonaná na rôznych vzorkách pacientov by nepriniesla identické výsledky, ale že ich výsledky by boli rozdelené okolo skutočnej, ale neznámej hodnoty. Inými slovami, CI to opisuje ako „variabilita závislú od vzorky“. CI neodráža dodatočnú neistotu z iných dôvodov; nezahŕňa najmä vplyv selektívnej straty na sledovanie, zlého dodržiavania alebo nepresného merania výsledkov, nedostatočného zaslepenia atď. KI preto vždy podceňuje celkovú mieru neistoty.

Výpočet intervalu spoľahlivosti

Tabuľka A1.1. Štandardné chyby a intervaly spoľahlivosti pre vybrané klinické merania

Typicky sa CI vypočítava z pozorovaného odhadu množstva, ako je rozdiel (d) medzi dvoma podielmi a štandardná chyba (SE) v odhade tohto rozdielu. Približný 95 % CI získaný týmto spôsobom je d ± 1,96 SE. Vzorec sa mení podľa povahy výslednej miery a rozsahu CI. Napríklad v randomizovanej, placebom kontrolovanej štúdii s acelulárnou vakcínou proti čiernemu kašľu sa u 72 z 1670 (4,3 %) dojčiat, ktoré dostali vakcínu, vyvinul čierny kašeľ a u 240 z 1665 (14,4 %) v kontrolnej skupine. Percentuálny rozdiel, známy ako absolútne zníženie rizika, je 10,1 %. SE tohto rozdielu je 0,99 %. V súlade s tým je 95 % CI 10,1 % + 1,96 x 0,99 %, t.j. od 8.2 do 12.0.

Napriek ich odlišným filozofickým prístupom, CI a testy štatistickej významnosti spolu matematicky úzko súvisia.

Hodnota P je teda „významná“, t.j. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Neistota (nepresnosť) odhadu vyjadrená v CI do značnej miery súvisí s druhou odmocninou veľkosti vzorky. Malé vzorky poskytujú menej informácií ako veľké a CI je zodpovedajúcim spôsobom širší v menšej vzorke. Napríklad článok porovnávajúci výkonnosť troch testov používaných na diagnostiku infekcie Helicobacter pylori uvádza citlivosť dychového testu s močovinou 95,8 % (95 % CI 75–100). Zatiaľ čo údaj 95,8 % je pôsobivý, malá vzorka 24 dospelých pacientov s J. pylori znamená, že v tomto odhade existuje významná neistota, ako ukazuje široký CI. Spodná hranica 75 % je skutočne oveľa nižšia ako odhad 95,8 %. Ak by sa rovnaká citlivosť pozorovala na vzorke 240 ľudí, 95 % CI by bol 92,5 – 98,0, čo dáva väčšiu istotu, že test je vysoko citlivý.

V randomizovaných kontrolovaných štúdiách (RCT) sú nevýznamné výsledky (t. j. tie s P > 0,05) obzvlášť náchylné na nesprávnu interpretáciu. CI je tu obzvlášť užitočná, pretože ukazuje, ako konzistentné sú výsledky s klinicky užitočným skutočným účinkom. Napríklad v RCT porovnávajúcej sutúru hrubého čreva a anastomózu svoriek sa infekcia rany vyvinula u 10,9 % a 13,5 % pacientov (P = 0,30). 95 % CI pre tento rozdiel je 2,6 % (-2 až +8). Dokonca aj v tejto štúdii so 652 pacientmi zostáva možné, že existuje mierny rozdiel vo výskyte infekcií vyplývajúcich z týchto dvoch postupov. Čím menej výskumov, tým väčšia neistota. Sung a kol. vykonali RCT na porovnanie infúzie oktreotidu s akútnou skleroterapiou pre akútne krvácanie z varixov u 100 pacientov. V skupine s oktreotidom bola miera kontroly krvácania 84 %; v skupine so skleroterapiou - 90 %, čo dáva P = 0,56. Všimnite si, že miera pokračujúceho krvácania je podobná ako pri infekcii rany v uvedenej štúdii. V tomto prípade je však 95 % CI pre rozdiel medzi intervenciami 6 % (-7 až +19). Tento rozsah je pomerne široký v porovnaní s 5 % rozdielom, ktorý by bol klinicky zaujímavý. Je zrejmé, že štúdia nevylučuje významný rozdiel v účinnosti. Záver autorov „infúzia oktreotidu a skleroterapia sú rovnako účinné pri liečbe krvácania z kŕčových žíl“ je teda rozhodne neplatná. V prípadoch, ako je tento, kde, ako v tomto prípade, 95 % CI pre zníženie absolútneho rizika (ARR) zahŕňa nulu, je CI pre NNT (počet potrebný na liečbu) pomerne ťažké interpretovať. NPL a jeho CI sa získajú z recipročných hodnôt AKT (vynásobením 100, ak sú tieto hodnoty uvedené v percentách). Tu dostaneme NPL = 100: 6 = 16,6 s 95 % CI od -14,3 do 5,3. Ako je možné vidieť z poznámky pod čiarou „d“ v tabuľke. A1.1, tento CI zahŕňa hodnoty NPL od 5,3 do nekonečna a NPL od 14,3 do nekonečna.

CI možno zostaviť pre väčšinu bežne používaných štatistických odhadov alebo porovnaní. V prípade RCT zahŕňa rozdiel medzi priemernými podielmi, relatívnymi rizikami, pomermi šancí a NLR. Podobne možno CI získať pre všetky hlavné odhady uskutočnené v štúdiách presnosti diagnostických testov – citlivosť, špecifickosť, pozitívna prediktívna hodnota (všetky sú jednoduché proporcie) a pomery pravdepodobnosti – odhady získané v metaanalýzach a porovnaní s kontrolou. štúdia. Osobný počítačový program, ktorý pokrýva mnohé z týchto použití MDI, je dostupný s druhým vydaním Štatistiky s istotou. Makrá na výpočet CI pre proporcie sú bezplatne dostupné pre Excel a štatistické programy SPSS a Minitab na http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Viacnásobné odhady účinku liečby

Zatiaľ čo CI sú žiaduce pre primárne výsledky štúdie, nie sú potrebné pre všetky výsledky. CI sa týka klinicky dôležitých porovnaní. Napríklad pri porovnávaní dvoch skupín je správny CI ten, ktorý sa vytvoril pre rozdiel medzi skupinami, ako je uvedené v príkladoch vyššie, a nie CI, ktorý je možné skonštruovať pre odhad v každej skupine. Nielenže nie je užitočné poskytnúť samostatné CI pre odhady v každej skupine, táto prezentácia môže byť zavádzajúca. Podobne správnym prístupom pri porovnávaní účinnosti liečby v rôznych podskupinách je priame porovnanie dvoch (alebo viacerých) podskupín. Je nesprávne predpokladať, že liečba je účinná len v jednej podskupine, ak jej CI vylučuje hodnotu zodpovedajúcu žiadnemu účinku a ostatné nie. CI sú tiež užitočné pri porovnávaní výsledkov vo viacerých podskupinách. Na obr. A 1.1 ukazuje relatívne riziko eklampsie u žien s preeklampsiou v podskupinách žien z placebom kontrolovanej RCT síranu horečnatého.

Ryža. A1.2. Lesný pozemok ukazuje výsledky 11 randomizovaných klinických štúdií vakcíny proti bovinnému rotavírusu na prevenciu hnačky v porovnaní s placebom. Na odhad relatívneho rizika hnačky sa použil 95 % interval spoľahlivosti. Veľkosť čierneho štvorca je úmerná množstvu informácií. Okrem toho je zobrazený súhrnný odhad účinnosti liečby a 95 % interval spoľahlivosti (označený kosoštvorcom). Metaanalýza použila model náhodných efektov väčší ako niektoré vopred špecifikované; môže to byť napríklad veľkosť použitá pri výpočte veľkosti vzorky. Prísnejšie kritérium vyžaduje, aby celý rozsah CI vykazoval prínos väčší ako vopred špecifikované minimum.

Už sme diskutovali o omyle, keď sa nedostatok štatistickej významnosti považuje za indikáciu, že dve liečby sú rovnako účinné. Rovnako dôležité je nerovnať štatistickú významnosť s klinickou dôležitosťou. Klinický význam možno predpokladať, keď je výsledok štatisticky významný a veľkosť odhadu účinnosti liečby

Štúdie môžu ukázať, či sú výsledky štatisticky významné a ktoré sú klinicky dôležité a ktoré nie. Na obr. A1.2 ukazuje výsledky štyroch testov, pre ktoré je celý CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Všetky sú odhadmi ich teoretických analógov, ktoré by sa dali získať, keby nebola k dispozícii vzorka, ale všeobecná populácia. Ale bohužiaľ, bežná populácia je veľmi drahá a často nedostupná.

Pojem intervalového odhadu

Akýkoľvek odhad vzorky má určitý rozptyl, pretože je náhodná premenná v závislosti od hodnôt v konkrétnej vzorke. Preto pre spoľahlivejšie štatistické závery treba poznať nielen bodový odhad, ale aj interval, ktorý s vysokou pravdepodobnosťou γ (gama) pokrýva hodnotený ukazovateľ θ (theta).

Formálne sú to dve takéto hodnoty (štatistika) T 1 (X) A T 2 (X), Čo T 1< T 2 , pre ktoré pri danej úrovni pravdepodobnosti γ podmienka je splnená:

Je to skrátka pravdepodobné γ alebo viac skutočný ukazovateľ je medzi bodmi T 1 (X) A T 2 (X), ktoré sa nazývajú dolná a horná hranica interval spoľahlivosti.

Jednou z podmienok konštrukcie intervalov spoľahlivosti je jeho maximálna úzka, t.j. mala by byť čo najkratšia. Túžba je celkom prirodzená, pretože... výskumník sa snaží presnejšie lokalizovať umiestnenie požadovaného parametra.

Z toho vyplýva, že interval spoľahlivosti musí pokrývať maximálne pravdepodobnosti rozdelenia. a samotné hodnotenie by malo byť v centre.

To znamená, že pravdepodobnosť odchýlky (skutočného ukazovateľa od odhadu) smerom nahor sa rovná pravdepodobnosti odchýlky smerom nadol. Treba tiež poznamenať, že pre asymetrické distribúcie sa interval vpravo nerovná intervalu vľavo.

Vyššie uvedený obrázok jasne ukazuje, že čím väčšia je pravdepodobnosť spoľahlivosti, tým širší je interval - priamy vzťah.

Toto bol krátky úvod do teórie intervalového odhadu neznámych parametrov. Prejdime k hľadaniu hraníc spoľahlivosti pre matematické očakávania.

Interval spoľahlivosti pre matematické očakávania

Ak sú pôvodné údaje rozdelené na , priemer bude normálna hodnota. Vyplýva to z pravidla, že lineárna kombinácia normálnych hodnôt má tiež normálne rozdelenie. Preto by sme na výpočet pravdepodobností mohli použiť matematický aparát zákona normálneho rozdelenia.

To si však bude vyžadovať poznať dva parametre – očakávanie a rozptyl, ktoré sú zvyčajne neznáme. Namiesto parametrov môžete samozrejme použiť odhady (aritmetický priemer a ), ale potom rozdelenie priemeru nebude úplne normálne, bude mierne sploštené smerom nadol. Túto skutočnosť si šikovne všimol občan William Gosset z Írska, ktorý svoj objav zverejnil v marci 1908 v časopise Biometrica. Z dôvodu utajenia sa Gosset podpísal ako Študent. Takto sa objavilo Studentovo t-rozdelenie.

Normálna distribúcia údajov, ktorú používa K. Gauss pri analýze chýb v astronomických pozorovaniach, je však v pozemskom živote extrémne vzácna a je dosť ťažké ju stanoviť (na vysokú presnosť je potrebných asi 2 000 pozorovaní). Preto je najlepšie zahodiť predpoklad normality a použiť metódy, ktoré nezávisia od distribúcie pôvodných údajov.

Vzniká otázka: aké je rozdelenie aritmetického priemeru, ak sa vypočítava z údajov neznámeho rozdelenia? Odpoveď dáva dobre známe z teórie pravdepodobnosti Centrálna limitná veta(CPT). V matematike existuje niekoľko jeho variantov (formulácie sa v priebehu rokov zdokonaľovali), ale všetky sa, zhruba povedané, scvrkávali na konštatovanie, že súčet veľkého počtu nezávislých náhodných premenných sa riadi zákonom normálneho rozdelenia.

Pri výpočte aritmetického priemeru sa používa súčet náhodných premenných. Tu sa ukazuje, že aritmetický priemer má normálne rozdelenie, v ktorom je očakávanie očakávaním pôvodných údajov a rozptyl je .

Chytrí ľudia vedia dokázať CLT, ale overíme si to pomocou experimentu v Exceli. Simulujme vzorku 50 rovnomerne rozdelených náhodných premenných (pomocou excelovej funkcie RANDBETWEEN). Potom urobíme 1000 takýchto vzoriek a pre každú vypočítame aritmetický priemer. Pozrime sa na ich distribúciu.

Je vidieť, že rozdelenie priemeru sa blíži normálnemu zákonu. Ak sa veľkosť a počet vzorky ešte zväčšia, podobnosť bude ešte lepšia.

Teraz, keď sme na vlastné oči videli platnosť CLT, môžeme pomocou , vypočítať intervaly spoľahlivosti pre aritmetický priemer, ktoré pokrývajú skutočný priemer alebo matematické očakávania s danou pravdepodobnosťou.

Na stanovenie hornej a dolnej hranice potrebujete poznať parametre normálneho rozdelenia. Spravidla neexistujú žiadne, preto sa používajú odhady: aritmetický priemer A vzorový rozptyl. Opakujem, táto metóda poskytuje dobrú aproximáciu iba pri veľkých vzorkách. Keď sú vzorky malé, často sa odporúča použiť študentskú distribúciu. Neverte tomu! Študentovo rozdelenie pre priemer sa vyskytuje iba vtedy, keď sú pôvodné údaje normálne rozdelené, teda takmer nikdy. Preto je lepšie okamžite nastaviť minimálnu hranicu pre množstvo požadovaných údajov a použiť asymptoticky správne metódy. Hovorí sa, že stačí 30 pozorovaní. Vezmite 50 - nič nepokazíte.

T 1.2– spodná a horná hranica intervalu spoľahlivosti

– vzorový aritmetický priemer

s 0– štandardná odchýlka vzorky (nezaujatá)

n - veľkosť vzorky

γ – pravdepodobnosť spoľahlivosti (zvyčajne sa rovná 0,9, 0,95 alebo 0,99)

c γ =Φ -1 ((1+γ)/2)– prevrátená hodnota funkcie štandardného normálneho rozdelenia. Jednoducho povedané, ide o počet štandardných chýb od aritmetického priemeru po dolnú alebo hornú hranicu (tieto tri pravdepodobnosti zodpovedajú hodnotám 1,64, 1,96 a 2,58).

Podstatou vzorca je, že sa vezme aritmetický priemer a potom sa z neho vyčlení určitá čiastka ( s γ) štandardné chyby ( s 0 /√n). Všetko je známe, vezmite si to a zvážte to.

Pred rozšírením osobných počítačov sa používali na získavanie hodnôt normálnej distribučnej funkcie a jej inverznej funkcie. Používajú sa dodnes, ale efektívnejšie je použiť hotové vzorce Excelu. Všetky prvky z vyššie uvedeného vzorca ( , a ) možno jednoducho vypočítať v Exceli. Existuje však pripravený vzorec na výpočet intervalu spoľahlivosti - DÔVERUJTE.NORM. Jeho syntax je nasledovná.

CONFIDENCE.NORM(alfa;štandardné_vyp;veľkosť)

alfa– hladina významnosti alebo hladina spoľahlivosti, ktorá sa vo vyššie prijatom zápise rovná 1- γ, t.j. pravdepodobnosť, že matematickáočakávanie bude mimo intervalu spoľahlivosti. S úrovňou spoľahlivosti 0,95 je alfa 0,05 atď.

štandard_vyp– štandardná odchýlka údajov vzorky. Nie je potrebné počítať štandardnú chybu samotný Excel bude deliť odmocninou n.

veľkosť– veľkosť vzorky (n).

Výsledkom funkcie CONFIDENCE NORM je druhý člen zo vzorca na výpočet intervalu spoľahlivosti, t.j. polovičný interval V súlade s tým sú dolné a horné body priemer ± získaná hodnota.

Je teda možné skonštruovať univerzálny algoritmus na výpočet intervalov spoľahlivosti pre aritmetický priemer, ktorý nezávisí od distribúcie pôvodných údajov. Cenou za univerzálnosť je jej asymptotická povaha, t.j. nutnosť použiť relatívne veľké vzorky. V dobe moderných technológií však zozbierať potrebné množstvo dát väčšinou nie je zložité.

Testovanie štatistických hypotéz pomocou intervalov spoľahlivosti

(modul 111)

Jedným z hlavných problémov riešených v štatistike je. Jeho podstata je stručne nasledovná. Vychádza sa napríklad z predpokladu, že očakávanie bežnej populácie sa rovná nejakej hodnote. Potom sa skonštruuje distribúcia výberových prostriedkov, ktoré možno pozorovať pre dané očakávanie. Ďalej sa pozerajú na to, kde sa v tomto podmienenom rozdelení nachádza skutočný priemer. Ak to presiahne prijateľné hranice, potom je výskyt takéhoto priemeru veľmi nepravdepodobný a ak sa experiment zopakuje raz, je to takmer nemožné, čo je v rozpore s predloženou hypotézou, ktorá sa úspešne zamieta. Ak priemer neprekročí kritickú úroveň, hypotéza nie je zamietnutá (ale ani dokázaná!).

Takže pomocou intervalov spoľahlivosti, v našom prípade pre očakávanie, môžete otestovať aj niektoré hypotézy. Je to veľmi jednoduché. Povedzme, že aritmetický priemer pre určitú vzorku je rovný 100. Testuje sa hypotéza, že očakávaná hodnota je, povedzme, 90. To znamená, že ak otázku položíme primitívne, znie to takto: môže to byť pravda? hodnota priemeru rovná 90, zistený priemer sa ukázal byť 100?

Na zodpovedanie tejto otázky budete navyše potrebovať informácie o štandardnej odchýlke a veľkosti vzorky. Predpokladajme, že štandardná odchýlka je 30 a počet pozorovaní je 64 (aby sa ľahko extrahoval koreň). Potom je štandardná chyba priemeru 30/8 alebo 3,75. Na výpočet 95 % intervalu spoľahlivosti budete musieť pridať dve štandardné chyby na každú stranu priemeru (presnejšie 1,96). Interval spoľahlivosti bude približne 100±7,5 alebo od 92,5 do 107,5.

Ďalšie zdôvodnenie je nasledovné. Ak testovaná hodnota spadá do intervalu spoľahlivosti, potom to nie je v rozpore s hypotézou, pretože spadá do hraníc náhodných výkyvov (s pravdepodobnosťou 95 %). Ak sa kontrolovaný bod nachádza mimo intervalu spoľahlivosti, potom je pravdepodobnosť takejto udalosti veľmi malá, v každom prípade pod prijateľnou úrovňou. To znamená, že hypotéza je zamietnutá, pretože je v rozpore s pozorovanými údajmi. V našom prípade je hypotéza o očakávanej hodnote mimo intervalu spoľahlivosti (testovaná hodnota 90 nie je zahrnutá v intervale 100±7,5), preto ju treba zamietnuť. Pri odpovedi na vyššie uvedenú primitívnu otázku by sa malo povedať: nie, nemôže, v žiadnom prípade sa to stáva veľmi zriedka. Často označujú špecifickú pravdepodobnosť chybného zamietnutia hypotézy (úroveň p), a nie špecifikovanú úroveň, na ktorej bol interval spoľahlivosti skonštruovaný, ale o tom inokedy.

Ako vidíte, zostavenie intervalu spoľahlivosti pre priemer (alebo matematické očakávania) nie je ťažké. Hlavná vec je pochopiť podstatu a potom sa veci pohnú ďalej. V praxi sa vo väčšine prípadov používa 95 % interval spoľahlivosti, čo je šírka približne dvoch štandardných chýb na oboch stranách priemeru.

To je zatiaľ všetko. Všetko najlepšie!

INTERVALY VEREJNOSTI PRE FREKVENCIE A ZLOMKY

© 2008

Národný inštitút verejného zdravia, Oslo, Nórsko

Článok popisuje a rozoberá výpočet intervalov spoľahlivosti pre frekvencie a proporcie pomocou metód Wald, Wilson, Clopper - Pearson, pomocou uhlovej transformácie a Waldovej metódy s korekciou Agresti - Coull. Predkladaný materiál poskytuje všeobecné informácie o metódach výpočtu intervalov spoľahlivosti pre frekvencie a podiely a má vzbudiť záujem čitateľov časopisov nielen o používanie intervalov spoľahlivosti pri prezentovaní výsledkov vlastného výskumu, ale aj o prečítanie odbornej literatúry pred začatím práce. o budúcich publikáciách.

Kľúčové slová: interval spoľahlivosti, frekvencia, podiel

Jedna z predchádzajúcich publikácií stručne spomenula popis kvalitatívnych údajov a uviedla, že ich intervalový odhad je vhodnejší ako bodový odhad na popis frekvencie výskytu sledovanej charakteristiky v populácii. Keďže výskum sa vykonáva s použitím vzorových údajov, projekcia výsledkov na populáciu musí obsahovať prvok nepresnosti výberu vzoriek. Interval spoľahlivosti je mierou presnosti odhadovaného parametra. Je zaujímavé, že niektoré knihy o základných štatistikách pre lekárov úplne ignorujú tému intervalov spoľahlivosti pre frekvencie. V tomto článku sa pozrieme na niekoľko spôsobov, ako vypočítať intervaly spoľahlivosti pre frekvencie, čo zahŕňa také charakteristiky vzorky, ako je neopakovanie sa a reprezentatívnosť, ako aj nezávislosť pozorovaní od seba navzájom. V tomto článku sa frekvencia chápe nie ako absolútne číslo, ktoré ukazuje, koľkokrát sa určitá hodnota vyskytuje v súhrne, ale ako relatívna hodnota, ktorá určuje podiel účastníkov štúdie, u ktorých sa študovaná charakteristika vyskytuje.

V biomedicínskom výskume sa najčastejšie používajú 95% intervaly spoľahlivosti. Tento interval spoľahlivosti je oblasť, do ktorej skutočný podiel spadá 95 % času. Inými slovami, s 95% spoľahlivosťou môžeme povedať, že skutočná hodnota frekvencie výskytu znaku v populácii bude v rámci 95% intervalu spoľahlivosti.

Väčšina štatistických príručiek pre medicínskych výskumníkov uvádza, že frekvenčná chyba sa vypočítava pomocou vzorca

kde p je frekvencia výskytu charakteristiky vo vzorke (hodnota od 0 do 1). Väčšina domácich vedeckých článkov uvádza frekvenciu výskytu znaku vo vzorke (p), ako aj jeho chybu (s) v tvare p ± s. Vhodnejšie je však prezentovať 95 % interval spoľahlivosti pre frekvenciu výskytu znaku v populácii, ktorý bude zahŕňať hodnoty od

predtým.

Niektoré príručky odporúčajú pre malé vzorky nahradiť hodnotu 1,96 hodnotou t pre N – 1 stupeň voľnosti, kde N je počet pozorovaní vo vzorke. Hodnotu t možno nájsť v tabuľkách pre t-rozdelenie, ktoré sú dostupné takmer vo všetkých učebniciach štatistiky. Použitie t distribúcie pre Waldovu metódu neposkytuje viditeľné výhody v porovnaní s inými metódami diskutovanými nižšie, a preto ho niektorí autori neodporúčajú.

Vyššie uvedená metóda na výpočet intervalov spoľahlivosti pre frekvencie alebo proporcie sa nazýva Wald na počesť Abrahama Walda (1902–1950), pretože jej široké používanie sa začalo po publikácii Walda a Wolfowitza v roku 1939. Samotnú metódu však navrhol Pierre Simon Laplace (1749–1827) už v roku 1812.

Waldova metóda je veľmi populárna, no jej aplikácia je spojená so značnými problémami. Metóda sa neodporúča pre malé veľkosti vzoriek, ako aj v prípadoch, keď frekvencia výskytu charakteristiky má tendenciu k 0 alebo 1 (0 % alebo 100 %) a je jednoducho nemožná pre frekvencie 0 a 1. aproximácia normálneho rozdelenia, ktorá sa používa pri výpočte chyby, „nefunguje“ v prípadoch, keď n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Keďže nová premenná je normálne rozdelená, dolná a horná hranica 95 % intervalu spoľahlivosti pre premennú φ bude φ-1,96 a φ+1,96 vľavo">

Namiesto 1,96 pre malé vzorky sa odporúča nahradiť hodnotu t za N – 1 stupeň voľnosti. Táto metóda nevytvára záporné hodnoty a umožňuje presnejšie odhady intervalov spoľahlivosti pre frekvencie ako Waldova metóda. Okrem toho je opísaný v mnohých domácich referenčných knihách o lekárskej štatistike, čo však neviedlo k jeho širokému použitiu v lekárskom výskume. Výpočet intervalov spoľahlivosti pomocou uhlovej transformácie sa neodporúča pre frekvencie blížiace sa k 0 alebo 1.

Tu popis metód na odhadovanie intervalov spoľahlivosti vo väčšine kníh o základoch štatistiky pre medicínskych výskumníkov zvyčajne končí a tento problém je typický nielen pre domácu, ale aj zahraničnú literatúru. Obe metódy sú založené na centrálnej limitnej vete, čo znamená veľkú vzorku.

Berúc do úvahy nedostatky odhadovania intervalov spoľahlivosti pomocou vyššie uvedených metód, Clopper a Pearson navrhli v roku 1934 metódu na výpočet takzvaného presného intervalu spoľahlivosti, vzhľadom na binomické rozdelenie skúmaného znaku. Táto metóda je dostupná v mnohých online kalkulačkách, ale takto získané intervaly spoľahlivosti sú vo väčšine prípadov príliš široké. Zároveň sa táto metóda odporúča použiť v prípadoch, keď je potrebné konzervatívne posúdenie. Stupeň konzervatívnosti metódy sa zvyšuje so znižovaním veľkosti vzorky, najmä keď N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Podľa mnohých štatistikov sa najoptimálnejšie hodnotenie intervalov spoľahlivosti pre frekvencie vykonáva Wilsonovou metódou, navrhnutou už v roku 1927, ale prakticky sa nepoužíva v domácom biomedicínskom výskume. Táto metóda nielenže umožňuje odhadnúť intervaly spoľahlivosti pre veľmi malé aj veľmi veľké frekvencie, ale je použiteľná aj pre malý počet pozorovaní. Vo všeobecnosti má interval spoľahlivosti podľa Wilsonovho vzorca tvar



kde pri výpočte 95 % intervalu spoľahlivosti nadobúda hodnotu 1,96, N je počet pozorovaní a p je frekvencia výskytu charakteristiky vo vzorke. Táto metóda je dostupná v online kalkulačkách, takže jej použitie nie je problematické. a neodporúčame používať túto metódu pre n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Okrem Wilsonovej metódy sa predpokladá, že Waldova metóda s korekciou Agresti–Coll poskytuje optimálny odhad intervalu spoľahlivosti pre frekvencie. Korekcia Agresti-Coll je vo Waldovom vzorci nahradením frekvencie výskytu charakteristiky vo vzorke (p) za p`, pri výpočte, ktorá 2 sa pripočíta k čitateľovi a 4 k menovateľovi, tj. p` = (X + 2) / (N + 4), kde X je počet účastníkov štúdie, ktorí majú skúmanú charakteristiku, a N je veľkosť vzorky. Táto modifikácia poskytuje výsledky veľmi podobné Wilsonovmu vzorcu, s výnimkou prípadov, keď sa frekvencia udalostí blíži k 0 % alebo 100 % a vzorka je malá. Okrem vyššie uvedených metód na výpočet intervalov spoľahlivosti pre frekvencie boli navrhnuté korekcie kontinuity pre Waldovu aj Wilsonovu metódu pre malé vzorky, ale štúdie ukázali, že ich použitie je nevhodné.

Uvažujme o použití vyššie uvedených metód na výpočet intervalov spoľahlivosti pomocou dvoch príkladov. V prvom prípade študujeme veľkú vzorku 1 000 náhodne vybraných účastníkov štúdie, z ktorých 450 má skúmanú vlastnosť (môže to byť rizikový faktor, výsledok alebo akákoľvek iná vlastnosť), čo predstavuje frekvenciu 0,45 alebo 45 %. V druhom prípade sa štúdia uskutočňuje na malej vzorke, povedzme, iba 20 ľudí a iba 1 účastník štúdie (5 %) má skúmanú vlastnosť. Intervaly spoľahlivosti pomocou Waldovej metódy, Waldovej metódy s Agresti–Collovou korekciou a Wilsonovej metódy boli vypočítané pomocou online kalkulačky vyvinutej Jeffom Saurom (http://www./wald.htm). Wilsonove intervaly spoľahlivosti korigované na kontinuitu boli vypočítané pomocou kalkulačky poskytnutej Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Výpočty uhlovej Fisherovej transformácie sa uskutočnili manuálne s použitím kritickej hodnoty t pre 19 a 999 stupňov voľnosti. Výsledky výpočtu sú uvedené v tabuľke pre oba príklady.

Intervaly spoľahlivosti vypočítané šiestimi rôznymi spôsobmi pre dva príklady opísané v texte

Metóda výpočtu intervalu spoľahlivosti

P = 0,0500 alebo 5 %

95 % CI pre X = 450, N = 1 000, P = 0,4500 alebo 45 %

–0,0455–0,2541

Wald s korekciou Agresti–Coll

<,0001–0,2541

Wilson s korekciou kontinuity

Clopper-Pearson "presná metóda"

Uhlová transformácia

<0,0001–0,1967

Ako je možné vidieť z tabuľky, v prvom príklade interval spoľahlivosti vypočítaný pomocou „všeobecne akceptovanej“ Waldovej metódy vstupuje do zápornej oblasti, čo nemôže byť prípad frekvencií. Bohužiaľ, takéto incidenty nie sú v ruskej literatúre nezvyčajné. Tradičný spôsob prezentácie údajov z hľadiska frekvencie a jeho chybovosť tento problém čiastočne maskuje. Napríklad, ak je frekvencia výskytu znaku (v percentách) prezentovaná ako 2,1 ± 1,4, potom to nie je také „urážlivé pre oči“ ako 2,1 % (95 % CI: –0,7; 4,9), hoci a znamená to isté. Waldova metóda s Agresti–Coll korekciou a výpočtom pomocou uhlovej transformácie poskytuje dolnú hranicu smerujúcu k nule. Wilsonova metóda korigovaná na kontinuitu a „presná metóda“ vytvárajú širšie intervaly spoľahlivosti ako Wilsonova metóda. V druhom príklade všetky metódy poskytujú približne rovnaké intervaly spoľahlivosti (rozdiely sa objavujú iba v tisícinách), čo nie je prekvapujúce, pretože frekvencia výskytu udalosti v tomto príklade sa príliš nelíši od 50 % a veľkosť vzorky je celkom veľké.

Čitateľom, ktorí sa zaujímajú o tento problém, môžeme odporučiť práce R. G. Newcomba a Browna, Caia a Dasguptu, ktoré poskytujú výhody a nevýhody použitia 7 a 10 rôznych metód na výpočet intervalov spoľahlivosti, resp. Z domácich príručiek radíme knihu a, ktorá okrem podrobného popisu teórie predstavuje metódy Walda a Wilsona, ako aj metódu výpočtu intervalov spoľahlivosti s prihliadnutím na binomické rozdelenie frekvencií. Okrem bezplatných online kalkulačiek (http://www. /wald. htm a http://faculty. vassar. edu/lowry/prop1.html) možno intervaly spoľahlivosti pre frekvencie (nielen!) vypočítať pomocou Program CIA (Confidence Intervals Analysis), ktorý si môžete stiahnuť z http://www. lekárska škola. soton. ac. uk/cia/ .

Nasledujúci článok sa bude zaoberať jednorozmernými spôsobmi porovnávania kvalitatívnych údajov.

Bibliografia

Banerji A. Lekárska štatistika v jasnom jazyku: úvodný kurz / A. Banerjee. – M.: Praktické lekárstvo, 2007. – 287 s. Lekárska štatistika / . – M.: Lekárska informačná agentúra, 2007. – 475 s. Glanz S. Lekárska a biologická štatistika / S. Glanz. – M.: Praktika, 1998. Dátové typy, testovanie distribúcie a popisná štatistika // Human Ecology – 2008. – No. 1. – S. 52–58. Zhizhin K.S.. Lekárska štatistika: učebnica / . – Rostov n/d: Phoenix, 2007. – 160 s. Aplikovaná lekárska štatistika / , . - St. Petersburg. : Foliot, 2003. – 428 s. Lakin G. F. Biometria / . – M.: Vyššia škola, 1990. – 350 s. Medik V. A. Matematická štatistika v medicíne / , . – M.: Financie a štatistika, 2007. – 798 s. Matematická štatistika v klinickom výskume / , . – M.: GEOTAR-MED, 2001. – 256 s. Junkerov V. A. Lekárske a štatistické spracovanie údajov lekárskeho výskumu / , . - St. Petersburg. : VmedA, 2002. – 266 s. Agresti A. Pre intervalový odhad binomických proporcií je približné lepšie ako presné / A. Agresti, B. Coull // Americký štatistik. – 1998. – N 52. – S. 119–126. Altman D.Štatistika s istotou // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londýn: BMJ Books, 2000. – 240 s. Brown L.D. Intervalový odhad pre binomický podiel / L. D. Brown, T. T. Cai, A. Dasgupta // Štatistická veda. – 2001. – N 2. – S. 101–133. Clopper C.J. Použitie spoľahlivosti alebo fiduciálnych limitov ilustrované v prípade binomickej / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – S. 404–413. Garcia-Perez M.A. O intervale spoľahlivosti pre binomický parameter / M. A. Garcia-Perez // Kvalita a kvantita. – 2005. – N 39. – S. 467–481. Motulsky H. Intuitívna bioštatistika // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 s. Newcombe R.G. Obojstranné intervaly spoľahlivosti pre jednu proporciu: Porovnanie siedmich metód / R. G. Newcombe // Štatistika v medicíne. – 1998. – N. 17. – S. 857–872. Sauro J. Odhadovanie miery dokončenia z malých vzoriek pomocou binomických intervalov spoľahlivosti: porovnania a odporúčania / J. Sauro, J. R. Lewis // Zborník výročného stretnutia spoločnosti pre ľudské faktory a ergonómiu. – Orlando, FL, 2005. Wald A. Limity spoľahlivosti pre spojité distribučné funkcie // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – S. 105–118. Wilson E.B. Pravdepodobná inferencia, zákon nástupníctva a štatistická inferencia / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – S. 209–212.

INTERVALY DÔVERY PRE PROPORCIE

A. M. Grjibovski

Národný inštitút verejného zdravia, Oslo, Nórsko

Článok predstavuje niekoľko metód na výpočty intervalov spoľahlivosti pre binomické proporcie, a to Waldovu, Wilsonovu, arcsínusovú, Agresti-Coullovu a presnú Clopper-Pearsonovu metódu. Príspevok poskytuje len všeobecný úvod do problematiky odhadu intervalu spoľahlivosti binomickej proporcie a jeho cieľom je nielen podnietiť čitateľov k používaniu intervalov spoľahlivosti pri prezentácii výsledkov vlastného empirického výskumu, ale aj podnietiť ich k nahliadnutiu do štatistických kníh. pred analýzou vlastných údajov a prípravou rukopisov.

Kľúčové slová: interval spoľahlivosti, podiel

Kontaktné informácie:

Senior Advisor, National Institute of Public Health, Oslo, Nórsko

Z tohto článku sa dozviete:

    Čo sa stalo interval spoľahlivosti?

    Aký to má zmysel pravidlá 3 sigma?

    Ako môžete tieto poznatky uplatniť v praxi?

V dnešnej dobe kvôli prebytku informácií spojených s veľkým sortimentom produktov, predajných smerov, zamestnancov, oblastí činnosti atď. môže byť ťažké zdôrazniť to hlavné, ktorý v prvom rade stojí za pozornosť a snahu zvládnuť. Definícia interval spoľahlivosti a analýza skutočných hodnôt presahujúcich jej hranice - technika, ktorá vám pomôže upozorniť na situácie, ovplyvňovanie meniacich sa trendov. Budete schopní rozvíjať pozitívne faktory a znižovať vplyv negatívnych. Táto technológia sa používa v mnohých známych svetových spoločnostiach.

Existujú tzv. upozornenia", ktorý informovať manažérovže ďalšia hodnota je v určitom smere išiel ďalej interval spoľahlivosti. Čo to znamená? Je to signál, že došlo k nejakej nezvyčajnej udalosti, ktorá môže zmeniť doterajší trend v tomto smere. Toto je signál k tomu prísť na to v danej situácii a pochopiť, čo ju ovplyvnilo.

Zvážte napríklad niekoľko situácií. Vypočítali sme prognózu predaja s limitmi prognózy pre 100 produktov na rok 2011 podľa mesiacov a skutočných predajov v marci:

  1. Pre „Slnečnicový olej“ prekonali hornú hranicu prognózy a nespadli do intervalu spoľahlivosti.
  2. Pre „Suché droždie“ sme prekročili spodnú hranicu predpovede.
  3. „Ovsená kaša“ prekročila hornú hranicu.

Pri ostatných produktoch bol skutočný predaj v rámci daných prognózovaných limitov. Tie. ich predaj bol v rámci očakávaní. Identifikovali sme teda 3 produkty, ktoré prekročili hranice, a začali sme zisťovať, čo ich ovplyvnilo, aby prekročili hranice:

  1. V prípade Slnečnicového oleja sme vstúpili do novej distribučnej siete, čím sme získali ďalší objem predaja, čo viedlo k prekročeniu hornej hranice. Pre tento produkt sa oplatí prepočítať prognózu do konca roka s prihliadnutím na prognózu predaja pre túto sieť.
  2. Za „suché kvasnice“ auto uviazlo na colnici a do 5 dní došlo k nedostatku, čo ovplyvnilo pokles predaja a prekročilo spodnú hranicu. Možno by stálo za to zistiť, čo to spôsobilo a pokúsiť sa túto situáciu neopakovať.
  3. Bola spustená akcia na podporu predaja pre ovsenú kašu, ktorá výrazne zvýšila predaj a viedla k tomu, že spoločnosť prekročila prognózu.

Identifikovali sme 3 faktory, ktoré ovplyvnili prekročenie limitov prognózy. V živote ich môže byť oveľa viac Na zvýšenie presnosti prognóz a plánovania, faktorov, ktoré vedú k tomu, že skutočné tržby môžu presahovať prognózu, stojí za to zdôrazniť a zostaviť prognózy a plány pre ne samostatne. A potom zvážte ich vplyv na hlavnú prognózu predaja. Môžete tiež pravidelne hodnotiť vplyv týchto faktorov a meniť situáciu k lepšiemu. znížením vplyvu negatívnych a zvýšením vplyvu pozitívnych faktorov.

S intervalom spoľahlivosti môžeme:

  1. Vyberte trasu, ktoré stoja za pozornosť, pretože v týchto smeroch nastali udalosti, ktoré môžu ovplyvniť zmena trendu.
  2. Identifikujte faktory, ktoré skutočne ovplyvňujú zmenu situácie.
  3. súhlasiť informované rozhodnutie(napríklad o nákupe, plánovaní atď.).

Teraz sa pozrime na to, čo je interval spoľahlivosti a ako ho vypočítať v programe Excel pomocou príkladu.

Čo je interval spoľahlivosti?

Interval spoľahlivosti je hranica prognózy (horná a dolná), v rámci ktorej s danou pravdepodobnosťou (sigma) objavia sa skutočné hodnoty.

Tie. Vypočítame predpoveď - to je naše hlavné usmernenie, ale chápeme, že skutočné hodnoty sa pravdepodobne nebudú 100% rovnať našej predpovedi. A vyvstáva otázka, v akých hraniciach skutočné hodnoty môžu klesnúť, ak bude súčasný trend pokračovať? A táto otázka nám pomôže odpovedať výpočet intervalu spoľahlivosti, t.j. - horná a dolná hranica prognózy.

Čo je daná pravdepodobnosť sigma?

Pri výpočte interval spoľahlivosti môžeme nastaviť pravdepodobnosť hity skutočné hodnoty v rámci daných predpovedných limitov. Ako to spraviť? Aby sme to dosiahli, nastavíme hodnotu sigma a ak sa sigma rovná:

    3 sigma- potom pravdepodobnosť ďalšej skutočnej hodnoty spadajúcej do intervalu spoľahlivosti bude 99,7 % alebo 300 ku 1, alebo je 0,3 % pravdepodobnosť prekročenia hraníc.

    2 sigma- potom pravdepodobnosť ďalšej hodnoty spadajúcej do hraníc je ≈ 95,5 %, t.j. šance sú asi 20 ku 1, alebo je 4,5% šanca, že to prekročíte.

    1 sigma- potom je pravdepodobnosť ≈ 68,3 %, t.j. pravdepodobnosť je približne 2 ku 1 alebo existuje 31,7 % šanca, že ďalšia hodnota bude mimo intervalu spoľahlivosti.

Formulovali sme pravidlo 3 sigma,ktorý hovorí, že pravdepodobnosť zásahu iná náhodná hodnota do intervalu spoľahlivosti s danou hodnotou tri sigma je 99,7%.

Veľký ruský matematik Čebyšev dokázal vetu, že existuje 10% pravdepodobnosť prekročenia predpovedných limitov s danou hodnotou troch sigma. Tie. pravdepodobnosť spadnutia do 3-sigma intervalu spoľahlivosti bude minimálne 90 %, pričom pokus o výpočet prognózy a jej hraníc „od oka“ je plný oveľa výraznejších chýb.

Ako vypočítať interval spoľahlivosti sami v Exceli?

Pozrime sa na príklade výpočtu intervalu spoľahlivosti v Exceli (t. j. hornej a dolnej hranice prognózy). Máme časový rad - predaj podľa mesiacov za 5 rokov. Pozri si prílohu.

Na výpočet limitov prognózy vypočítame:

  1. Prognóza predaja().
  2. Sigma - štandardná odchýlka predpovedné modely zo skutočných hodnôt.
  3. Tri sigma.
  4. Interval spoľahlivosti.

1. Prognóza predaja.

=(RC[-14] (údaje z časových radov)- RC[-1] (hodnota modelu))^2 (štvorec)


3. Za každý mesiac spočítajme hodnoty odchýlok od štádia 8 Sum((Xi-Ximod)^2), t.j. Zhrňme si január, február... za každý rok.

Ak to chcete urobiť, použite vzorec =SUMIF()

SUMIF(pole s číslami období vo vnútri cyklu (pre mesiace od 1 do 12); prepojenie na číslo obdobia v cykle; prepojenie na pole so štvorcami rozdielu medzi zdrojovými údajmi a hodnotami obdobia)


4. Vypočítajte štandardnú odchýlku pre každé obdobie v cykle od 1 do 12 (10. fáza v priloženom súbore).

Aby sme to dosiahli, extrahujeme koreň z hodnoty vypočítanej v štádiu 9 a vydelíme počtom období v tomto cykle mínus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Použime vzorce v Exceli =ROOT(R8 (odkaz na (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (odkaz na pole s číslami cyklov); O8 (odkaz na konkrétne číslo cyklu, ktoré počítame v poli))-1))

Pomocou vzorca Excel = COUNTIF spočítame číslo n


Po vypočítaní štandardnej odchýlky skutočných údajov z predpovedného modelu sme získali hodnotu sigma pre každý mesiac - fáza 10 v priloženom súbore.

3. Vypočítajme 3 sigma.

V štádiu 11 nastavíme počet sigmov - v našom príklade „3“ (fáza 11 v priloženom súbore):

Vhodné aj na precvičovanie sigma hodnôt:

1,64 sigma - 10% šanca na prekročenie limitu (1 šanca z 10);

1,96 sigma – 5 % šanca na prekročenie limitov (1 šanca z 20);

2,6 sigma – 1 % šanca na prekročenie limitov (1 šanca zo 100).

5) Výpočet troch sigma, na tento účel vynásobíme hodnoty „sigma“ za každý mesiac „3“.

3. Určite interval spoľahlivosti.

  1. Horný limit predpovede- prognóza predaja zohľadňujúca rast a sezónnosť + (plus) 3 sigma;
  2. Dolný limit predpovede- prognóza predaja zohľadňujúca rast a sezónnosť – (mínus) 3 sigma;

Pre pohodlie výpočtu intervalu spoľahlivosti na dlhé obdobie (pozri priložený súbor) použijeme vzorec Excel =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), Kde

Y8- prognóza predaja;

W8- číslo mesiaca, pre ktorý budeme brať hodnotu 3-sigma;

Tie. Horný limit predpovede= „predpoveď predaja“ + „3 sigma“ (v príklade VLOOKUP(číslo mesiaca; tabuľka s 3 hodnotami sigma; stĺpec, z ktorého extrahujeme hodnotu sigma rovnajúcu sa číslu mesiaca v príslušnom riadku; 0)).

Dolný limit predpovede= „predpoveď predaja“ mínus „3 sigma“.

V Exceli sme teda vypočítali interval spoľahlivosti.

Teraz máme predpoveď a rozsah s hranicami, do ktorých budú skutočné hodnoty spadať s danou sigma pravdepodobnosťou.

V tomto článku sme sa pozreli na to, čo je sigma a pravidlo troch sigma, ako určiť interval spoľahlivosti a prečo môžete túto techniku ​​použiť v praxi.

Prajeme vám presné predpovede a úspech!

Ako Forecast4AC PRO vám môže pomôcťpri výpočte intervalu spoľahlivosti?:

    Forecast4AC PRO automaticky vypočíta hornú alebo dolnú hranicu predpovede pre viac ako 1000 časových radov súčasne;

    Schopnosť analyzovať hranice prognózy v porovnaní s prognózou, trendom a skutočným predajom na grafe jedným stlačením klávesu;

V programe Forcast4AC PRO je možné nastaviť hodnotu sigma od 1 do 3.

Pripoj sa k nám!

Stiahnite si bezplatné aplikácie na prognózovanie a analýzu podnikania:


  • Novo Forecast Lite- automatický predpovedný výpočet V Excel.
  • 4analytics - Analýza ABC-XYZ a analýzu emisií Excel.
  • Qlik Sense Desktop a QlikViewPersonal Edition - BI systémy pre analýzu a vizualizáciu dát.

Otestujte možnosti platených riešení:

  • Novo Forecast PRO- prognózovanie v Exceli pre veľké súbory údajov.

Akákoľvek vzorka poskytuje iba približnú predstavu o všeobecnej populácii a všetky štatistické charakteristiky vzorky (priemer, modus, rozptyl...) sú aproximáciou alebo povedzme odhadom všeobecných parametrov, ktoré vo väčšine prípadov nie je možné vypočítať. k neprístupnosti bežnej populácie (obrázok 20) ​​.

Obrázok 20. Chyba pri odbere vzoriek

Môžete však určiť interval, v ktorom s určitou mierou pravdepodobnosti leží skutočná (všeobecná) hodnota štatistickej charakteristiky. Tento interval sa nazýva d interval spoľahlivosti (CI).

Takže všeobecná priemerná hodnota s pravdepodobnosťou 95% leží v rámci

od do, (20)

Kde t – tabuľková hodnota Študentovho testu pre α = 0,05 a f= n-1

V tomto prípade možno nájsť aj 99 % CI t vybrané pre α =0,01.

Aký je praktický význam intervalu spoľahlivosti?

    Široký interval spoľahlivosti naznačuje, že priemer vzorky presne neodráža priemer populácie. Je to zvyčajne spôsobené nedostatočnou veľkosťou vzorky, prípadne jej heterogenitou, t.j. veľký rozptyl. Obidve poskytujú väčšiu chybu priemeru, a teda aj širší CI. A to je základ pre návrat do fázy plánovania výskumu.

    Horná a dolná hranica CI poskytujú odhad, či budú výsledky klinicky významné

Zastavme sa podrobnejšie pri otázke štatistickej a klinickej významnosti výsledkov štúdia skupinových vlastností. Pripomeňme si, že úlohou štatistiky je na základe vzorových údajov odhaliť aspoň nejaké rozdiely vo všeobecných populáciách. Výzvou pre lekárov je odhaliť rozdiely (nie hocijaké), ktoré pomôžu diagnostike alebo liečbe. A štatistické závery nie sú vždy základom pre klinické závery. Štatisticky významný pokles hemoglobínu o 3 g/l teda nie je dôvodom na obavy. A naopak, ak nejaký problém v ľudskom tele nie je rozšírený na úrovni celej populácie, nie je to dôvod, aby sme sa týmto problémom nezaoberali.

Pozrime sa na túto situáciu príklad.

Výskumníkov zaujímalo, či chlapci, ktorí trpeli nejakým druhom infekčného ochorenia, nezaostávajú v raste za svojimi rovesníkmi. Na tento účel bola vykonaná vzorová štúdia, ktorej sa zúčastnilo 10 chlapcov, ktorí trpeli týmto ochorením. Výsledky sú uvedené v tabuľke 23.

Tabuľka 23. Výsledky štatistického spracovania

nižší limit

Horná hranica

Normy (cm)

priemer

Z týchto výpočtov vyplýva, že priemerná výška vzorky 10-ročných chlapcov, ktorí trpeli nejakým infekčným ochorením, sa blíži k normálu (132,5 cm). Spodná hranica intervalu spoľahlivosti (126,6 cm) však naznačuje, že existuje 95 % pravdepodobnosť, že skutočná priemerná výška týchto detí zodpovedá pojmu „nízka výška“, t.j. tieto deti sú zakrpatené.

V tomto príklade sú výsledky výpočtov intervalu spoľahlivosti klinicky významné.

Páčil sa vám článok? Zdieľaj to