Kapcsolatok

Konfidenciaintervallum az átlag becsléséhez (a szórás ismert) MS EXCEL-ben. Megbízhatósági intervallum kiszámítása a Microsoft Excel programban

Megbízhatósági intervallum (CI; angolul konfidencia intervallum - CI), amelyet a mintán végzett vizsgálat során kaptunk, a vizsgálat eredményeinek pontosságát (vagy bizonytalanságát) méri, hogy következtetéseket lehessen levonni az összes ilyen beteg populációjára (általános populációra) ). Helyes definíció A 95%-os CI a következőképpen fogalmazható meg: az ilyen intervallumok 95%-a tartalmazza a valódi értéket a sokaságban. Ez az értelmezés valamivel kevésbé pontos: a CI az az értéktartomány, amelyen belül 95%-ig biztos lehet benne, hogy a valódi értéket tartalmazza. A CI használatakor a kvantitatív hatás meghatározásán van a hangsúly, szemben a statisztikai szignifikancia vizsgálata eredményeként kapott P értékkel. A P érték nem értékel semmilyen mennyiséget, hanem inkább a bizonyíték erősségének mérőszámaként szolgál a „nincs hatás” nullhipotézissel szemben. A P értéke önmagában nem mond semmit a különbség nagyságáról, de még az irányáról sem. Ezért a P független értékei egyáltalán nem informatívak a cikkekben vagy absztraktokban. Ezzel szemben a CI az azonnali érdeklődésre számot tartó hatás mértékét, például a kezelés hasznosságát, és a bizonyítékok erősségét is jelzi. Ezért a DI közvetlenül kapcsolódik a DM gyakorlatához.

A statisztikai elemzés pontozásos megközelítése, amelyet a CI szemléltet, az érdeklődésre számot tartó hatás nagyságának mérésére irányul (a diagnosztikai teszt érzékenysége, előre jelzett előfordulási gyakoriság, relatív kockázatcsökkentés kezeléssel stb.), és mérni e hatás bizonytalanságát. Leggyakrabban a CI a becslés mindkét oldalán lévő értéktartomány, amelyben valószínűleg a valódi érték rejlik, és ebben 95%-ban biztos lehetsz. A 95%-os valószínűség használatára vonatkozó megállapodás tetszőleges, csakúgy, mint a P értéke<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

A CI azon az elgondoláson alapul, hogy a különböző betegcsoportokon végzett ugyanazon vizsgálat nem hozna azonos eredményeket, hanem az eredmények a valódi, de ismeretlen érték körül oszlanak meg. Más szavakkal, a CI ezt "mintafüggő változékonyságként" írja le. A CI nem tükröz további okokból eredő bizonytalanságot; különösen nem tartalmazza a betegek szelektív elvesztésének nyomon követésre gyakorolt ​​hatásait, a rossz együttműködést vagy pontatlan eredményméréseket, a vakítás hiányát stb. A CI tehát mindig alábecsüli a bizonytalanság teljes mértékét.

Konfidencia intervallum számítása

táblázat A1.1. Standard hibák és konfidenciaintervallumok egyes klinikai méréseknél

A CI-t általában egy mennyiségi mérőszám megfigyelt becsléséből számítják ki, például a két arány közötti különbség (d) és a különbség becslésében szereplő standard hiba (SE) alapján. Az így kapott hozzávetőlegesen 95%-os CI d ± 1,96 SE. A képlet az eredménymutató jellegétől és a CI lefedettségétől függően változik. Például egy acelluláris pertussis vakcinával végzett randomizált, placebo-kontrollos vizsgálatban szamárköhögés alakult ki a vakcinát kapott 1670 csecsemő közül 72-nél (4,3%), a kontrollcsoportban pedig 1665-ből 240-nél (14,4%). Az abszolút kockázatcsökkentésnek nevezett százalékos eltérés 10,1%. Ennek a különbségnek a SE 0,99%. Ennek megfelelően a 95%-os CI 10,1% + 1,96 x 0,99%, azaz. 8,2-től 12,0-ig.

A különböző filozófiai megközelítések ellenére a CI-k és a statisztikai szignifikancia-tesztek matematikailag szorosan összefüggenek.

Így P értéke „szignifikáns”, azaz. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

A becslés CI-ben kifejezett bizonytalansága (pontatlansága) nagymértékben összefügg a minta méretének négyzetgyökével. A kis minták kevesebb információt szolgáltatnak, mint a nagy minták, és a CI-k ennek megfelelően szélesebbek a kisebb mintákban. Például egy cikk, amely a Helicobacter pylori fertőzés diagnosztizálására használt három teszt teljesítményét hasonlítja össze, a karbamid kilégzési teszt 95,8%-os érzékenységéről számolt be (95% CI 75-100). Míg a 95,8%-os adat lenyűgözőnek tűnik, a 24 felnőtt H. pylori betegből álló kis mintaszám azt jelenti, hogy ez a becslés jelentős bizonytalanságot mutat, amint azt a széles CI mutatja. Valójában a 75%-os alsó határ sokkal alacsonyabb, mint a 95,8%-os becslés. Ha ugyanazt az érzékenységet figyelnénk meg egy 240 fős mintában, akkor a 95%-os CI 92,5-98,0 lenne, ami nagyobb biztosítékot ad arra, hogy a teszt nagyon érzékeny.

A randomizált kontrollált vizsgálatokban (RCT-k) a nem szignifikáns eredmények (azaz azok, amelyeknél P > 0,05) különösen hajlamosak a félreértelmezésre. A CI különösen hasznos itt, mivel jelzi, hogy az eredmények mennyire kompatibilisek a klinikailag hasznos valódi hatással. Például egy RCT-ben, amely a varrat és a kapcsos anasztomózis összehasonlítását végezte a vastagbélben, a sebfertőzés a betegek 10,9%-ánál, illetve 13,5%-ánál alakult ki (P = 0,30). Ennek a különbségnek a 95%-os CI-je 2,6% (-2-től +8-ig). Még ebben a vizsgálatban is, amelyben 652 beteg vett részt, továbbra is valószínű, hogy szerény különbség mutatkozik a két eljárásból eredő fertőzések előfordulási gyakoriságában. Minél kisebb a vizsgálat, annál nagyobb a bizonytalanság. Sung és mtsai. RCT-t végzett, amelyben az oktreotid infúziót a sürgősségi szkleroterápiával hasonlította össze 100 betegnél az akut varikális vérzés miatt. Az oktreotid csoportban a vérzésleállási arány 84% volt; a szkleroterápiás csoportban - 90%, ami P = 0,56-ot ad. Ne feledje, hogy a folyamatos vérzés aránya hasonló a sebfertőzésekhez az említett vizsgálatban. Ebben az esetben azonban a beavatkozások közötti különbség 95%-os CI-je 6% (-7 és +19 között). Ez a tartomány meglehetősen széles ahhoz az 5%-os eltéréshez képest, amely klinikailag érdekes lenne. Egyértelmű, hogy a vizsgálat nem zárja ki a hatásosság jelentős különbségét. Ezért a szerzők következtetése, hogy "az oktreotid infúzió és a szkleroterápia egyformán hatékony a varix vérzések kezelésében" határozottan nem helytálló. Az ilyen esetekben, amikor az abszolút kockázatcsökkentés (ARR) 95%-os CI-je nullát tartalmaz, mint itt, az NNT CI-je (a kezeléshez szükséges szám) meglehetősen nehezen értelmezhető. Az NLP-t és annak CI-jét az ACP reciprokából kapjuk (ezeket megszorozzuk 100-zal, ha ezeket az értékeket százalékban adjuk meg). Itt kapjuk az Atomerőmű = 100: 6 = 16,6 95%-os CI-vel -14,3 és 5,3 között. Amint az a táblázat „d” lábjegyzetéből látható. A1.1, ez a CI tartalmazza az NTPP-értékeket 5,3-tól a végtelenig és az NTLP-értékeket 14,3-tól a végtelenig.

A CI-ket a leggyakrabban használt statisztikai becslésekhez vagy összehasonlításokhoz lehet létrehozni. Az RCT-k esetében tartalmazza az átlagos arányok, a relatív kockázatok, az esélyhányadosok és az NRR-ek közötti különbséget. Hasonlóképpen, CI-k kaphatók a diagnosztikai teszt pontosságával kapcsolatos vizsgálatok során végzett összes fő becsléshez – érzékenység, specifitás, pozitív prediktív érték (melyek mindegyike egyszerű arányok) és valószínűségi arányok – a metaanalízisek során kapott becslések és a kontrollhoz való összehasonlítás. tanulmányok. A Statistics with Confidence második kiadásával elérhető egy személyi számítógépes program, amely a DI számos ilyen felhasználási területét lefedi. Az arányok CI-jének kiszámítására szolgáló makrók ingyenesen elérhetők az Excelben, valamint az SPSS és Minitab statisztikai programokban a következő címen: http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

A kezelés hatásának többszöri értékelése

Míg a CI-k felépítése kívánatos egy tanulmány elsődleges kimeneteléhez, nem szükséges minden eredményhez. A CI klinikailag fontos összehasonlításokra vonatkozik. Például két csoport összehasonlításakor a helyes CI az, amelyik a csoportok közötti különbségre épül fel, amint az a fenti példákban látható, és nem az a CI, amely az egyes csoportok becsléséhez építhető fel. Nemcsak hiábavaló külön CI-t adni az egyes csoportok pontszámaihoz, ez a bemutatás félrevezető is lehet. Hasonlóképpen, a helyes megközelítés a különböző alcsoportok kezelési hatékonyságának összehasonlításakor az, hogy két (vagy több) alcsoportot közvetlenül összehasonlítunk. Helytelen azt feltételezni, hogy a kezelés csak egy alcsoportban hatékony, ha annak CI-je kizárja a hatástalannak megfelelő értéket, míg mások nem. A CI-k akkor is hasznosak, ha több alcsoport eredményeit hasonlítják össze. ábrán. Az A1.1 mutatja az eclampsia relatív kockázatát preeclampsiában szenvedő nőknél a placebo-kontrollos magnézium-szulfát RCT-ből származó nők alcsoportjaiban.

Rizs. A1.2. A Forest Graph a hasmenés megelőzésére szolgáló szarvasmarha-rotavírus vakcinával végzett 11 randomizált klinikai vizsgálat eredményeit mutatja be a placebóval szemben. A 95%-os konfidencia intervallumot használták a hasmenés relatív kockázatának becslésére. A fekete négyzet mérete arányos az információ mennyiségével. Ezen kívül megjelenik a kezelés hatékonyságának összefoglaló becslése és a 95%-os konfidencia intervallum (gyémánttal jelölve). A metaanalízis véletlen-hatások modelljét használta, amely meghaladja néhány előre meghatározott modellt; lehet például a mintaméret kiszámításához használt méret. Szigorúbb kritérium szerint a CI-k teljes körének olyan előnyt kell mutatnia, amely meghaladja az előre meghatározott minimumot.

Korábban már tárgyaltuk azt a tévedést, hogy a statisztikai szignifikancia hiányát annak jelzéseként tekintjük, hogy két kezelés egyformán hatékony. Ugyanilyen fontos, hogy ne a statisztikai szignifikancia és a klinikai szignifikancia egyenlőségjelet tegyük. Klinikai jelentősége akkor feltételezhető, ha az eredmény statisztikailag szignifikáns és a kezelési válasz nagysága

A vizsgálatok kimutathatják, hogy az eredmények statisztikailag szignifikánsak-e, és melyek klinikailag fontosak és melyek nem. ábrán. Az A1.2 négy kísérlet eredményeit mutatja, amelyekre a teljes CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

És mások. Mindegyik elméleti megfelelőjének becslése, amelyet akkor kaphatnánk meg, ha nem minta lenne, hanem az általános sokaság. De sajnos az általános lakosság nagyon drága és gyakran elérhetetlen.

Az intervallumbecslés fogalma

Minden mintabecslésnek van némi szórása, mert egy valószínűségi változó, amely egy adott mintában lévő értékektől függ. Ezért a megbízhatóbb statisztikai következtetésekhez nem csak a pontbecslést kell ismerni, hanem az intervallumot is, ami nagy valószínűséggel γ (gamma) takarja a becsült mutatót θ (théta).

Formálisan ez két ilyen érték (statisztika) T1(X)és T2(X), mit T1< T 2 , amelyre adott valószínűségi szinten γ feltétel teljesül:

Röviden: valószínű γ vagy több az igazi érték a pontok között van T1(X)és T2(X), amelyeket alsó és felső határnak nevezünk megbízhatósági intervallum.

A konfidenciaintervallumok felépítésének egyik feltétele annak maximális szűksége, pl. a lehető legrövidebbnek kell lennie. A vágy egészen természetes, mert. a kutató igyekszik pontosabban lokalizálni a kívánt paraméter megtalálását.

Ebből következik, hogy a konfidenciaintervallumnak le kell fednie az eloszlás maximális valószínűségét. és maga a kotta legyen a középpontban.

Vagyis a valós mutatónak a becsléstől való felfelé való eltérésének valószínűsége megegyezik a lefelé való eltérés valószínűségével. Azt is meg kell jegyezni, hogy ferde eloszlások esetén a jobb oldali intervallum nem egyenlő a bal oldali intervallummal.

A fenti ábra egyértelműen mutatja, hogy minél nagyobb a megbízhatósági szint, annál szélesebb az intervallum - közvetlen kapcsolat.

Ez egy kis bevezető volt az ismeretlen paraméterek intervallumbecslésének elméletébe. Térjünk át a matematikai elvárás megbízhatósági határainak megtalálására.

Konfidenciaintervallum a matematikai elvárásokhoz

Ha az eredeti adatok el vannak osztva, akkor az átlag normál érték lesz. Ez abból a szabályból következik, hogy a normálértékek lineáris kombinációjának normális eloszlása ​​is van. Ezért a valószínűségek kiszámításához használhatjuk a normál eloszlási törvény matematikai apparátusát.

Ehhez azonban két paraméter ismeretére lesz szükség - a várható értékre és a szórásra, amelyek általában nem ismertek. Természetesen használhatunk paraméterek helyett becsléseket (számtani átlag és ), de akkor az átlag eloszlása ​​nem lesz egészen normális, kissé lelapul. William Gosset ír állampolgár ügyesen megjegyezte ezt a tényt, amikor a Biometrica 1908. márciusi számában közzétette felfedezését. Titoktartási okokból Gosset aláírta a Studentet. Így jelent meg a Student-féle t-eloszlás.

A K. Gauss által a csillagászati ​​megfigyelések hibáinak elemzése során használt adatok normál eloszlása ​​azonban rendkívül ritka a földi életben, és ezt meglehetősen nehéz megállapítani (a nagy pontossághoz körülbelül 2 ezer megfigyelés szükséges). Ezért a legjobb, ha elvetjük a normalitás feltevést, és olyan módszereket alkalmazunk, amelyek nem függnek az eredeti adatok eloszlásától.

Felmerül a kérdés: mi a számtani közép eloszlása, ha ismeretlen eloszlás adataiból számítjuk? A választ a valószínűségszámításban jól ismertek adják Központi határérték tétel(CPT). A matematikában ennek több változata is létezik (a megfogalmazások az évek során finomodtak), de ezek mindegyike durván szólva arra az állításra vezet le, hogy nagyszámú független valószínűségi változó összege engedelmeskedik a normális eloszlási törvénynek.

A számtani átlag kiszámításakor a valószínűségi változók összegét használjuk. Ebből kiderül, hogy a számtani középnek normális eloszlása ​​van, amelyben a várható érték a kiindulási adatok várható értéke, a variancia pedig .

Az okos emberek tudják, hogyan kell bizonyítani a CLT-t, de mi ezt egy Excelben végzett kísérlet segítségével ellenőrizzük. Szimuláljunk egy 50 egyenletes eloszlású valószínűségi változóból álló mintát (az Excel RANDOMBETWEEN függvényével). Ezután készítünk 1000 ilyen mintát, és mindegyikre kiszámítjuk a számtani átlagot. Nézzük a megoszlásukat.

Látható, hogy az átlag eloszlása ​​közel áll a normál törvényhez. Ha a minták mennyiségét és számát még nagyobbra tesszük, akkor a hasonlóság még jobb lesz.

Most, hogy mi magunk is meggyőződtünk a CLT érvényességéről, a segítségével kiszámíthatjuk a számtani átlag konfidenciaintervallumait, amelyek adott valószínűséggel fedik le a valódi átlagot vagy a matematikai várakozást.

A felső és alsó határ megállapításához ismerni kell a normális eloszlás paramétereit. Általában nem használják őket, ezért becsléseket használnak: számtani átlagaés minta variancia. Ez a módszer ismét csak nagy minták esetén ad jó közelítést. Ha a minták kicsik, gyakran javasolt a Student-féle eloszlás használata. Ne hidd! Az átlag Student-féle eloszlása ​​csak akkor fordul elő, ha az eredeti adat normális eloszlású, vagyis szinte soha. Ezért jobb, ha azonnal beállítja a minimális sávot a szükséges adatok mennyiségére, és aszimptotikusan helyes módszereket alkalmaz. Azt mondják, 30 megfigyelés elég. Vegyél 50-et – nem hibázhatsz.

T 1.2 a konfidencia intervallum alsó és felső határa

– minta számtani átlag

s0– minta szórása (elfogulatlan)

n - minta nagysága

γ – megbízhatósági szint (általában 0,9, 0,95 vagy 0,99)

c γ =Φ -1 ((1+γ)/2) a standard normális eloszlási függvény reciproka. Egyszerűen fogalmazva, ez a standard hibák száma az aritmetikai átlagtól az alsó vagy felső határig (a jelzett három valószínűség az 1,64, 1,96 és 2,58 értékeknek felel meg).

A képlet lényege, hogy felvesszük a számtani átlagot, majd abból egy bizonyos összeget félreteszünk ( γ-val) standard hibák ( s 0 /√n). Minden ismert, vedd és számolj.

A PC-k tömeges használata előtt a normál eloszlási függvény és annak inverze értékeinek megszerzéséhez a . Továbbra is használatosak, de hatékonyabb a kész Excel képletek felé fordulni. A fenti képlet összes eleme ( , és ) könnyen kiszámítható Excelben. De van egy kész képlet is a konfidenciaintervallum kiszámítására - BIZALOM NORM. A szintaxisa a következő.

BIZTONSÁGI NORM(alfa, standard_dev, méret)

alfa– szignifikanciaszint vagy konfidenciaszint, amely a fenti jelölésben egyenlő 1-γ-val, azaz. annak a valószínűsége, hogy a matematikaia várakozás a konfidenciaintervallumon kívül lesz. 0,95-ös megbízhatósági szint mellett az alfa 0,05, és így tovább.

standard_off a mintaadatok szórása. A standard hibát nem kell kiszámítani, az Excel osztja az n gyökével.

a méret– mintanagyság (n).

A CONFIDENCE.NORM függvény eredménye a konfidenciaintervallum számítási képletének második tagja, azaz. fél intervallum. Ennek megfelelően az alsó és felső pont az átlag ± a kapott érték.

Így lehetőség nyílik egy univerzális algoritmus felépítésére a számtani átlag konfidenciaintervallumának kiszámítására, amely nem függ a kiindulási adatok eloszlásától. Az univerzalitás ára aszimptotikus volta, azaz. viszonylag nagy minták használatának szükségessége. A modern technológia korában azonban a megfelelő mennyiségű adat összegyűjtése általában nem nehéz.

Statisztikai hipotézisek tesztelése bizalmi intervallum segítségével

(111. modul)

A statisztika egyik fő megoldandó problémája az. Dióhéjban a lényege ez. Feltételezzük például, hogy az általános népesség elvárása valamilyen értékkel egyenlő. Ezután megszerkesztjük a mintaátlagok eloszlását, amely adott elvárás mellett megfigyelhető. Ezután megnézzük, hogy ebben a feltételes eloszlásban hol található a valós átlag. Ha túllépi a megengedett határokat, akkor egy ilyen átlag megjelenése nagyon valószínűtlen, és a kísérlet egyszeri megismétlésével szinte lehetetlen, ami ellentmond a feltett hipotézisnek, amelyet sikeresen elvetettek. Ha az átlag nem lépi túl a kritikus szintet, akkor a hipotézist nem utasítják el (de nem is igazolják!).

Tehát a konfidenciaintervallumok segítségével, esetünkben az elvárásra vonatkozóan, néhány hipotézist is tesztelhet. Nagyon könnyű megtenni. Tegyük fel, hogy valamelyik minta számtani középértéke 100. Azt a hipotézist teszteljük, hogy a várakozás mondjuk 90. ​​Vagyis, ha primitíven tesszük fel a kérdést, ez így hangzik: lehet-e ez a valódi érték mellett. átlag 90, a megfigyelt átlag 100 volt?

A kérdés megválaszolásához további információkra lesz szükség a szórással és a minta méretével kapcsolatban. Tegyük fel, hogy a szórása 30, a megfigyelések száma pedig 64 (a gyökér egyszerű kinyeréséhez). Ekkor az átlag standard hibája 30/8 vagy 3,75. A 95%-os konfidencia intervallum kiszámításához félre kell tenni két standard hibát az átlag (pontosabban 1,96) mindkét oldalán. A konfidenciaintervallum körülbelül 100 ± 7,5, vagy 92,5 és 107,5 között lesz.

A további érvelés a következő. Ha a vizsgált érték a konfidencia intervallumon belülre esik, akkor az nem mond ellent a hipotézisnek, mivel beleillik a véletlenszerű ingadozások határai közé (95%-os valószínűséggel). Ha a vizsgált pont a konfidenciaintervallumon kívül esik, akkor egy ilyen esemény valószínűsége nagyon kicsi, minden esetben az elfogadható szint alatt van. Ezért a hipotézist elvetjük, mivel ellentmond a megfigyelt adatoknak. Esetünkben a várakozási hipotézis a konfidenciaintervallumon kívül esik (a 90-es tesztelt érték nem szerepel a 100±7,5-ös intervallumban), ezért el kell vetni. A fenti primitív kérdésre válaszolva azt kell mondani: nem, nem, mindenesetre ez rendkívül ritkán fordul elő. Ez gyakran a hipotézis hibás elutasításának konkrét valószínűségét jelzi (p-szint), és nem egy adott szintet, amely szerint a konfidenciaintervallumot felépítették, hanem erről majd máskor.

Amint látja, nem nehéz felépíteni egy konfidenciaintervallumot az átlaghoz (vagy a matematikai elváráshoz). A lényeg, hogy felfogd a lényeget, aztán mennek a dolgok. A gyakorlatban a legtöbben a 95%-os konfidencia intervallumot használják, ami körülbelül két standard hiba széles az átlag mindkét oldalán.

Ez minden most. Minden jót!

FREKVENCIÁK ÉS ALKATRÉSZEK BIZTONSÁGI INTERVALLUMAI

© 2008

Országos Közegészségügyi Intézet, Oslo, Norvégia

A cikk leírja és tárgyalja a gyakoriságok és arányok konfidenciaintervallumainak kiszámítását Wald, Wilson, Klopper-Pearson módszerekkel, szögtranszformációval és Wald módszerrel Agresti-Cowll korrekcióval. A bemutatott anyag általános tájékoztatást nyújt a gyakoriságok és arányok konfidenciaintervallumának kiszámításának módszereiről, és célja, hogy felkeltse a folyóirat olvasóinak érdeklődését nemcsak a konfidenciaintervallumok használatára vonatkozóan saját kutatásaik eredményeinek bemutatásakor, hanem a szakirodalom elolvasása iránt is, mielőtt elkezdené. dolgozzon a jövőbeni kiadványokon.

Kulcsszavak: konfidencia intervallum, gyakoriság, arány

Az egyik korábbi publikációban röviden megemlítették a kvalitatív adatok leírását, és közölték, hogy ezek intervallumbecslése előnyösebb, mint a pontbecslés a vizsgált jellemző általános populációban való előfordulási gyakoriságának leírására. Valójában, mivel a vizsgálatokat mintaadatok felhasználásával végzik, az eredmények általános sokaságra való vetítésének tartalmaznia kell egy pontatlanságot a mintabecslésben. A konfidencia intervallum a becsült paraméter pontosságának mértéke. Érdekes, hogy egyes, a statisztika alapjairól szóló könyvekben az orvosok számára teljesen figyelmen kívül hagyják a gyakoriságok konfidenciaintervallumának témáját. Ebben a cikkben számos módszert megvizsgálunk a gyakoriságok konfidenciaintervallumának kiszámítására, feltételezve a minta jellemzőit, például a nem ismétlődést és a reprezentativitást, valamint a megfigyelések egymástól való függetlenségét. Ebben a cikkben a gyakoriság nem egy abszolút szám, amely megmutatja, hogy ez vagy az az érték hányszor fordul elő az aggregátumban, hanem egy relatív érték, amely meghatározza a vizsgálatban résztvevők arányát, akik rendelkeznek a vizsgált tulajdonsággal.

Az orvosbiológiai kutatásokban leggyakrabban 95%-os konfidencia intervallumokat alkalmaznak. Ez a konfidenciaintervallum az a régió, amelybe a valós arány az idő 95%-ában esik. Más szóval, 95%-os biztonsággal állítható, hogy egy tulajdonság előfordulási gyakoriságának valós értéke az általános populációban a 95%-os konfidencia intervallumon belül lesz.

Az orvoskutatók számára készült statisztikai tankönyvek többsége arról számol be, hogy a gyakorisági hibát a képlet segítségével számítják ki

ahol p a jellemző előfordulási gyakorisága a mintában (0 és 1 közötti érték). A legtöbb hazai tudományos cikkben egy jellemző előfordulási gyakoriságának értéke a mintában (p), valamint annak hibája (s) szerepel p ± s formában. Célszerűbb azonban egy 95%-os konfidenciaintervallumot bemutatni egy tulajdonság általános populációban való előfordulásának gyakoriságára, amely tartalmazza majd a

előtt.

Egyes tankönyvekben kis minták esetén javasolt az 1,96-os értéket a t értékkel helyettesíteni N - 1 szabadsági fok esetén, ahol N a mintában lévő megfigyelések száma. A t értéke megtalálható a t-eloszlás táblázataiban, amelyek szinte minden statisztikai tankönyvben megtalálhatók. A t eloszlásának használata a Wald-módszerhez nem nyújt látható előnyöket az alább tárgyalt többi módszerhez képest, ezért egyes szerzők nem üdvözlik.

A gyakoriságok vagy törtek konfidenciaintervallumainak kiszámítására szolgáló fenti módszer Abraham Waldról (Abraham Wald, 1902–1950) kapta a nevét, mivel Wald és Wolfowitz 1939-es publikációja után kezdték széles körben használni. Magát a módszert azonban Pierre Simon Laplace (1749–1827) javasolta már 1812-ben.

A Wald-módszer nagyon népszerű, de alkalmazása jelentős problémákkal jár. A módszer nem ajánlott kis mintaméreteknél, valamint olyan esetekben, amikor egy jellemző előfordulási gyakorisága 0 vagy 1 (0% vagy 100%) felé hajlik, és egyszerűen nem lehetséges 0 és 1 gyakoriság esetén. a normál eloszlási közelítés, amelyet a hiba kiszámításakor használunk, "nem működik" olyan esetekben, amikor n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Mivel az új változó normális eloszlású, a φ változó 95%-os konfidenciaintervallumának alsó és felső határa φ-1,96 és φ+1,96left">

A kis minták 1,96 helyett javasolt N - 1 szabadságfok helyett t értékkel helyettesíteni. Ez a módszer nem ad negatív értékeket, és lehetővé teszi a gyakoriságok konfidenciaintervallumának pontosabb becslését, mint a Wald-módszer. Emellett számos hazai orvosstatisztikai referenciakönyv is leírja, ami azonban nem vezetett az orvosi kutatásokban való széles körű használatához. A konfidenciaintervallumok szögtranszformációval történő kiszámítása nem javasolt 0-hoz vagy 1-hez közelítő gyakoriságok esetén.

Ezzel általában véget is ér a legtöbb statisztika alapjaival foglalkozó, orvoskutatók számára készült könyv konfidenciaintervallum-becslési módszereinek ismertetése, és ez a probléma nemcsak a hazai, hanem a külföldi szakirodalomra is jellemző. Mindkét módszer a központi határérték tételen alapul, ami nagy mintát jelent.

Tekintettel a konfidenciaintervallumok fenti módszerekkel történő becslésének hiányosságaira, Clopper (Clopper) és Pearson (Pearson) 1934-ben egy módszert javasolt az úgynevezett egzakt konfidenciaintervallum kiszámítására, figyelembe véve a vizsgált tulajdonság binomiális eloszlását. Ez a módszer számos online számológépben elérhető, azonban az így kapott konfidencia intervallumok a legtöbb esetben túl szélesek. Ugyanakkor ez a módszer olyan esetekben javasolt, amikor óvatos becslésre van szükség. A módszer konzervatívságának foka a minta méretének csökkenésével nő, különösen N esetében< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Sok statisztikus szerint a gyakoriságok konfidenciaintervallumának legoptimálisabb becslését az 1927-ben javasolt, de a hazai orvosbiológiai kutatásokban gyakorlatilag nem használt Wilson-módszer végzi. Ez a módszer nemcsak nagyon kicsi és nagyon magas gyakoriságok konfidenciaintervallumának becslését teszi lehetővé, hanem kis számú megfigyelésre is alkalmazható. Általában a Wilson-képlet szerinti konfidenciaintervallum alakja a következő



ahol a 95%-os konfidencia intervallum kiszámításakor 1,96 értéket vesz fel, N a megfigyelések száma, p pedig a jellemző gyakorisága a mintában. Ez a módszer az online számológépekben elérhető, így alkalmazása nem okoz problémát. és nem javasoljuk ennek a módszernek a használatát n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Úgy gondolják, hogy a Wilson-módszer mellett az Agresti–Caull-korrigált Wald-módszer is optimális becslést ad a gyakoriságok konfidenciaintervallumára vonatkozóan. Az Agresti-Coulle korrekció a Wald-képletben egy tulajdonság előfordulási gyakoriságát a mintában (p) helyettesíti p`-vel, amikor kiszámítjuk, hogy melyik 2-t adjuk a számlálóhoz, és 4-et a nevezőhöz, azaz , p` = (X + 2) / (N + 4), ahol X a vizsgálatban résztvevők száma, akik rendelkeznek a vizsgált tulajdonsággal, N pedig a minta mérete. Ez a módosítás nagyon hasonló eredményeket ad a Wilson-képletéhez, kivéve, ha az eseményarány megközelíti a 0%-ot vagy a 100%-ot, és a minta kicsi. A gyakoriságok konfidenciaintervallumának kiszámítására szolgáló fenti módszereken kívül folytonossági korrekciókat javasoltak mind a Wald-módszerhez, mind a Wilson-módszerhez kis minták esetén, de a vizsgálatok kimutatták, hogy ezek alkalmazása nem megfelelő.

Tekintsük a fenti módszerek alkalmazását a konfidenciaintervallumok kiszámítására két példa segítségével. Az első esetben egy nagy, 1000, véletlenszerűen kiválasztott vizsgálati résztvevőből álló mintát vizsgálunk, amelyből 450 fő rendelkezik a vizsgált tulajdonsággal (legyen szó rizikófaktorról, kimenetelről vagy bármilyen más tulajdonságról), ami 0,45-ös gyakoriságú, ill. 45%. A második esetben a vizsgálatot kis mintán, mondjuk csak 20 fős mintán végzik, és a vizsgálatban csak 1 résztvevő (5%) rendelkezik a vizsgált tulajdonsággal. A megbízhatósági intervallumokat a Wald-módszerhez, a Wald-módszerhez Agresti-Coll-korrekcióval, a Wilson-módszerhez a Jeff Sauro által kifejlesztett online számológép segítségével számítottuk ki (http://www./wald.htm). A folytonossággal korrigált Wilson konfidencia intervallumokat a Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html) által biztosított számológép segítségével számítottuk ki. A Fisher szögtranszformációt használó számításokat "manuálisan" hajtottuk végre a t kritikus értékével 19, illetve 999 szabadsági fokra. A számítási eredményeket mindkét példa táblázatában mutatjuk be.

A konfidencia intervallumok hat különböző módon számítva a szövegben leírt két példához

Konfidenciaintervallum számítási módszer

P=0,0500 vagy 5%

95% CI X=450, N=1000, P=0,4500 vagy 45% esetén

–0,0455–0,2541

Walda Agresti-Coll korrekcióval

<,0001–0,2541

Wilson folytonossági korrekcióval

Klopper-Pearson "pontos módszere"

Szögtranszformáció

<0,0001–0,1967

A táblázatból látható, hogy az első példában az "általánosan elfogadott" Wald-módszerrel számított konfidenciaintervallum a negatív tartományba kerül, ami a gyakoriságok esetében nem mondható el. Sajnos az orosz irodalomban nem ritkák az ilyen esetek. Az adatok gyakoriságként való megjelenítésének hagyományos módja és hibája részben elfedi ezt a problémát. Például, ha egy tulajdonság előfordulási gyakorisága (százalékban) 2,1 ± 1,4, akkor ez nem olyan „irritáló”, mint 2,1% (95% CI: –0,7; 4,9), bár és ugyanazt jelenti. A Wald-módszer Agresti-Coulle korrekcióval és a szögtranszformációt használó számítás egy nullára hajló alsó korlátot ad. A folytonossági korrekciós Wilson-módszer és az "egzakt módszer" szélesebb konfidenciaintervallumokat ad, mint a Wilson-módszer. A második példában minden módszer megközelítőleg azonos konfidenciaintervallumot ad (a különbségek csak ezredrészben jelennek meg), ami nem meglepő, mivel az esemény gyakorisága ebben a példában nem sokban tér el az 50%-tól, és a minta mérete meglehetősen nagy. .

A probléma iránt érdeklődő olvasók figyelmébe ajánlhatjuk R. G. Newcombe és Brown, Cai és Dasgupta munkáit, amelyek 7, illetve 10 különböző konfidenciaintervallum-számítási módszer használatának előnyeit és hátrányait adják meg. Hazai kézikönyvekből ajánlott a és a könyv, melyben az elmélet részletes ismertetése mellett bemutatásra kerül a Wald- és Wilson-módszer, valamint a binomiális gyakorisági eloszlást figyelembe vevő konfidenciaintervallumok számítási módszere. Az ingyenes online számológépek (http://www./wald.htm és http://faculty.vassar.edu/lowry/prop1.html) mellett a gyakoriságok (és nem csak!) konfidenciaintervallumai kiszámíthatók a CIA program ( Confidence Intervals Analysis ), amely letölthető a http://www. orvosi egyetem. soton. ac. uk/cia/ .

A következő cikk a minőségi adatok összehasonlításának egyváltozós módjait vizsgálja meg.

Bibliográfia

Banerjee A. Orvosi statisztika közérthető nyelven: bevezető tanfolyam / A. Banerzhi. - M. : Gyakorlati orvostudomány, 2007. - 287 p. Orvosi statisztika / . - M. : Orvosi Információs Ügynökség, 2007. - 475 p. Glanz S. Orvosbiológiai statisztika / S. Glants. - M. : Gyakorlat, 1998. Adattípusok, eloszlásellenőrzés és leíró statisztika / // Humánökológia - 2008. - 1. sz. - 52–58. Zhizhin K.S.. Orvosi statisztika: tankönyv / . - Rostov n/D: Főnix, 2007. - 160 p. Alkalmazott orvosi statisztika / , . - Szentpétervár. : Folio, 2003. - 428 p. Lakin G. F. Biometrikus adatok / . - M. : Felsőiskola, 1990. - 350 p. Orvos V. A. Matematikai statisztika az orvostudományban / , . - M. : Pénzügy és statisztika, 2007. - 798 p. Matematikai statisztika a klinikai kutatásban / , . - M. : GEOTAR-MED, 2001. - 256 p. Junkerov V. És. Orvosi kutatási adatok orvosstatisztikai feldolgozása /,. - Szentpétervár. : VmedA, 2002. - 266 p. Agresti A. A közelítő jobb, mint a pontos a binomiális arányok intervallumbecsléséhez / A. Agresti, B. Coull // Amerikai statisztikus. - 1998. - N 52. - S. 119-126. Altman D. Magabiztos statisztikák // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Brown L.D. Interval estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statisztikai tudomány. - 2001. - N 2. - P. 101-133. Clopper C.J. A bizalmi vagy fiduciális határok használata a binomiális esetében / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. A binomiális paraméter konfidenciaintervallumáról / M. A. Garcia-Perez // Minőség és mennyiség. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitív biostatisztika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R.G. Kétoldalú bizalmi intervallumok az egyarányhoz: Hét módszer összehasonlítása / R. G. Newcombe // Statisztikák az orvostudományban. - 1998. - N. 17. - P. 857–872. Sauro J. A befejezési arányok becslése kis mintákból binomiális konfidencia intervallumok segítségével: összehasonlítások és ajánlások / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society year meeting. – Orlando, FL, 2005. Wald A. A folytonos eloszlásfüggvények bizalmi határai // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105–118. Wilson E. B. Valószínű következtetés, az utódlás törvénye és a statisztikai következtetés / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

AZ ARÁNYOK BIZTONSÁGI IDŐKÖNYVE

A. M. Grjibovski

Országos Közegészségügyi Intézet, Oslo, Norvégia

A cikk számos módszert mutat be a binomiális arányok konfidenciaintervallumának kiszámítására, nevezetesen Wald, Wilson, arcszinusz, Agresti-Coull és egzakt Clopper-Pearson módszereket. A cikk csak általános bevezetést ad a binomiális arány konfidenciaintervallum-becslésének problémájába, és célja nem csak az, hogy az olvasókat a konfidenciaintervallumok használatára ösztönözze a saját empirikus kutatási intervallumok eredményeinek bemutatásakor, hanem arra is ösztönözze őket, hogy előzetesen tanulmányozzák a statisztikai könyveket. saját adatok elemzésére és kéziratok készítésére.

kulcsszavak: konfidencia intervallum, arány

Elérhetőség:

Vezető tanácsadó, Országos Közegészségügyi Intézet, Oslo, Norvégia

Ebből a cikkből megtudhatja:

    Mit megbízhatósági intervallum?

    Mi értelme van 3 szigma szabály?

    Hogyan lehet ezt a tudást a gyakorlatba átültetni?

Napjainkban a termékek széles választékával, értékesítési irányokkal, alkalmazottakkal, tevékenységekkel stb. kapcsolatos információbőség miatt, nehéz kiválasztani a főt, amelyre mindenekelőtt érdemes odafigyelni és erőfeszítéseket tenni annak kezelésére. Meghatározás megbízhatósági intervallumés a tényleges értékek határain túllépés elemzése – egy olyan technika, amely segít azonosítani a helyzeteket, trendek befolyásolása. Képes lesz pozitív tényezőket kifejleszteni és csökkenteni a negatívak hatását. Ezt a technológiát számos jól ismert világcég használja.

Vannak ún riasztások", melyik tájékoztassa a vezetőket kimondja, hogy a következő érték egy bizonyos irányba túllépett megbízhatósági intervallum. Mit is jelent ez? Ez azt jelzi, hogy valami nem szabványos esemény történt, ami megváltoztathatja a jelenlegi trendet ebben az irányban. Ez a jel ahhoz rendezni a helyzetben, és megértse, mi befolyásolta azt.

Vegyünk például több helyzetet. Az értékesítési előrejelzést 100 árucikk előrejelzési határaival számoltuk ki 2011-re hónapok bontásban és a márciusi tényleges eladások:

  1. A "napraforgóolaj" esetében áttörték az előrejelzés felső határát, és nem estek bele a konfidenciaintervallumba.
  2. A "száraz élesztő" túllépte az előrejelzés alsó határát.
  3. A "zabkása" áttörte a felső határt.

A többi áru esetében a tényleges értékesítés a megadott előrejelzési határokon belül volt. Azok. eladásaik a várakozásoknak megfelelően alakultak. Így azonosítottunk 3 olyan terméket, amely túlmutat a határokon, és elkezdtük kitalálni, hogy mi befolyásolta a határon túli utat:

  1. A Napraforgóolajjal új kereskedelmi hálózatba léptünk be, ami további értékesítési volument adott, ami a felső határ túllépéséhez vezetett. Ennél a terméknél érdemes az év végéig újraszámolni az előrejelzést, figyelembe véve az ehhez a lánchoz történő értékesítés előrejelzését.
  2. A Dry Yeast esetében az autó elakadt a vámon, és 5 napon belül hiány alakult ki, ami befolyásolta az eladások visszaesését és az alsó határon túllépést. Érdemes lehet kitalálni, hogy mi okozta az okot, és megpróbálni nem ismétlődni.
  3. A Zabpehely esetében értékesítési promóció indult, ami az eladások jelentős növekedését és az előrejelzés túllépését eredményezte.

Három olyan tényezőt azonosítottunk, amelyek befolyásolták az előrejelzés túllépését. Sokkal több is lehet az életben Az előrejelzés és a tervezés pontosságának javítása érdekében azokat a tényezőket, amelyek ahhoz vezetnek, hogy a tényleges eladások túlmutathatnak az előrejelzésen, érdemes külön kiemelni és külön-külön előrejelzéseket, terveket építeni. Ezután vegye figyelembe a fő értékesítési előrejelzésre gyakorolt ​​hatásukat. Rendszeresen értékelheti ezen tényezők hatását, és javíthatja a helyzetet a negatív hatások csökkentésével és a pozitív tényezők hatásának növelésével.

Egy konfidenciaintervallum segítségével:

  1. Jelölje ki az úti célokat, amelyekre érdemes odafigyelni, mert események történtek ezeken a területeken, amelyek hatással lehetnek trend változása.
  2. Határozza meg a tényezőket amelyek valójában különbséget tesznek.
  3. Elfogadni súlyozott döntés(például beszerzésről, tervezéskor stb.).

Most nézzük meg, mi az a konfidenciaintervallum, és hogyan lehet kiszámítani az Excelben egy példa segítségével.

Mi az a konfidenciaintervallum?

A konfidenciaintervallum az előrejelzési határ (felső és alsó), amelyen belül adott valószínűséggel (szigma) megkapja a tényleges értékeket.

Azok. kiszámítjuk az előrejelzést - ez a fő viszonyítási alapunk, de megértjük, hogy a tényleges értékek nem valószínű, hogy 100%-ban megegyeznek az előrejelzésünkkel. És felmerül a kérdés hogy milyen mértékben tényleges értékeket kaphat, ha a jelenlegi tendencia folytatódik? És ez a kérdés segít megválaszolni konfidencia intervallum számítás, azaz - az előrejelzés felső és alsó határa.

Mi az adott valószínűségi szigma?

Számításkor konfidencia intervallumot tudunk beállított valószínűség találatokat tényleges értékeket a megadott előrejelzési határokon belül. Hogyan kell csinálni? Ehhez beállítjuk a szigma értékét, és ha a szigma egyenlő:

    3 szigma- akkor annak valószínűsége, hogy eltalálja a következő tényleges értéket a konfidencia-intervallumban, 99,7%, vagy 300:1, vagy 0,3% a valószínűsége annak, hogy túllépi a határokat.

    2 szigma- akkor a határokon belüli következő érték eltalálásának valószínűsége ≈ 95,5%, azaz. az odds körülbelül 20:1, vagy 4,5% esély van arra, hogy kikerüljön a pályáról.

    1 szigma- akkor a valószínűség ≈ 68,3%, azaz. az esély körülbelül 2 az 1-hez, vagy 31,7% az esély arra, hogy a következő érték a konfidenciaintervallumon kívülre esik.

megfogalmaztuk 3 szigma szabály,ami azt mondja találati valószínűség másik véletlenszerű érték a konfidencia intervallumba adott értékkel a három szigma 99,7%.

A nagy orosz matematikus Csebisev bebizonyította azt a tételt, hogy 10% esély van arra, hogy egy adott három szigma értékű előrejelzés túllépjen. Azok. a 3 szigma konfidenciaintervallumba való esés valószínűsége legalább 90%, míg az előrejelzés és határainak „szemből” való kiszámítása sokkal jelentősebb hibákkal jár.

Hogyan lehet önállóan kiszámítani a konfidencia intervallumot az Excelben?

Tekintsük a konfidenciaintervallum Excelben való kiszámítását (azaz az előrejelzés felső és alsó határát) egy példa segítségével. Van egy idősorunk - eladások hónapok szerint 5 évre. Lásd a csatolt fájlt.

Az előrejelzés határainak kiszámításához a következőket számoljuk:

  1. Eladási előrejelzés().
  2. Sigma - szórás előrejelzési modellek a tényleges értékekből.
  3. Három szigma.
  4. Megbízhatósági intervallum.

1. Értékesítési előrejelzés.

=(RC[-14] (adatok idősorokban)-RC[-1] (modell értéke))^2 (négyzet)


3. Havonta összegezze a 8. szakasztól való eltérési értékeket Sum((Xi-Ximod)^2), azaz Foglaljuk össze minden év januárját, februárját...

Ehhez használja a =SUMIF() képletet

SUMIF(tömb a cikluson belüli periódusok számával (hónapokra 1-től 12-ig); hivatkozás a ciklus periódusának számára; hivatkozás egy tömbre a kiindulási adatok és a ciklus értékei közötti különbség négyzeteivel időszakok)


4. Számítsa ki a szórást a ciklus minden egyes periódusára 1-től 12-ig (10. szakasz a csatolt fájlban).

Ehhez a 9. lépésben kiszámított értékből kivonjuk a gyökért, és elosztjuk a ciklus periódusainak számával mínusz 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Használjunk képleteket az Excelben =ROOT(R8 (hivatkozás: (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (hivatkozás egy tömbre ciklusszámokkal); O8 (hivatkozás egy adott ciklusszámra, amelyet a tömbben figyelembe veszünk))-1))

Az Excel képlet használatával = COUNTIF megszámoljuk az n számot


Az előrejelzési modelltől való tényleges adatok szórásának kiszámításával minden hónapra megkaptuk a szigma értéket - 10. szakasz a csatolt fájlban.

3. Számíts ki 3 szigmát!

A 11. szakaszban beállítjuk a szigmák számát - példánkban "3" (11. a csatolt fájlban):

Szintén praktikus szigma értékek:

1,64 szigma – 10% esély a határérték túllépésére (1 esély a 10-hez);

1,96 szigma – 5% esély a határon kívülre (1 esély a 20-ból);

2,6 szigma – 1% esély a határon kívülre (1 a 100-hoz).

5) Kiszámolunk három szigmát, ehhez megszorozzuk a „szigma” értékeket minden hónapban „3-mal”.

3. Határozza meg a konfidencia intervallumot!

  1. Előrejelzés felső határa- értékesítési előrejelzés a növekedés és a szezonalitás figyelembevételével + (plusz) 3 szigma;
  2. Alsó előrejelzési határ- értékesítési előrejelzés a növekedés és a szezonalitás figyelembevételével - (mínusz) 3 szigma;

A megbízhatósági intervallum hosszú időszakra történő kiszámításának megkönnyítése érdekében (lásd a csatolt fájlt) az Excel képletet használjuk =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), ahol

Y8- eladási előrejelzés;

W8- annak a hónapnak a száma, amelyre 3 szigmát veszünk;

Azok. Előrejelzés felső határa= "értékesítési előrejelzés" + "3 szigma" (a példában VLOOKUP(hónapszám; táblázat 3 szigma értékkel; oszlop, amelyből kivonjuk a megfelelő sorban lévő hónap számával megegyező szigmaértéket; 0)).

Alsó előrejelzési határ= "értékesítési előrejelzés" mínusz "3 szigma".

Tehát Excelben kiszámítottuk a konfidencia intervallumot.

Most van egy előrejelzésünk és egy olyan tartományunk, amelyen belül a tényleges értékek adott valószínűségi szigmával esnek.

Ebben a cikkben megvizsgáltuk, mi a szigma és a három szigma szabály, hogyan határozható meg a konfidenciaintervallum, és mire használhatja ezt a technikát a gyakorlatban.

Pontos előrejelzések és sok sikert neked!

Hogyan A Forecast4AC PRO segítheta konfidenciaintervallum kiszámításakor?:

    A Forecast4AC PRO egyszerre több mint 1000 idősorra automatikusan kiszámítja a felső vagy alsó előrejelzési határokat;

    Az a képesség, hogy egy gombnyomással elemezze az előrejelzés határait a diagramon szereplő előrejelzéssel, trenddel és tényleges eladásokkal összehasonlítva;

A Forcast4AC PRO programban lehetőség van a szigma értékének 1 és 3 közötti beállítására.

Csatlakozz hozzánk!

Töltse le az ingyenes előrejelzési és üzleti intelligencia alkalmazásokat:


  • Novo Forecast Lite- automatikus előrejelzési számítás ban ben excel.
  • 4analytics- ABC-XYZ elemzésés a kibocsátások elemzése Excel.
  • Qlik Sense Asztali és a Qlik ViewPersonal Edition – BI-rendszerek az adatok elemzéséhez és megjelenítéséhez.

Tesztelje a fizetős megoldások funkcióit:

  • Novo Forecast PRO- előrejelzés Excelben nagy adattömbök esetén.

Bármely minta csak hozzávetőleges képet ad az általános sokaságról, és a minta összes statisztikai jellemzője (átlag, módusz, szórás...) az általános paraméterek valamilyen közelítése vagy mondjuk becslése, ami a legtöbb esetben nem számítható ki, mivel a lakosság elérhetetlensége (20. ábra) .

20. ábra Mintavételi hiba

De megadhatja azt az intervallumot, amelyben bizonyos valószínűséggel a statisztikai jellemző valódi (általános) értéke található. Ezt az intervallumot ún d konfidencia intervallum (CI).

Tehát az általános átlag 95%-os valószínűséggel belül van

tól ig, (20)

ahol t - a Student-féle kritérium táblázatos értéke α =0,05 és f= n-1

Megtalálható és 99% CI, ebben az esetben t számára választották α =0,01.

Mi a gyakorlati jelentősége egy konfidenciaintervallumnak?

    A széles konfidenciaintervallum azt jelzi, hogy a minta átlaga nem tükrözi pontosan a sokaság átlagát. Ennek oka általában az elégtelen mintanagyság, vagy annak heterogenitása, pl. nagy szórás. Mindkettő nagy hibát ad az átlagban, és ennek megfelelően szélesebb CI-t ad. És ez az oka annak, hogy visszatérjünk a kutatás tervezési szakaszához.

    A felső és alsó CI határértékek azt értékelik, hogy az eredmények klinikailag jelentősek lesznek-e

Foglalkozzunk részletesebben a csoporttulajdonságok vizsgálata eredményeinek statisztikai és klinikai jelentőségének kérdésével. Emlékezzünk vissza, hogy a statisztika feladata legalább néhány eltérés kimutatása az általános sokaságban, mintaadatok alapján. A klinikus feladata, hogy olyan (nem bármilyen) különbséget találjon, amely segíti a diagnózist vagy a kezelést. És nem mindig a statisztikai következtetések képezik a klinikai következtetések alapját. Így a hemoglobin statisztikailag szignifikáns 3 g/l-es csökkenése nem ad okot aggodalomra. És fordítva, ha az emberi test valamely problémája nem tömegjellegű a teljes népesség szintjén, ez nem ok arra, hogy ne foglalkozzunk ezzel a problémával.

Ezt a pozíciót figyelembe vesszük példa.

A kutatók arra voltak kíváncsiak, hogy azok a fiúk, akik valamilyen fertőző betegségben szenvedtek, lemaradnak-e társaikhoz képest növekedésben. Ebből a célból szelektív vizsgálatot végeztek, amelyben 10 ilyen betegségben szenvedő fiú vett részt. Az eredményeket a 23. táblázat tartalmazza.

23. táblázat Statisztikai eredmények

alsó határ

felső határ

Műszaki adatok (cm)

középső

Ezekből a számításokból az következik, hogy a 10 éves, valamilyen fertőző betegségben szenvedő fiúk szelektív átlagmagassága megközelíti a normális értéket (132,5 cm). A konfidenciaintervallum alsó határa (126,6 cm) azonban azt jelzi, hogy 95%-os valószínűséggel ezeknek a gyerekeknek a valódi átlagos magassága megfelel az "alacsony termet" fogalmának, azaz. ezek a gyerekek csökevényesek.

Ebben a példában a konfidenciaintervallum-számítások eredményei klinikailag szignifikánsak.

Tetszett a cikk? Oszd meg