Kapcsolatok

Bizalom valószínűsége. Megbízhatósági intervallum

Az előző alfejezetekben megvizsgáltuk az ismeretlen paraméter becslésének kérdését a egy szám. Az ilyen értékelést "pontnak" nevezik. Számos feladatnál nem csak a paramétert kell megkeresni a megfelelő számértéket, hanem értékelje annak pontosságát és megbízhatóságát is. Szükséges tudni, hogy a paramétercsere milyen hibákhoz vezethet a pontbecslését aés milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat?

Az ilyen jellegű problémák különösen fontosak kis számú megfigyelésnél, amikor a pontbecslést és be nagyrészt véletlenszerű, és az a hozzávetőleges helyettesítése a-val súlyos hibákhoz vezethet.

Képet adni a becslés pontosságáról és megbízhatóságáról a,

a matematikai statisztikában úgynevezett konfidenciaintervallumokat és konfidenciavalószínűségeket használnak.

Legyen a paraméter a tapasztalatból származik elfogulatlan becslés a. Ebben az esetben szeretnénk megbecsülni a lehetséges hibát. Adjunk hozzá elég nagy p valószínűséget (például p = 0,9, 0,95 vagy 0,99) ahhoz, hogy egy p valószínűségű esemény gyakorlatilag biztosnak tekinthető, és keressünk egy s értéket, amelyre

Akkor a hatótáv majdnem lehetséges értékek csere hiba a a a, ± s lesz; nagy abszolút hibák csak kis valószínűséggel jelennek meg a = 1 - p. Írjuk át (14.3.1) így:

Az egyenlőség (14.3.2) azt jelenti, hogy p valószínűséggel a paraméter ismeretlen értéke a intervallumba esik

Ebben az esetben meg kell jegyezni egy körülményt. Korábban többször is figyelembe vettük annak a valószínűségét, hogy egy valószínűségi változó egy adott nem véletlenszerű intervallumba esik. Itt más a helyzet: a nem véletlenszerű, hanem véletlenszerű intervallum / r. Véletlenszerűen a helyzete az x tengelyen, a középpontja határozza meg a; általában a 2s intervallum hossza is véletlenszerű, mivel az s értékét általában kísérleti adatokból számítjuk. Ezért ebben az esetben jobb lenne a p értékét nem a pont "eltalálásának" valószínűségeként értelmezni. a a / p intervallumba, hanem annak valószínűségeként, hogy egy / p véletlenszerű intervallum lefedi a pontot a(14.3.1. ábra).

Rizs. 14.3.1

A p valószínűséget nevezzük bizalmi szint, és a / p - intervallum megbízhatósági intervallum. Intervallumhatárok ha. a x \u003d a- s és a 2 = a +és hívják bizalom határai.

Adjunk még egy értelmezést a konfidenciaintervallum fogalmának: tekinthető paraméterértékek intervallumának a, kompatibilis a kísérleti adatokkal, és nem mond ellent azoknak. Valóban, ha egyetértünk abban, hogy egy a = 1-p valószínűségű eseményt gyakorlatilag lehetetlennek tekintünk, akkor az a paraméter azon értékei, amelyekre a - a> s ellentmondónak kell lenni a kísérleti adatoknak, és azokat, amelyeknél |a - a a t na 2 .

Legyen a paraméter a van egy elfogulatlan becslés a. Ha ismernénk a mennyiség eloszlásának törvényét a, a konfidenciaintervallum megtalálásának problémája meglehetősen egyszerű lenne: elég lenne megtalálni egy s értéket, amelyre

A nehézség abban rejlik, hogy a becslés eloszlási törvénye a a mennyiség eloszlásának törvényétől függ xés következésképpen annak ismeretlen paraméterein (különösen magán a paraméteren a)

Ennek a nehézségnek a megkerülésére alkalmazhatjuk a következő durván közelítő trükköt: cseréljük ki az s kifejezésben szereplő ismeretlen paramétereket a pontbecsléseikre. Azzal összehasonlítva nagy számok kísérletek P(kb. 20 ... 30) ez a technika általában kielégítő eredményeket ad a pontosság tekintetében.

Példaként tekintsük a matematikai elvárás konfidenciaintervallumának problémáját.

Legyen előállított P x, amelynek jellemzői a matematikai elvárás tés variancia D- ismeretlen. Ezekre a paraméterekre a következő becsléseket kaptuk:

A matematikai elvárásokhoz meg kell építeni egy / р konfidenciaintervallumot, amely megfelel a р konfidenciavalószínűségnek t mennyiségeket x.

A probléma megoldásában azt a tényt használjuk fel, hogy a mennyiség t az összeg P független, azonos eloszlású valószínűségi változók X hés a centrális határértéktétel szerint kellően nagy P eloszlási törvénye közel áll a normálishoz. A gyakorlatban még viszonylag kis számú (10 ... 20 nagyságrendű) tag mellett is megközelítőleg normálisnak tekinthető az összeg eloszlási törvénye. Feltételezzük, hogy az érték t a normál törvény szerint osztják el. Ennek a törvénynek a jellemzői - a matematikai elvárás és a variancia - egyenlőek, ill tés

(lásd a 13. fejezet 13.3. alpontját). Tegyük fel, hogy az érték D ismert számunkra, és találunk olyan Ep értéket, amelyre

A 6. fejezet (6.3.5) képletével a (14.3.5) bal oldalán lévő valószínűséget a normális eloszlás függvényében fejezzük ki.

ahol a becslés szórása t.

Az egyenletből

keresse meg az Sp értéket:

ahol arg Ф* (x) a Ф* inverz függvénye (X), azok. az argumentum olyan értéke, amelyre a normális eloszlásfüggvény egyenlő X.

Diszperzió D, amelyen keresztül az érték kifejeződik a 1P, nem tudjuk pontosan; hozzávetőleges értékeként használhatja a becslést D(14.3.4), és körülbelül:

Így a konfidenciaintervallum felépítésének problémája megközelítőleg megoldott, ami egyenlő:

ahol a gp-t a (14.3.7) képlet határozza meg.

Annak érdekében, hogy elkerüljük a fordított interpolációt az Ф * (l) függvény táblázataiban az s p kiszámításakor, célszerű egy speciális táblázatot összeállítani (14.3.1. táblázat), amely felsorolja a mennyiség értékeit.

attól függően, hogy r. A (p érték a normáltörvényhez határozza meg a szórások számát, amelyeket a diszperziós középponttól jobbra és balra félre kell tenni, hogy a kapott területre való esés valószínűsége egyenlő legyen p-vel.

7 p értékén keresztül a konfidencia intervallum a következőképpen fejeződik ki:

14.3.1. táblázat

1. példa Az értékkel 20 kísérletet végeztünk x; az eredmények a táblázatban láthatók. 14.3.2.

14.3.2. táblázat

Meg kell találni a becslést a mennyiség matematikai elvárására xés állítsunk össze egy p = 0,8 konfidenciaszintnek megfelelő konfidenciaintervallumot.

Megoldás. Nekünk van:

Az n origót választva: = 10, a harmadik képlet (14.2.14) szerint megkapjuk a torzítatlan becslést D :

táblázat szerint 14.3.1 találjuk

Bizalmi határok:

Megbízhatósági intervallum:

Paraméterértékek t, Az ebben az intervallumban lévő adatok kompatibilisek a táblázatban megadott kísérleti adatokkal. 14.3.2.

Hasonló módon a variancia konfidenciaintervallumát is meg lehet alkotni.

Legyen előállított P független kísérletek egy valószínűségi változón x ismeretlen paraméterekkel -ból és A-ból, valamint a szóráshoz D az elfogulatlan becslést kapjuk:

A variancia konfidenciaintervallumának közelítő felépítése szükséges.

A (14.3.11) képletből látható, hogy az érték D képviseli

összeg P alak valószínűségi változói . Ezek az értékek nem

független, hiszen bármelyik tartalmazza a mennyiséget t, mindenki mástól függ. Kimutatható azonban, hogy mint Pösszegük eloszlási törvénye is közel áll a normálishoz. Majdnem at P= 20...30 már normálisnak tekinthető.

Tegyük fel, hogy ez így van, és keressük meg ennek a törvénynek a jellemzőit: a matematikai elvárást és szórást. A pontszám óta D- akkor elfogulatlan M[D] = D.

Variancia számítás D D viszonylag bonyolult számításokhoz kapcsolódik, ezért a kifejezését levezetés nélkül adjuk meg:

ahol c 4 - a mennyiség negyedik központi momentuma x.

Ennek a kifejezésnek a használatához helyettesítenie kell benne a 4 és a D(legalábbis hozzávetőlegesen). Ahelyett D használhatja az értékelést D. Elvileg a negyedik központi momentum helyettesíthető a becsült értékével is, például a következő alakzat értékével:

de egy ilyen csere rendkívül alacsony pontosságot ad, mivel általában korlátozott számú kísérlettel a nagyfokú nyomatékokat nagy hibákkal határozzák meg. A gyakorlatban azonban gyakran előfordul, hogy a mennyiség eloszlási törvényének formája x előre ismert: csak a paraméterei ismeretlenek. Ezután megpróbálhatjuk az u4-et kifejezésekkel kifejezni D.

Vegyük a leggyakoribb esetet, amikor az érték x a normál törvény szerint osztják el. Ekkor a negyedik központi momentum a szórással fejeződik ki (lásd a 6. fejezet 6.2. alfejezetét);

és a (14.3.12) képlet megadja vagy

A (14.3.14)-ben az ismeretlen helyettesítése Dértékelését D, kapjuk: honnan

Az u 4 pillanata kifejezéssel fejezhető ki D más esetekben is, amikor a mennyiség elosztását x nem normális, de a megjelenése ismert. Például az egyenletes sűrűség törvényéhez (lásd az 5. fejezetet) a következőket kapjuk:

ahol (a, P) az az intervallum, amelyen a törvény adott.

Következésképpen,

A (14.3.12) képlet szerint a következőket kapjuk: ahonnan kb

Azokban az esetekben, amikor a 26-os érték eloszlási törvényének alakja ismeretlen, az a /) értékének becslésénél továbbra is a (14.3.16) képlet használata javasolt, ha nincs különösebb ok azt hinni, hogy ez törvény nagyon eltér a normáltól (észrevehető pozitív vagy negatív kurtózisa van).

Ha a /) közelítő értékét így vagy úgy megkapjuk, akkor ugyanúgy meg lehet alkotni a variancia konfidenciaintervallumát, mint ahogy azt a matematikai elváráshoz építettük:

táblázatban található az adott p valószínűségtől függő érték. 14.3.1.

2. példa. Keressen egy körülbelül 80%-os megbízhatósági intervallumot egy véletlen változó varianciájához x az 1. példa feltételei szerint, ha ismert, hogy az érték x a normálishoz közeli törvény szerint elosztva.

Megoldás. Az érték ugyanaz marad, mint a táblázatban. 14.3.1:

A (14.3.16) képlet szerint

A (14.3.18) képlet szerint megtaláljuk a konfidencia intervallumot:

Az átlagértékek megfelelő tartománya szórás: (0,21; 0,29).

14.4. Pontos módszerek megbízhatósági intervallumok felépítésére a normális törvény szerint eloszló valószínűségi változó paramétereihez

Az előző alfejezetben nagyjából közelítő módszereket vettünk figyelembe az átlag és a variancia konfidencia-intervallumának felépítésére. Itt adunk egy ötletet ugyanazon probléma megoldásának pontos módszereiről. Hangsúlyozzuk, hogy a konfidenciaintervallumok pontos megtalálásához feltétlenül szükséges előre ismerni a mennyiség eloszlási törvényének alakját. x, míg ez közelítő módszerek alkalmazásához nem szükséges.

Ötlet pontos módszerek A konfidenciaintervallumok felépítése a következőkre redukálódik. Bármely konfidenciaintervallum megtalálható néhány egyenlőtlenség teljesülésének valószínűségét kifejező feltételből, amely magában foglalja a számunkra érdekes becslést a. Osztályelosztási törvény aáltalános esetben a mennyiség ismeretlen paramétereitől függ x. Néha azonban lehetséges az egyenlőtlenségek átadása egy valószínűségi változóból a a megfigyelt értékek valamilyen más függvényéhez X p X 2, ..., X o. amelynek eloszlási törvénye nem ismeretlen paraméterektől, hanem csak a kísérletek számától és a mennyiség eloszlási törvényének alakjától függ x. Az ilyen véletlenszerű változók nagy szerepet játszanak a matematikai statisztikában; legrészletesebben a mennyiség normális eloszlásának esetére tanulmányozták őket x.

Például bebizonyosodott, hogy a mennyiség normális eloszlása ​​mellett x véletlenszerű érték

figyelemmel az ún Hallgatói elosztási törvény Val vel P- 1 szabadságfok; ennek a törvénynek a sűrűsége a formája

ahol G(x) az ismert gammafüggvény:

Az is bebizonyosodott, hogy a valószínűségi változó

"eloszlás % 2" -val rendelkezik P- 1 szabadságfok (lásd 7. fejezet), melynek sűrűségét a képlet fejezi ki

Anélkül, hogy a (14.4.2) és (14.4.4) eloszlások származtatásain foglalkoznánk, bemutatjuk, hogyan alkalmazhatók ezek a paraméterek konfidenciaintervallumának felépítésekor. Ty D .

Legyen előállított P független kísérletek egy valószínűségi változón x, a normál törvény szerint elosztva ismeretlen paraméterekkel TIO. Ezeknél a paramétereknél becslések

Mindkét paraméterre meg kell alkotni a konfidencia intervallumot, amely megfelel a p konfidenciavalószínűségnek.

Először alkossunk meg egy konfidenciaintervallumot a matematikai elváráshoz. Természetes, hogy ezt az intervallumot szimmetrikusan vesszük a -hoz képest t; jelöljük s p-vel az intervallum hosszának felét. Az sp értékét úgy kell megválasztani, hogy a feltétel

Próbáljuk meg átadni a (14.4.5) egyenlőség bal oldalát egy valószínűségi változóból t egy valószínűségi változóhoz T, a Student törvénye szerint terjesztik. Ehhez megszorozzuk az |m-w?| egyenlőtlenség mindkét részét

pozitív értékre: vagy a (14.4.1) jelöléssel,

Keressünk egy olyan / p számot, hogy a / p értéke megtalálható legyen a feltételből

A (14.4.2) képletből látható, hogy (1) - páros funkció, így (14.4.8) megadja

Az egyenlőség (14.4.9) határozza meg a / p értéket p függvényében. Ha rendelkezésére áll egy integrál értékek táblázata

akkor a / p értéke fordított interpolációval megtalálható a táblázatban. Kényelmesebb azonban előre összeállítani egy értéktáblázatot / p. Egy ilyen táblázatot a Függelék (5. táblázat) tartalmaz. Ez a táblázat a p konfidenciavalószínűségtől és a szabadságfokok számától függő értékeket mutatja P- 1. Miután meghatározta a / p-t a táblázat szerint. 5 és feltételezve

megtaláljuk a / p konfidenciaintervallum szélességének felét és magát az intervallumot

1. példa 5 független kísérletet végeztünk egy valószínűségi változón x, normál eloszlású, ismeretlen paraméterekkel tés róla. A kísérletek eredményeit a táblázat tartalmazza. 14.4.1.

14.4.1. táblázat

Keressen egy becslést t a matematikai várakozáshoz, és állítson össze egy 90%-os / p konfidenciaintervallumot (azaz a p \u003d 0,9 konfidenciavalószínűségnek megfelelő intervallumot).

Megoldás. Nekünk van:

iránti kérelem 5. táblázata szerint P - 1 = 4 és p = 0,9 azt találjuk ahol

A konfidencia intervallum az lesz

2. példa A 14.3. alszakasz 1. példájának feltételeire, az értéket feltételezve x normál eloszlású, keresse meg a pontos konfidenciaintervallumot.

Megoldás. A kérelem 5. táblázata szerint a címen találjuk P - 1 = 19ir =

0,8/p=1,328; innen

A 14.3. alfejezet 1. példájának megoldásával (e p = 0,072) összehasonlítva azt látjuk, hogy az eltérés nagyon kicsi. Ha a pontosságot a második tizedesjegyig tartjuk, akkor a pontos és közelítő módszerrel kapott konfidencia intervallumok megegyeznek:

Folytassuk a variancia konfidenciaintervallumának felépítését. Tekintsük az elfogulatlan varianciabecslést

és kifejezni valószínűségi változó D az értéken keresztül V(14.4.3), amelynek eloszlása ​​x 2 (14.4.4):

A mennyiség eloszlási törvényének ismerete V, meg lehet találni azt a / (1 ) intervallumot, amelybe adott p valószínűséggel esik.

elosztási törvény k n _ x (v) az I 7 értéke az ábrán látható formában van. 14.4.1.

Rizs. 14.4.1

Felmerül a kérdés: hogyan válasszuk ki a / p intervallumot? Ha a mennyiség eloszlási törvénye V szimmetrikus volt (mint egy normál törvény vagy Student-eloszlás), természetes lenne a /p intervallumot szimmetrikusnak venni a matematikai elvárásokhoz képest. Ebben az esetben a törvény k n _ x (v) aszimmetrikus. Állapodjunk meg, hogy a /p intervallumot úgy választjuk meg, hogy a mennyiség kimeneti valószínűsége legyen V az intervallumon kívül jobbra és balra (a 14.4.1. ábrán az árnyékolt területek) azonosak és egyenlőek

Egy / p intervallum létrehozásához ezzel a tulajdonsággal a táblázatot használjuk. 4 alkalmazás: számokat tartalmaz y) oly módon, hogy

a mennyiséghez V, x 2 -eloszlású r szabadságfokkal. A mi esetünkben r = n- 1. Javítás r = n- 1, és keresse meg a táblázat megfelelő sorában. 4 két érték x 2 - az egyik valószínűségnek megfelelő a másik - valószínűségek Jelöljük ezeket

értékeket 2-korés xl? Az intervallum rendelkezik y 2 , a baljával, és y~ jobb vége.

Most megtaláljuk a szükséges /| konfidenciaintervallumot a D, és határvonalú variancia esetén D2, amely lefedi a lényeget D p valószínűséggel:

Szerkesszünk egy olyan / (, = (?> b A) intervallumot, amely lefedi a pontot D akkor és csak akkor, ha az érték V intervallumba esik / r. Mutassuk meg, hogy az intervallum

megfelel ennek a feltételnek. Valóban, az egyenlőtlenségek egyenértékűek az egyenlőtlenségekkel

és ezek az egyenlőtlenségek p valószínűséggel fennállnak. Így a diszperzió konfidencia intervallumát megtaláljuk, és a (14.4.13) képlettel fejezzük ki.

3. példa Keresse meg a variancia konfidenciaintervallumát a 14.3. alfejezet 2. példájának feltételei mellett, ha ismert, hogy az érték x normálisan elosztva.

Megoldás. Nekünk van . A pályázat 4. táblázata szerint

címen találjuk r = n - 1 = 19

A (14.4.13) képlet alapján megtaláljuk a diszperzió konfidencia intervallumát

A szórásra vonatkozó megfelelő intervallum: (0,21; 0,32). Ez az intervallum csak kis mértékben haladja meg a 14.3 alfejezet 2. példájában kapott intervallumot (0,21; 0,29), közelítő módszerrel.

  • A 14.3.1. ábra olyan konfidenciaintervallumot vesz figyelembe, amely szimmetrikus az a-ra. Általában, mint később látni fogjuk, erre nincs szükség.

Bármely minta csak hozzávetőleges képet ad az általános sokaságról, és a minta összes statisztikai jellemzője (átlag, módusz, szórás...) az általános paraméterek valamilyen közelítése vagy mondjuk becslése, ami a legtöbb esetben nem számítható ki, mivel a lakosság elérhetetlensége (20. ábra) .

20. ábra Mintavételi hiba

De megadhatja azt az intervallumot, amelyben bizonyos valószínűséggel a statisztikai jellemző valódi (általános) értéke található. Ezt az intervallumot ún d konfidencia intervallum (CI).

Tehát az általános átlag 95%-os valószínűséggel belül van

tól ig, (20)

ahol t - a Student-féle kritérium táblázatos értéke α =0,05 és f= n-1

Megtalálható és 99% CI, ebben az esetben t számára választották α =0,01.

Mi a gyakorlati jelentősége egy konfidenciaintervallumnak?

    A széles konfidenciaintervallum azt jelzi, hogy a minta átlaga nem tükrözi pontosan a sokaság átlagát. Ennek oka általában az elégtelen mintanagyság, vagy annak heterogenitása, pl. nagy szórás. Mindkettő nagy hibát ad az átlagban, és ennek megfelelően szélesebb CI-t ad. És ez az oka annak, hogy visszatérjünk a kutatás tervezési szakaszához.

    A felső és alsó CI határértékek azt értékelik, hogy az eredmények klinikailag jelentősek lesznek-e

Foglalkozzunk részletesebben a csoporttulajdonságok vizsgálata eredményeinek statisztikai és klinikai jelentőségének kérdésével. Emlékezzünk vissza, hogy a statisztika feladata legalább néhány eltérés kimutatása az általános sokaságban, mintaadatok alapján. A klinikus feladata, hogy olyan (nem bármilyen) különbséget találjon, amely segíti a diagnózist vagy a kezelést. És nem mindig a statisztikai következtetések képezik a klinikai következtetések alapját. Így a hemoglobin statisztikailag szignifikáns 3 g/l-es csökkenése nem ad okot aggodalomra. És fordítva, ha az emberi test valamely problémája nem tömegjellegű a teljes népesség szintjén, ez nem ok arra, hogy ne foglalkozzunk ezzel a problémával.

Ezt a pozíciót figyelembe vesszük példa.

A kutatók arra voltak kíváncsiak, hogy azok a fiúk, akik valamilyen fertőző betegségben szenvedtek, lemaradnak-e társaikhoz képest növekedésben. Ebből a célból szelektív vizsgálatot végeztek, amelyben 10 ilyen betegségben szenvedő fiú vett részt. Az eredményeket a 23. táblázat tartalmazza.

23. táblázat Statisztikai eredmények

alsó határ

felső határ

Műszaki adatok (cm)

középső

Ezekből a számításokból az következik, hogy a 10 éves fiúk szelektív átlagmagassága, akik átestek néhány fertőzés, közel a normálhoz (132,5 cm). A konfidenciaintervallum alsó határa (126,6 cm) azonban azt jelzi, hogy 95%-os valószínűséggel ezeknek a gyerekeknek a valódi átlagmagassága megfelel az "alacsony termet" fogalmának, azaz. ezek a gyerekek csökevényesek.

Ebben a példában a konfidenciaintervallum-számítások eredményei klinikailag szignifikánsak.

Ebből a cikkből megtudhatja:

    Mit megbízhatósági intervallum?

    Mi értelme van 3 szigma szabály?

    Hogyan lehet ezt a tudást a gyakorlatba átültetni?

Napjainkban a termékek széles választékával, értékesítési irányokkal, alkalmazottakkal, tevékenységekkel stb. kapcsolatos információbőség miatt, nehéz kiválasztani a főt, amelyre mindenekelőtt érdemes odafigyelni és erőfeszítéseket tenni annak kezelésére. Meghatározás megbízhatósági intervallumés a tényleges értékek határain túllépés elemzése – egy olyan technika, amely segít azonosítani a helyzeteket, trendek befolyásolása. Képes lesz pozitív tényezőket kifejleszteni és csökkenteni a negatívak hatását. Ezt a technológiát számos jól ismert világcég használja.

Vannak ún riasztások", melyik tájékoztassa a vezetőket kimondja, hogy a következő érték egy bizonyos irányba túlment megbízhatósági intervallum. Mit is jelent ez? Ez azt jelzi, hogy valami nem szabványos esemény történt, ami megváltoztathatja a jelenlegi trendet ebben az irányban. Ez a jel ahhoz rendezni a helyzetben, és megértse, mi befolyásolta azt.

Vegyünk például több helyzetet. Az értékesítési előrejelzést 100 árucikk előrejelzési határaival számoltuk ki 2011-re hónapok bontásban és a márciusi tényleges eladások:

  1. készítette: " napraforgóolaj» áttörte az előrejelzés felső határát, és nem esett a konfidenciaintervallumba.
  2. A "száraz élesztő" túllépte az előrejelzés alsó határát.
  3. készítette: " Zabpehely» áttörte a felső határt.

A többi áru esetében a tényleges eladások a megadott előrejelzési határokon belül voltak. Azok. eladásaik a várakozásoknak megfelelően alakultak. Így azonosítottunk 3 olyan terméket, amely túlmutat a határokon, és elkezdtük kitalálni, hogy mi befolyásolta a határon túli utat:

  1. A Napraforgóolajjal új kereskedelmi hálózatba léptünk be, ami további értékesítési volument adott, ami a felső határ túllépéséhez vezetett. Ennél a terméknél érdemes az év végéig újraszámolni az előrejelzést, figyelembe véve az ehhez a lánchoz történő értékesítés előrejelzését.
  2. A Dry Yeast esetében az autó elakadt a vámon, és 5 napon belül hiány alakult ki, ami befolyásolta az eladások visszaesését és az alsó határon túllépést. Érdemes lehet kitalálni, hogy mi okozta az okot, és megpróbálni nem ismétlődni.
  3. A Zabpehely esetében értékesítési promóció indult, ami az eladások jelentős növekedését és az előrejelzés túllépését eredményezte.

Három olyan tényezőt azonosítottunk, amelyek befolyásolták az előrejelzés túllépését. Sokkal több is lehet az életben Az előrejelzés és a tervezés pontosságának javítása érdekében azokat a tényezőket, amelyek ahhoz vezetnek, hogy a tényleges eladások túlmutathatnak az előrejelzésen, érdemes külön kiemelni és külön-külön előrejelzéseket, terveket építeni. Ezután vegye figyelembe a fő értékesítési előrejelzésre gyakorolt ​​hatásukat. Rendszeresen értékelheti ezen tényezők hatását, és javíthatja a helyzetet a negatív hatások csökkentésével és a pozitív tényezők hatásának növelésével.

Egy konfidenciaintervallum segítségével a következőket tehetjük:

  1. Jelölje ki az úti célokat, amelyekre érdemes odafigyelni, mert események történtek ezeken a területeken, amelyek hatással lehetnek trend változása.
  2. Határozza meg a tényezőket amelyek valójában különbséget tesznek.
  3. Elfogadni súlyozott döntés(például beszerzésről, tervezéskor stb.).

Most nézzük meg, mi az a konfidenciaintervallum, és hogyan lehet kiszámítani az Excelben egy példa segítségével.

Mi az a konfidenciaintervallum?

A konfidenciaintervallum az előrejelzési határ (felső és alsó), amelyen belül adott valószínűséggel (szigma) megkapja a tényleges értékeket.

Azok. kiszámítjuk az előrejelzést - ez a fő viszonyítási alapunk, de megértjük, hogy a tényleges értékek nem valószínű, hogy 100%-ban megegyeznek az előrejelzésünkkel. És felmerül a kérdés hogy milyen mértékben tényleges értékeket kaphat, ha a jelenlegi tendencia folytatódik? És ez a kérdés segít megválaszolni konfidencia intervallum számítás, azaz - az előrejelzés felső és alsó határa.

Mi az adott valószínűségi szigma?

Számításkor konfidencia intervallumot tudunk beállított valószínűség találatokat tényleges értékeket a megadott előrejelzési határokon belül. Hogyan kell csinálni? Ehhez beállítjuk a szigma értékét, és ha a szigma egyenlő:

    3 szigma- akkor annak valószínűsége, hogy eltalálja a következő tényleges értéket a konfidencia-intervallumban, 99,7%, vagy 300:1, vagy 0,3% a valószínűsége annak, hogy túllépi a határokat.

    2 szigma- akkor a határokon belüli következő érték eltalálásának valószínűsége ≈ 95,5%, azaz. az odds körülbelül 20:1, vagy 4,5% esély van arra, hogy kikerüljön a pályáról.

    1 szigma- akkor a valószínűség ≈ 68,3%, azaz. az esély körülbelül 2 az 1-hez, vagy 31,7% az esély arra, hogy a következő érték a konfidenciaintervallumon kívülre esik.

megfogalmaztuk 3 szigma szabály,ami azt mondja találati valószínűség másik véletlenszerű érték a konfidencia intervallumba Val vel érték beállítása a három szigma 99,7%.

A nagy orosz matematikus Csebisev bebizonyította azt a tételt, hogy 10% esély van arra, hogy egy adott három szigma értékű előrejelzés túllépjen. Azok. a 3 szigma konfidenciaintervallumba való esés valószínűsége legalább 90%, míg az előrejelzés és határainak „szemből” való kiszámítása sokkal jelentősebb hibákkal jár.

Hogyan lehet önállóan kiszámítani a konfidencia intervallumot az Excelben?

Tekintsük a konfidenciaintervallum Excelben való kiszámítását (azaz az előrejelzés felső és alsó határát) egy példa segítségével. Van egy idősorunk - eladások hónapok szerint 5 évre. Lásd a csatolt fájlt.

Az előrejelzés határainak kiszámításához a következőket számoljuk:

  1. Eladási előrejelzés().
  2. Sigma - szórás előrejelzési modellek a tényleges értékekből.
  3. Három szigma.
  4. Megbízhatósági intervallum.

1. Értékesítési előrejelzés.

=(RC[-14] (adatok idősorokban)-RC[-1] (modell értéke))^2 (négyzet)


3. Havonta összegezze a 8. szakasztól való eltérési értékeket Sum((Xi-Ximod)^2), azaz Foglaljuk össze minden év januárját, februárját...

Ehhez használja a =SUMIF() képletet

SUMIF(tömb a cikluson belüli periódusok számával (hónapokra 1-től 12-ig); hivatkozás a ciklus periódusának számára; hivatkozás egy tömbre a kiindulási adatok és a ciklus értékei közötti különbség négyzeteivel időszakok)


4. Számítsa ki a szórást a ciklus minden egyes periódusára 1-től 12-ig (10. szakasz a csatolt fájlban).

Ehhez a 9. lépésben kiszámított értékből kivonjuk a gyökért, és elosztjuk a ciklus periódusainak számával mínusz 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Használjunk képleteket az Excelben =ROOT(R8 (hivatkozás: (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (hivatkozás egy tömbre ciklusszámokkal); O8 (hivatkozás egy adott ciklusszámra, amelyet a tömbben figyelembe veszünk))-1))

Az Excel képlet használatával = COUNTIF megszámoljuk az n számot


Az előrejelzési modelltől való tényleges adatok szórásának kiszámításával minden hónapra megkaptuk a szigma értéket - 10. szakasz a csatolt fájlban.

3. Számíts ki 3 szigmát!

A 11. szakaszban beállítjuk a szigmák számát - példánkban "3" (11. a csatolt fájlban):

Szintén praktikus szigma értékek:

1,64 szigma – 10% esély a határérték túllépésére (1 esély a 10-hez);

1,96 szigma – 5% esély a határon kívülre (1 esély a 20-ból);

2,6 szigma – 1% esély a határon kívülre (1 a 100-hoz).

5) Kiszámolunk három szigmát, ehhez megszorozzuk a „szigma” értékeket minden hónapban „3-mal”.

3. Határozza meg a konfidencia intervallumot!

  1. Előrejelzés felső határa- értékesítési előrejelzés a növekedés és a szezonalitás figyelembevételével + (plusz) 3 szigma;
  2. Alsó előrejelzési határ- értékesítési előrejelzés a növekedés és a szezonalitás figyelembevételével - (mínusz) 3 szigma;

A megbízhatósági intervallum hosszú időszakra történő kiszámításának megkönnyítése érdekében (lásd a csatolt fájlt) az Excel képletet használjuk =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), ahol

Y8- eladási előrejelzés;

W8- annak a hónapnak a száma, amelyre 3 szigmát veszünk;

Azok. Előrejelzés felső határa= "értékesítési előrejelzés" + "3 szigma" (a példában VLOOKUP(hónapszám; táblázat 3 szigma értékkel; oszlop, amelyből kivonjuk a megfelelő sorban lévő hónap számával megegyező szigmaértéket; 0)).

Alsó előrejelzési határ= "értékesítési előrejelzés" mínusz "3 szigma".

Tehát Excelben kiszámítottuk a konfidencia intervallumot.

Most van egy előrejelzésünk és egy olyan tartományunk, amelyen belül a tényleges értékek adott valószínűségi szigmával esnek.

Ebben a cikkben megvizsgáltuk, mi a szigma és a három szigma szabály, hogyan határozható meg a konfidenciaintervallum, és mit használhat ezt a technikát gyakorlaton.

Pontos előrejelzések és sok sikert neked!

Hogyan A Forecast4AC PRO segítheta konfidenciaintervallum kiszámításakor?:

    A Forecast4AC PRO egyszerre több mint 1000 idősorra automatikusan kiszámítja a felső vagy alsó előrejelzési határokat;

    Az a képesség, hogy egy gombnyomással elemezze az előrejelzés határait a diagramon szereplő előrejelzéssel, trenddel és tényleges eladásokkal összehasonlítva;

A Forcast4AC PRO programban lehetőség van a szigma értékének 1 és 3 közötti beállítására.

Csatlakozz hozzánk!

Töltse le az ingyenes előrejelzési és üzleti intelligencia alkalmazásokat:


  • Novo Forecast Lite- automatikus előrejelzési számítás ban ben excel.
  • 4analytics- ABC-XYZ elemzésés a kibocsátások elemzése Excel.
  • Qlik Sense Asztali és a Qlik ViewPersonal Edition – BI-rendszerek az adatok elemzéséhez és megjelenítéséhez.

Tesztelje a fizetős megoldások funkcióit:

  • Novo Forecast PRO- előrejelzés Excelben nagy adattömbök esetén.

Hagyjuk nagyszámú bizonyos jellemzők normális eloszlású tételei (például azonos típusú zöldségfélék teljes raktára, amelyek mérete és tömege változó). Szeretné tudni a teljes árutétel átlagos jellemzőit, de nincs se ideje, se kedve az egyes zöldségek megmérésére és lemérésére. Megérted, hogy erre nincs szükség. De hány darabot kell venni a véletlenszerű ellenőrzéshez?

Mielőtt megadnánk néhány hasznos képletet ebben a helyzetben, felidézünk néhány jelölést.

Először is, ha megmérnénk a teljes zöldségraktárt (ezt az elemkészletet általános sokaságnak nevezzük), akkor a rendelkezésünkre álló pontossággal tudnánk a teljes tétel tömegének átlagos értékét. Nevezzük ezt átlagnak X vö .g en . - Általános átlag. Azt már tudjuk, hogy mi az, ami teljesen meghatározott, ha ismert az átlagértéke és az eltérése s . Igaz, eddig nem vagyunk sem X átlag, sem s nem ismerjük az általános lakosságot. Csak néhány mintát tudunk venni, megmérni a szükséges értékeket, és erre a mintára kiszámítani mind a mintában lévő X sr. átlagértéket, mind az S sb szórást.

Ismeretes, hogy ha az egyéni ellenőrzésünk nagyszámú elemet tartalmaz (általában n nagyobb, mint 30), tényleg véletlenszerű, majd s az általános népesség szinte nem fog különbözni S ..

Ezenkívül normál eloszlás esetén a következő képleteket használhatjuk:

95%-os valószínűséggel


99%-os valószínűséggel



NÁL NÉL Általános nézetР(t) valószínűséggel


A t értéke és a P (t) valószínűség értéke közötti összefüggést, amellyel a konfidenciaintervallumot szeretnénk megismerni, a következő táblázatból vehetjük át:


Így meghatároztuk, hogy az általános sokaság átlagértéke milyen tartományban van (adott valószínűséggel).

Hacsak nincs elég nagy mintánk, nem állíthatjuk, hogy a sokaság s = S sel. Ráadásul ebben az esetben problémás a minta normál eloszláshoz való közelsége. Ebben az esetben is használja helyette az S sb-t s a képletben:




de t értéke rögzített P(t) valószínűség esetén az n mintában lévő elemek számától függ. Minél nagyobb n, annál közelebb lesz a kapott konfidenciaintervallum az (1) képlet által megadott értékhez. A t értékei ebben az esetben egy másik táblázatból származnak ( Student-féle t-próba), amelyet az alábbiakban mutatunk be:

A Student-féle t-próba értékei a valószínűséghez 0,95 és 0,99


3. példa A cég munkatársai közül véletlenszerűen választottak ki 30 főt. A minta szerint kiderült, hogy az átlagos fizetés (havonta) 30 ezer rubel, átlagosan szórás 5 ezer rubel. 0,99 valószínűséggel határozza meg az átlagos fizetést a cégben.

Megoldás: Feltétel szerint n = 30, X vö. = 30 000, S = 5000, P = 0,99. A konfidenciaintervallum meghatározásához a Student-kritériumnak megfelelő képletet használjuk. Az n \u003d 30 és P \u003d 0,99 táblázat szerint t \u003d 2,756-ot találunk, ezért


azok. vágyott bizalom intervallum 27484< Х ср.ген < 32516.

Tehát 0,99-es valószínűséggel állítható, hogy az intervallum (27484; 32516) tartalmazza a vállalat átlagkeresetét.

Reméljük, hogy ezt a módszert fogja használni anélkül, hogy minden alkalommal lenne nálad egy táblázat. A számítások automatikusan elvégezhetők Excelben. Az Excel fájlban kattintson az fx gombra a felső menüben. Ezután válassza ki a funkciók közül a "statisztikai" típust, és a mezőben lévő javasolt listából - STEUDRASP. Ezután a promptba a kurzort a "valószínűség" mezőbe helyezve írja be a reciprok valószínűség értékét (vagyis esetünkben a 0,95 valószínűség helyett a 0,05 valószínűséget kell beírni). Látszólag táblázatotúgy állítjuk össze, hogy az eredmény választ adjon arra a kérdésre, hogy mennyire tévedhetünk. Hasonlóképpen, a „szabadságfok” mezőbe írja be a minta (n-1) értékét.

A "Katren-Style" továbbra is Konstantin Kravchik ciklusát publikálja az orvosi statisztikákról. A szerző két korábbi cikkében olyan fogalmak magyarázatát érintette, mint és.

Konstantin Kravchik

Matematikus-elemző. Az orvostudományi és humán tudományok statisztikai kutatásának szakembere

Moszkva város

Nagyon gyakran a cikkekben klinikai kutatás találkozhat egy rejtélyes kifejezéssel: „konfidenciaintervallum” (95 % CI vagy 95 % CI - konfidencia intervallum). Például egy cikkben ez állhat: "A tanulói t-tesztet a különbségek szignifikanciájának felmérésére használták, 95%-os konfidenciaintervallumot számítva."

Mi a "95%-os konfidencia intervallum" értéke, és miért kell kiszámítani?

Mi az a konfidenciaintervallum? - Ez az a tartomány, amelybe a népesség valódi átlagértékei esnek. És mi van, vannak "valótlan" átlagok? Bizonyos értelemben igen, igen. Ebben kifejtettük, hogy a teljes populációban nem lehet mérni az érdeklődésre számot tartó paramétert, ezért a kutatók megelégszenek egy korlátozott mintával. Ebben a mintában (például testtömeg szerint) van egy átlagérték (egy bizonyos súly), amely alapján a teljes általános sokaság átlagát ítéljük meg. Nem valószínű azonban, hogy a mintában (különösen egy kicsiben) az átlagos tömeg egybeesik az általános sokaság átlagos súlyával. Ezért helyesebb az általános populáció átlagértékeinek tartományának kiszámítása és használata.

Tegyük fel például, hogy a hemoglobin 95%-os konfidencia intervalluma (95% CI) 110 és 122 g/l között van. Ez azt jelenti, hogy 95 %-os valószínűséggel a hemoglobin valódi átlagértéke az általános populációban 110-122 g/l tartományba esik. Más szóval, nem ismerjük az átlagos hemoglobint az általános populációban, de ennek a tulajdonságnak az értéktartományát 95%-os valószínűséggel tudjuk jelezni.

A bizalmi intervallumok különösen fontosak a csoportok közötti átlagok különbsége, vagy az úgynevezett hatásméret szempontjából.

Tegyük fel, hogy összehasonlítottuk két vaskészítmény hatékonyságát: egy régóta forgalomban lévő és egy most bejegyzett vaskészítményt. A terápia lefolytatása után a vizsgált betegcsoportokban felmértük a hemoglobin koncentrációját, és a statisztikai program számunkra kiszámolta, hogy a két csoport átlagértékei közötti különbség 95%-os valószínűséggel az 1,72-14,36 g/l (1. táblázat).

Tab. 1. Független minták kritériuma
(a csoportokat hemoglobinszint alapján hasonlítják össze)

Ezt a következőképpen kell értelmezni: az általános populációban a betegek azon részén, aki szed új gyógyszer, a hemoglobin átlagosan 1,72-14,36 g/l-rel lesz magasabb, mint azoknál, akik már ismert gyógyszert szedtek.

Más szóval, az általános populációban a csoportok hemoglobin átlagértékeinek különbsége 95% -os valószínűséggel ezeken a határokon belül van. A kutatónak kell eldöntenie, hogy ez sok vagy kevés. Mindennek az a lényege, hogy nem egy átlagértékkel dolgozunk, hanem egy értéktartománnyal, ezért megbízhatóbban becsüljük meg egy paraméter különbségét a csoportok között.

A statisztikai csomagokban a kutató döntése alapján a konfidenciaintervallum határai önállóan szűkíthetők vagy bővíthetők. A konfidenciaintervallum valószínűségeinek csökkentésével szűkítjük az átlagok körét. Például 90%-os CI-nél az átlagok tartománya (vagy az átlagkülönbségek) szűkebb lesz, mint 95%-os CI-nél.

Ezzel szemben a valószínűség 99%-ra növelése szélesíti az értékek tartományát. A csoportok összehasonlításakor a CI alsó határa átlépheti a nullát. Például, ha a konfidenciaintervallum határait kiterjesztettük 99 %-ra, akkor az intervallum határai –1 és 16 g/L között mozogtak. Ez azt jelenti, hogy az általános populációban vannak olyan csoportok, amelyek közötti átlagok különbsége a vizsgált tulajdonságnál 0 (M=0).

A megbízhatósági intervallumok statisztikai hipotézisek tesztelésére használhatók. Ha a konfidencia intervallum átlépi a nulla értéket, akkor igaz a nullhipotézis, amely feltételezi, hogy a csoportok nem különböznek a vizsgált paraméterben. A fentebb leírt példa, amikor a határokat 99%-ra bővítettük. Valahol az általános populációban találtunk olyan csoportokat, amelyek semmiben sem különböztek egymástól.

A hemoglobin különbségének 95%-os konfidencia intervalluma, (g/l)


Az ábra a két csoport átlagos hemoglobin-különbségének 95%-os konfidencia intervallumát mutatja vonalként. A vonal áthalad a nulla jelen, ezért eltérés van az átlagértékek között, nulla, ami megerősíti azt a nullhipotézist, hogy a csoportok nem különböznek egymástól. A csoportok közötti különbség -2 és 5 g/l között van, ami azt jelenti, hogy a hemoglobin vagy 2 g/l-rel csökkenhet, vagy 5 g/l-rel emelkedhet.

A konfidenciaintervallum nagyon fontos mutató. Ennek köszönhetően látható, hogy a csoportok közötti különbségek valóban az átlagok eltéréséből, vagy a nagy mintából származtak-e, mert nagy mintánál nagyobb az esély a különbségek megtalálására, mint egy kicsinél.

A gyakorlatban ez így nézhet ki. 1000 fős mintát vettünk, megmértük a hemoglobinszintet, és megállapítottuk, hogy az átlagok különbségének konfidencia intervalluma 1,2-1,5 g/l. A statisztikai szignifikancia szintje ebben az esetben p

Azt látjuk, hogy a hemoglobin koncentráció nőtt, de szinte észrevehetetlenül, ezért a statisztikai szignifikancia éppen a mintanagyság miatt jelent meg.

A bizalmi intervallumok nemcsak átlagokra, hanem arányokra (és kockázati arányokra) is számíthatók. Például arra vagyunk kíváncsiak, hogy a kifejlesztett gyógyszer szedése közben milyen arányban értek el remissziót a betegek konfidencia intervalluma. Tételezzük fel, hogy az arányok, azaz az ilyen betegek arányának 95%-os CI-je a 0,60-0,80 tartományba esik. Így azt mondhatjuk, hogy gyógyszerünk rendelkezik terápiás hatás Az esetek 60-80%-ában.

Tetszett a cikk? Oszd meg