Kontakty

Smerodajná odchýlka vlastnosti. Smerodajná odchýlka, metóda výpočtu, aplikácia

Odmocnina z rozptylu sa nazýva štandardná odchýlka od priemeru, ktorá sa vypočíta takto:

elementárne algebraická transformácia Vzorce pre smerodajnú odchýlku vedú k nasledujúcemu tvaru:

Tento vzorec je často vhodnejší v praxi výpočtov.

Smerodajná odchýlka, ako aj priemerná lineárna odchýlka, ukazujú, ako veľmi sa špecifické hodnoty atribútu líšia v priemere od svojej priemernej hodnoty. Smerodajná odchýlka je vždy väčšia ako priemer lineárna odchýlka. Existuje medzi nimi vzťah:

Poznaním tohto pomeru je možné určiť neznámu zo známych ukazovateľov, napríklad, ale (I vypočítať a naopak. Smerodajná odchýlka meria absolútnu veľkosť fluktuácie atribútu a je vyjadrená v rovnakých jednotkách ako hodnoty atribútu (ruble, tony, roky atď.). Je to absolútna miera variácie.

Pre alternatívne funkcie, napríklad prítomnosť alebo neprítomnosť vyššie vzdelanie, vzorce poistenia, rozptylu a štandardnej odchýlky sú:

Výpočet smerodajnej odchýlky si ukážeme podľa údajov diskrétneho radu charakterizujúceho rozdelenie študentov jednej z fakúlt univerzity podľa veku (tabuľka 6.2).

Tabuľka 6.2.

Výsledky pomocných výpočtov sú uvedené v stĺpcoch 2-5 tabuľky. 6.2.

Priemerný vek študenta v rokoch sa určuje podľa vzorca váženého aritmetického priemeru (stĺpec 2):

V stĺpcoch 3-4 sú uvedené štvorce odchýlky individuálneho veku žiaka od priemeru a v stĺpci 5 súčin druhých mocnín odchýlok zodpovedajúcimi frekvenciami.

Rozptyl veku študentov, rokov, zistíme podľa vzorca (6.2):

Potom o \u003d l / 3,43 1,85 * oda, t.j. každá konkrétna hodnota veku žiaka sa od priemernej hodnoty odchyľuje o 1,85 roka.

Variačný koeficient

Smerodajná odchýlka vo svojej absolútnej hodnote závisí nielen od stupňa variácie znaku, ale aj od absolútnych úrovní variantov a priemeru. Preto nie je možné priamo porovnávať štandardné odchýlky variačných radov s rôznymi priemernými úrovňami. Aby ste mohli takéto porovnanie urobiť, potrebujete nájsť podiel priemernej odchýlky (lineárnej alebo kvadratickej) na aritmetickom priemere vyjadrený v percentách, t.j. vypočítať relatívne ukazovatele variácie.

Lineárny variačný koeficient vypočítané podľa vzorca

Variačný koeficient určuje sa podľa nasledujúceho vzorca:

Vo variačných koeficientoch sa eliminuje nielen nekompatibilita spojená s rôznymi jednotkami merania skúmaného znaku, ale aj nekompatibilita vyplývajúca z rozdielov v hodnote aritmetických priemerov. Okrem toho, ukazovatele variácie poskytujú charakteristiku homogenity populácie. Súbor sa považuje za homogénny, ak variačný koeficient nepresiahne 33 %.

Podľa tabuľky. 6.2 a výsledky výpočtov získaných vyššie, určíme variačný koeficient,%, podľa vzorca (6.3):

Ak variačný koeficient presiahne 33 %, potom to naznačuje heterogenitu študovanej populácie. Získaná hodnota v našom prípade naznačuje, že populácia študentov podľa veku je v zložení homogénna. Dôležitou funkciou zovšeobecňujúcich ukazovateľov variácie je teda hodnotenie spoľahlivosti priemerov. Menej c1, a2 a V, čím homogénnejší je výsledný súbor javov a tým spoľahlivejší je získaný priemer. Podľa „pravidla troch sigm“ uvažovaného matematickou štatistikou sa v normálne rozdelených alebo im blízkych sériách odchýlky od aritmetického priemeru, ktoré nepresahujú ± 3, vyskytujú v 997 prípadoch z 1000. X a, môžete získať všeobecnú počiatočnú predstavu o sérii variácií. Ak je napr mzda zamestnanca v spoločnosti predstavoval 25 000 rubľov a a sa rovná 100 rubľov, potom s pravdepodobnosťou blízkou spoľahlivosti možno tvrdiť, že mzdy zamestnancov spoločnosti sa pohybujú v rozmedzí (25 000 ± 3 x 100), t.j. od 24 700 do 25 300 rubľov.

Pri štatistickom testovaní hypotéz, pri meraní lineárneho vzťahu medzi náhodnými veličinami.

Štandardná odchýlka:

Smerodajná odchýlka(odhad štandardnej odchýlky náhodná premenná Podlaha, steny okolo nás a strop X v porovnaní s jeho matematickým očakávaním na základe nezaujatého odhadu jeho rozptylu):

kde - rozptyl; - Podlaha, steny okolo nás a strop, i-ty prvok vzorky; - veľkosť vzorky; - aritmetický priemer vzorky:

Treba poznamenať, že oba odhady sú skreslené. Vo všeobecnom prípade nie je možné vytvoriť nezaujatý odhad. Odhad založený na nezaujatom odhade rozptylu je však konzistentný.

pravidlo troch sigma

pravidlo troch sigma() - takmer všetky hodnoty normálne rozloženej náhodnej premennej ležia v intervale . Presnejšie - s nie menšou ako 99,7% istotou leží hodnota normálne rozloženej náhodnej premennej v špecifikovanom intervale (za predpokladu, že hodnota je pravdivá a nie je získaná ako výsledok spracovania vzorky).

Ak skutočná hodnota nie je známa, mali by ste použiť nie, ale podlahu, steny okolo nás a strop, s. Pravidlo troch sigm je teda preložené do pravidla troch poschodí, stien okolo nás a stropu, s .

Interpretácia hodnoty smerodajnej odchýlky

Veľká hodnota štandardnej odchýlky ukazuje veľký rozptyl hodnôt v prezentovanom súbore s priemernou hodnotou súboru; malá hodnota, respektíve ukazuje, že hodnoty v súbore sú zoskupené okolo strednej hodnoty.

Napríklad máme tri sady čísel: (0, 0, 14, 14), (0, 6, 8, 14) a (6, 6, 8, 8). Všetky tri súbory majú stredné hodnoty 7 a smerodajné odchýlky 7, 5 a 1. Posledný súbor má malú smerodajnú odchýlku, pretože hodnoty v súbore sú zoskupené okolo priemeru; prvá sada má najviac veľký významštandardná odchýlka - hodnoty v rámci súboru sa výrazne líšia od strednej hodnoty.

Vo všeobecnom zmysle možno štandardnú odchýlku považovať za mieru neistoty. Napríklad vo fyzike sa štandardná odchýlka používa na určenie chyby série po sebe idúcich meraní nejakej veličiny. Táto hodnota je veľmi dôležitá na určenie hodnovernosti skúmaného javu v porovnaní s hodnotou predpovedanou teóriou: ak je stredná hodnota meraní veľmi odlišná od hodnôt predpovedaných teóriou (veľká smerodajná odchýlka), potom získané hodnoty alebo spôsob ich získania by sa mali znova skontrolovať.

Praktické využitie

V praxi vám štandardná odchýlka umožňuje určiť, do akej miery sa môžu hodnoty v súbore líšiť od priemernej hodnoty.

Klíma

Predpokladajme, že existujú dve mestá s rovnakou priemernou dennou maximálnou teplotou, ale jedno sa nachádza na pobreží a druhé vo vnútrozemí. Je známe, že pobrežné mestá majú mnoho rôznych denných maximálnych teplôt nižšie ako vnútrozemské mestá. Preto bude smerodajná odchýlka maximálnych denných teplôt v pobrežnom meste menšia ako v druhom meste, a to aj napriek tomu, že majú rovnakú priemernú hodnotu tejto hodnoty, čo v praxi znamená, že pravdepodobnosť, že maximálna teplota vzduchu je každý konkrétny deň v roku bude silnejší, líši sa od priemernej hodnoty, vyššej pre mesto nachádzajúce sa na kontinente.

Šport

Predpokladajme, že ich je niekoľko futbalové tímy, ktoré sa hodnotia podľa nejakej sady parametrov, napríklad počtu strelených a inkasovaných gólov, šancí na skórovanie atď. Je veľmi pravdepodobné, že najlepší tím v tejto skupine bude mať najlepšie hodnoty pre viacero parametrov. Čím menšia je štandardná odchýlka tímu pre každý z prezentovaných parametrov, tým je výsledok tímu predvídateľnejší, takéto tímy sú vyrovnané. Na druhej strane pre tím s veľkou smerodajnou odchýlkou ​​je ťažké predpovedať výsledok, čo sa zase vysvetľuje nerovnováhou, napr. silná obrana, ale slabý útok.

Použitie štandardnej odchýlky parametrov tímu umožňuje do určitej miery predpovedať výsledok zápasu medzi dvoma tímami, hodnotiť silné stránky a slabé stránky príkazy, a teda aj zvolené metódy boja.

Technická analýza

pozri tiež

Literatúra

* Borovikov, V.ŠTATISTIKA. Umenie počítačovej analýzy dát: Pre profesionálov / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1.

smerodajná odchýlka(synonymá: smerodajná odchýlka, smerodajná odchýlka, smerodajná odchýlka; súvisiace výrazy: smerodajná odchýlka, štandardný spread) - v teórii a štatistike pravdepodobnosti najbežnejší ukazovateľ rozptylu hodnôt náhodnej premennej vo vzťahu k jej matematickému očakávaniu. Pri obmedzených poliach vzoriek hodnôt sa namiesto matematického očakávania používa aritmetický priemer súboru vzoriek.

Encyklopedický YouTube

  • 1 / 5

    Smerodajná odchýlka sa meria v jednotkách merania samotnej náhodnej premennej a používa sa pri výpočte štandardnej chyby aritmetického priemeru, pri konštrukcii intervalov spoľahlivosti, pri štatistickom overovaní hypotéz, pri meraní lineárneho vzťahu medzi náhodnými premennými. Je definovaná ako druhá odmocnina rozptylu náhodnej premennej.

    Štandardná odchýlka:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\suma _( i=1)^(n)\vľavo(x_(i)-(\bar (x))\vpravo)^(2)));)
    • Poznámka: Veľmi často sa vyskytujú nezrovnalosti v názvoch RMS (štandardná odchýlka) a SRT (štandardná odchýlka) s ich vzorcami. Napríklad v module numPy programovacieho jazyka Python je funkcia std() opísaná ako „štandardná odchýlka“, zatiaľ čo vzorec odráža smerodajnú odchýlku (delenú odmocninou vzorky). V Exceli je funkcia STDEV() iná (delená druhou odmocninou z n-1).

    Smerodajná odchýlka(odhad štandardnej odchýlky náhodnej premennej X v porovnaní s jeho matematickým očakávaním na základe nezaujatého odhadu jeho rozptylu) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))))

    kde σ 2 (\displaystyle \sigma ^(2))- disperzia; x i (\displaystyle x_(i)) - i-ty prvok vzorky; n (\displaystyle n)- veľkosť vzorky; - aritmetický priemer vzorky:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Treba poznamenať, že oba odhady sú skreslené. Vo všeobecnom prípade nie je možné vytvoriť nezaujatý odhad. Odhad založený na nezaujatom odhade rozptylu je však konzistentný.

    V súlade s GOST R 8.736-2011 sa štandardná odchýlka vypočíta podľa druhého vzorca tejto časti. Skontrolujte svoje výsledky.

    pravidlo troch sigma

    pravidlo troch sigma (3 σ (\displaystyle 3\sigma )) - takmer všetky hodnoty normálne rozloženej náhodnej premennej ležia v intervale (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Presnejšie - približne s pravdepodobnosťou 0,9973 leží hodnota normálne rozloženej náhodnej premennej v určenom intervale (za predpokladu, že hodnota x ¯ (\displaystyle (\bar (x))) pravdivé a nezískané ako výsledok spracovania vzorky).

    Ak je skutočná hodnota x ¯ (\displaystyle (\bar (x))) neznáme, potom by ste mali použiť σ (\displaystyle \sigma ), a s. Pravidlo troch sigma sa teda transformuje na pravidlo troch s .

    Interpretácia hodnoty smerodajnej odchýlky

    Väčšia hodnota štandardnej odchýlky indikuje väčší rozptyl hodnôt v prezentovanom súbore s priemerom súboru; menšia hodnota znamená, že hodnoty v súbore sú zoskupené okolo priemernej hodnoty.

    Napríklad máme tri sady čísel: (0, 0, 14, 14), (0, 6, 8, 14) a (6, 6, 8, 8). Všetky tri súbory majú stredné hodnoty 7 a smerodajné odchýlky 7, 5 a 1. Posledný súbor má malú smerodajnú odchýlku, pretože hodnoty v súbore sú zoskupené okolo priemeru; prvá množina má najväčšiu hodnotu štandardnej odchýlky - hodnoty v rámci množiny sa výrazne líšia od priemernej hodnoty.

    Vo všeobecnom zmysle možno štandardnú odchýlku považovať za mieru neistoty. Napríklad vo fyzike sa štandardná odchýlka používa na určenie chyby série po sebe idúcich meraní nejakej veličiny. Táto hodnota je veľmi dôležitá na určenie hodnovernosti skúmaného javu v porovnaní s hodnotou predpovedanou teóriou: ak je stredná hodnota meraní veľmi odlišná od hodnôt predpovedaných teóriou (veľká smerodajná odchýlka), potom získané hodnoty alebo spôsob ich získania by sa mali znova skontrolovať. je identifikovaný s portfóliovým rizikom.

    Klíma

    Predpokladajme, že existujú dve mestá s rovnakou priemernou maximálnou dennou teplotou, ale jedno sa nachádza na pobreží a druhé na rovine. Je známe, že pobrežné mestá majú mnoho rôznych denných maximálnych teplôt nižšie ako vnútrozemské mestá. Preto bude smerodajná odchýlka maximálnych denných teplôt v pobrežnom meste menšia ako v druhom meste, a to aj napriek tomu, že majú rovnakú priemernú hodnotu tejto hodnoty, čo v praxi znamená, že pravdepodobnosť, že maximálna teplota vzduchu je každý konkrétny deň v roku bude silnejší, líši sa od priemernej hodnoty, vyššej pre mesto nachádzajúce sa na kontinente.

    Šport

    Predpokladajme, že existuje niekoľko futbalových tímov, ktoré sú zoradené podľa nejakého súboru parametrov, napríklad podľa počtu strelených a inkasovaných gólov, šancí na skórovanie atď. Je veľmi pravdepodobné, že najlepší tím v tejto skupine bude mať najlepšie hodnoty. vo viacerých parametroch. Čím menšia je štandardná odchýlka tímu pre každý z prezentovaných parametrov, tým je výsledok tímu predvídateľnejší, takéto tímy sú vyrovnané. Na druhej strane tím s veľkou smerodajnou odchýlkou ​​ťažko predpovedá výsledok, čo sa zase vysvetľuje nevyváženosťou, napríklad silná obrana, ale slabý útok.

    Použitie štandardnej odchýlky parametrov tímu umožňuje do určitej miery predpovedať výsledok zápasu medzi dvoma tímami, hodnotiť silné a slabé stránky tímov, a tým aj zvolené metódy boja.

    Jedným z hlavných nástrojov štatistickej analýzy je výpočet smerodajnej odchýlky. Tento ukazovateľ umožňuje hodnotiť smerodajná odchýlka podľa vzorky alebo podľa populácie. Poďme sa naučiť, ako používať vzorec smerodajnej odchýlky v Exceli.

    Okamžite definujme, čo je priemer smerodajná odchýlka a ako vyzerá vzorec. Táto hodnota je druhou odmocninou priemeru aritmetické čísloštvorce rozdielu všetkých hodnôt série a ich aritmetický priemer. Tento ukazovateľ má identický názov – smerodajná odchýlka. Oba názvy sú úplne rovnocenné.

    Ale, samozrejme, v Exceli to používateľ nemusí počítať, pretože program robí všetko za neho. Poďme sa naučiť, ako vypočítať štandardnú odchýlku v Exceli.

    Výpočet v Exceli

    Zadanú hodnotu môžete vypočítať v Exceli pomocou dvoch špeciálnych funkcií STDEV.V(podľa vzoru) a STDEV.G(podľa bežnej populácie). Princíp ich fungovania je úplne rovnaký, ale môžu byť nazývané tromi spôsobmi, o ktorých budeme diskutovať nižšie.

    Metóda 1: Sprievodca funkciou


    Metóda 2: Karta Vzorce


    Metóda 3: Manuálne zadanie vzorca

    Existuje aj spôsob, kedy okno argumentov vôbec nemusíte vyvolávať. Ak to chcete urobiť, zadajte vzorec manuálne.


    Ako vidíte, mechanizmus výpočtu štandardnej odchýlky v Exceli je veľmi jednoduchý. Používateľovi stačí zadať čísla z populácie alebo odkazy na bunky, ktoré ich obsahujú. Všetky výpočty vykonáva samotný program. Oveľa ťažšie je pochopiť, čo je vypočítaný ukazovateľ a ako možno výsledky výpočtu uplatniť v praxi. Pochopiť to však už patrí viac do sféry štatistiky ako do učenia sa pracovať so softvérom.

    Približnou metódou na posúdenie kolísania variačného radu je určenie limitu a amplitúdy, avšak hodnoty variantu v rámci radu sa neberú do úvahy. Hlavnou všeobecne akceptovanou mierou fluktuácie kvantitatívneho znaku v rámci rozsahu variácií je smerodajná odchýlka (σ - sigma). Čím väčšia je štandardná odchýlka, tým väčší je stupeň fluktuácie tento riadok vyššie.

    Metóda výpočtu štandardnej odchýlky zahŕňa nasledujúce kroky:

    1. Nájdite aritmetický priemer (M).

    2. Určte odchýlky jednotlivých možností od aritmetického priemeru (d=V-M). AT lekárske štatistiky odchýlky od priemeru sa označujú ako d (odchýlka). Súčet všetkých odchýlok sa rovná nule.

    3. Druhá mocnina každej odchýlky d 2 .

    4. Vynásobte druhú mocninu odchýlok príslušnými frekvenciami d 2 *p.

    5. Nájdite súčet súčinov å(d 2 *p)

    6. Vypočítajte smerodajnú odchýlku podľa vzorca:

    Keď n je väčšie ako 30 alebo keď n je menšie alebo rovné 30, kde n je počet všetkých možností.

    Hodnota štandardnej odchýlky:

    1. Smerodajná odchýlka charakterizuje rozšírenie variantu vzhľadom na stredná veľkosť(t. j. kolísanie série variácií). Čím väčšia je sigma, tým vyššia je miera rozmanitosti tejto série.

    2. Smerodajná odchýlka sa používa na porovnávacie hodnotenie miery zhody s priemerom aritmetická hodnota variačný rad, pre ktorý bol vypočítaný.

    Variácie hromadných javov sa riadia zákonom normálneho rozdelenia. Krivka predstavujúca toto rozdelenie má tvar hladkej symetrickej krivky v tvare zvona (Gaussova krivka). Podľa teórie pravdepodobnosti v javoch, ktoré sa riadia zákonom normálneho rozdelenia, existuje prísny matematický vzťah medzi hodnotami aritmetického priemeru a štandardnou odchýlkou. Teoretický variant rozdelenia v homogénnom variačná séria dodržiava pravidlo troch sigma.

    Ak sú v systéme pravouhlých súradníc na osi x vynesené hodnoty kvantitatívneho znaku (možnosti) a na osi y - frekvencia výskytu variantu v sérii variácií, potom varianty s väčšími a menšími hodnotami sú rovnomerne umiestnené po stranách aritmetického priemeru.



    Zistilo sa, že pri normálnom rozložení vlastnosti:

    68,3 % hodnôt variantu je v rozmedzí М±1s

    95,5 % hodnôt variantu je v rozmedzí M±2s

    99,7 % hodnôt variantu je v rozmedzí M±3s

    3. Smerodajná odchýlka vám umožňuje nastaviť normálne hodnoty pre klinické a biologické parametre. V medicíne sa interval M ± 1s zvyčajne berie mimo normálneho rozsahu pre skúmaný jav. Odchýlka odhadnutej hodnoty od aritmetického priemeru o viac ako 1s indikuje odchýlku študovaného parametra od normy.

    4. V medicíne sa pravidlo troch sigma používa v pediatrii pre individuálne hodnotenieúrovni fyzický vývoj deti (metóda sigma odchýlok), na vypracovanie noriem pre detské oblečenie

    5. Smerodajná odchýlka je potrebná na charakterizáciu stupňa diverzity študovaného znaku a na výpočet chyby aritmetického priemeru.

    Hodnota smerodajnej odchýlky sa zvyčajne používa na porovnanie výkyvov rovnakého typu série. Ak sa porovnajú dva riadky s rôzne znamenia(výška a hmotnosť, priemerná dĺžka pobytu v nemocnici a úmrtnosť v nemocnici atď.), potom priame porovnanie veľkostí sigma nie je možné , pretože smerodajná odchýlka – pomenovaná hodnota, vyjadrená v absolútnych číslach. V týchto prípadoch aplikujte variačný koeficient (Cv), čo je relatívna hodnota: percento štandardnej odchýlky k aritmetickému priemeru.

    Variačný koeficient sa vypočíta podľa vzorca:

    Čím vyšší je variačný koeficient , tým väčšia je variabilita tohto radu. Predpokladá sa, že variačný koeficient nad 30 % indikuje kvalitatívnu heterogenitu populácie.

Páčil sa vám článok? Zdieľaj to