Kontakty

Meria sa štandardná odchýlka. Smerodajná odchýlka vzorca v Exceli

Očakávanie a rozptyl

Poďme zmerať náhodnú premennú N krát, napríklad desaťkrát meriame rýchlosť vetra a chceme zistiť priemernú hodnotu. Ako súvisí priemerná hodnota s distribučnou funkciou?

Hodíme kockou veľké množstvo raz. Počet bodov, ktoré sa objavia na kocke pri každom hode, je náhodná premenná a môže nadobudnúť akúkoľvek prirodzenú hodnotu od 1 do 6. Aritmetický priemer padnutých bodov vypočítaný pre všetky hody kockami je tiež náhodná premenná, ale pre veľké N inklinuje k veľmi konkrétnemu číslu – matematickému očakávaniu Mx. V tomto prípade Mx = 3,5.

Ako ste získali túto hodnotu? Vpustiť N testy, raz získate 1 bod, raz 2 body atď. Potom, keď N→ ∞ počet výsledkov, pri ktorých bol hodený jeden bod, Podobne teda

Model 4.5. Kocky

Predpokladajme teraz, že poznáme distribučný zákon náhodná premenná X, to znamená, že vieme, že náhodná premenná X môže nadobudnúť hodnoty X 1 , X 2 , ..., x k s pravdepodobnosťami p 1 , p 2 , ..., p k.

Očakávaná hodnota Mx náhodná premenná X rovná sa:

Odpoveď. 2,8.

Matematické očakávanie nie je vždy rozumným odhadom nejakej náhodnej premennej. Takže odhadnúť priemer mzdy rozumnejšie je použiť pojem medián, teda takú hodnotu, aby sa zhodoval počet ľudí poberajúcich plat nižší ako medián a vyšší.

Medián náhodná premenná je číslo X 1/2 je taká, že p (X < X 1/2) = 1/2.

Inými slovami, pravdepodobnosť p 1, že náhodná premenná X bude menšia X 1/2 a pravdepodobnosť p 2, že náhodná premenná X bude väčšia X 1/2 sú rovnaké a rovnajú sa 1/2. Medián nie je určený jednoznačne pre všetky distribúcie.

Vráťme sa k náhodnej premennej X, ktorý môže nadobudnúť hodnoty X 1 , X 2 , ..., x k s pravdepodobnosťami p 1 , p 2 , ..., p k.

Rozptyl náhodná premenná X Priemerná hodnota štvorcovej odchýlky náhodnej premennej od jej matematického očakávania sa nazýva:

Príklad 2

Za podmienok predchádzajúceho príkladu vypočítajte rozptyl a smerodajnú odchýlku náhodnej premennej X.

Odpoveď. 0,16, 0,4.

Model 4.6. Streľba na cieľ

Príklad 3

Nájdite rozdelenie pravdepodobnosti počtu bodov získaných pri prvom hode kockou, medián, matematické očakávanie, rozptyl a smerodajnú odchýlku.

Je rovnako pravdepodobné, že každá hrana vypadne, takže distribúcia bude vyzerať takto:

Smerodajná odchýlka Je vidieť, že odchýlka hodnoty od priemernej hodnoty je veľmi veľká.

Vlastnosti matematického očakávania:

  • Matematické očakávanie súčtu nezávislých náhodných premenných sa rovná súčtu ich matematických očakávaní:

Príklad 4

Nájdite matematické očakávanie súčtu a súčinu bodov hodených na dvoch kockách.

V príklade 3 sme to zistili pre jednu kocku M (X) = 3,5. Takže na dve kocky

Disperzné vlastnosti:

  • Rozptyl súčtu nezávislých náhodných premenných sa rovná súčtu rozptylov:

D x + r = D x + D Y.

Nechajte pre N kotúľa na kockách hodených r bodov. Potom

Tento výsledok platí nielen pri hodoch kockami. V mnohých prípadoch určuje presnosť merania matematického očakávania empiricky. Je vidieť, že s pribúdajúcim počtom meraní Nšírenie hodnôt okolo priemeru, teda štandardnej odchýlky, sa úmerne znižuje

Rozptyl náhodnej premennej súvisí s matematickým očakávaním druhej mocniny tejto náhodnej premennej nasledujúcim vzťahom:

Nájdime matematické očakávania oboch strán tejto rovnosti. A-priory,

Matematické očakávanie pravej strany rovnosti sa podľa vlastnosti matematických očakávaní rovná

Smerodajná odchýlka

Smerodajná odchýlka rovná sa druhej odmocnine rozptylu:
Pri určovaní štandardnej odchýlky pre dostatočne veľký objem študovanej populácie (n > 30) sa používajú tieto vzorce:

Súvisiace informácie.


Približnou metódou hodnotenia variability série variácií je určenie limitu a amplitúdy, ale hodnoty variantu v rámci série sa neberú do úvahy. Hlavnou všeobecne akceptovanou mierou variability kvantitatívnej charakteristiky v rámci radu variácií je smerodajná odchýlka (σ - sigma). Čím väčšia je štandardná odchýlka, tým je stupeň variability túto sériu vyššie.

Metóda výpočtu štandardnej odchýlky zahŕňa nasledujúce kroky:

1. Nájdite aritmetický priemer (M).

2. Určte odchýlky jednotlivých možností od aritmetického priemeru (d=V-M). V lekárskej štatistike sa odchýlky od priemeru označujú ako d (odchýlka). Súčet všetkých odchýlok je nula.

3. Druhá mocnina každej odchýlky d 2.

4. Vynásobte druhé mocniny odchýlok príslušnými frekvenciami d 2 *p.

5. Nájdite súčet súčinov å(d 2 *p)

6. Vypočítajte smerodajnú odchýlku pomocou vzorca:

Keď n je väčšie ako 30 alebo keď n je menšie alebo rovné 30, kde n je počet všetkých možností.

Priemerná hodnota štvorcová odchýlka:

1. Smerodajná odchýlka charakterizuje rozšírenie variantu vzhľadom na priemerná veľkosť(t. j. kolísanie série variácií). Čím väčšia sigma, tým vyšší stupeň rozmanitosti tejto série.

2. Smerodajná odchýlka sa používa na porovnávacie hodnotenie miery zhody s priemerom aritmetická hodnota variačný rad, pre ktorý bol vypočítaný.

Variácie hromadných javov sa riadia zákonom normálneho rozdelenia. Krivka predstavujúca toto rozdelenie vyzerá ako hladká symetrická krivka v tvare zvona (Gaussova krivka). Podľa teórie pravdepodobnosti v javoch, ktoré sa riadia zákonom normálneho rozdelenia, existuje prísny matematický vzťah medzi hodnotami aritmetického priemeru a štandardnou odchýlkou. Teoretická možnosť rozdelenia v homogénnom stave variačná séria dodržiava pravidlo troch sigma.

Ak sú v systéme pravouhlých súradníc hodnoty kvantitatívnej charakteristiky (varianty) vynesené na osi x a frekvencia výskytu variantu v sérii variácií na osi y, potom varianty s väčšími a menšími hodnoty sú rovnomerne umiestnené po stranách aritmetického priemeru.



Zistilo sa, že pri normálnom rozložení vlastnosti:

68,3 % hodnôt variantu je v rozmedzí M±1s

95,5 % hodnôt variantu je v rozmedzí M±2s

99,7 % hodnôt variantu je v rozmedzí M±3s

3. Smerodajná odchýlka vám umožňuje stanoviť normálne hodnoty klinických a biologických parametrov. V medicíne sa interval M±1s zvyčajne považuje za normálny rozsah pre skúmaný jav. Odchýlka odhadnutej hodnoty od aritmetického priemeru o viac ako 1s indikuje odchýlku študovaného parametra od normy.

4. V medicíne sa pravidlo troch sigma používa v pediatrii pre individuálne posúdenieúrovni fyzický vývoj deti (metóda sigma odchýlky), vypracovať normy pre detské oblečenie

5. Smerodajná odchýlka je potrebná na charakterizáciu stupňa diverzity skúmanej charakteristiky a na výpočet chyby aritmetického priemeru.

Hodnota smerodajnej odchýlky sa zvyčajne používa na porovnanie variability sérií rovnakého typu. Ak sa porovnajú dve série s rôzne znamenia(výška a hmotnosť, priemerná dĺžka hospitalizácie a úmrtnosť v nemocnici atď.), potom nie je možné priame porovnanie veľkostí sigma , pretože smerodajná odchýlka je pomenovaná hodnota vyjadrená v absolútnych číslach. V týchto prípadoch použite variačný koeficient (Cv), čo je relatívna hodnota: percento štandardnej odchýlky k aritmetickému priemeru.

Variačný koeficient sa vypočíta podľa vzorca:

Čím vyšší je variačný koeficient , tým väčšia je variabilita tohto radu. Predpokladá sa, že variačný koeficient vyšší ako 30 % indikuje kvalitatívnu heterogenitu populácie.

Smerodajná odchýlka je klasickým ukazovateľom variability z deskriptívnej štatistiky.

Smerodajná odchýlka, štandardná odchýlka, štandardná odchýlka, vzorka smerodajná odchýlka(angl. štandardná odchýlka, STD, STDev) - veľmi častý indikátor rozptylu v deskriptívna štatistika. Ale pretože technická analýza je podobná štatistike, tento ukazovateľ sa môže (a mal by) použiť v technickej analýze na zistenie miery rozptylu ceny analyzovaného nástroja v čase. Označuje sa gréckym symbolom Sigma „σ“.

Ďakujeme Karlovi Gaussovi a Pearsonovi za to, že nám umožnili použiť štandardnú odchýlku.

Použitím štandardná odchýlka v technickej analýze, otočíme to "disperzný index""V „ukazovateľ volatility“, pričom sa zachováva význam, ale menia sa pojmy.

Čo je štandardná odchýlka

Ale okrem pomocných pomocných výpočtov, štandardná odchýlka je celkom prijateľná pre nezávislý výpočet a aplikácie v technickej analýze. Ako poznamenal aktívny čitateľ nášho časopisu lopúch, “ Stále nerozumiem, prečo štandardná odchýlka nie je zahrnutá v súbore štandardných ukazovateľov domácich obchodných centier«.

naozaj, smerodajná odchýlka môže merať variabilitu nástroja klasickým a „čistým“ spôsobom. Bohužiaľ, tento ukazovateľ nie je v analýze cenných papierov taký bežný.

Použitie štandardnej odchýlky

Ručný výpočet smerodajnej odchýlky nie je veľmi zaujímavý, ale užitočné pre skúsenosti. Štandardná odchýlka môže byť vyjadrená vzorec STD=√[(∑(x-x ) 2)/n] , čo znie ako odmocnina zo súčtu druhých mocnín rozdielov medzi prvkami vzorky a priemerom, vydelená počtom prvkov vo vzorke.

Ak počet prvkov vo vzorke presiahne 30, potom menovateľ zlomku pod koreňom nadobudne hodnotu n-1. Inak sa používa n.

Krok za krokom výpočet smerodajnej odchýlky:

  1. vypočítajte aritmetický priemer vzorky údajov
  2. odčítajte tento priemer od každého prvku vzorky
  3. umocníme všetky výsledné rozdiely
  4. spočítajte všetky výsledné štvorce
  5. vydeľte výsledné množstvo počtom prvkov vo vzorke (alebo n-1, ak n>30)
  6. vypočítať Odmocnina z výsledného kvocientu (tzv disperzia)

Definované ako zovšeobecňujúca charakteristika veľkosti variácie znaku v súhrne. Rovná sa druhej odmocnine priemernej štvorcovej odchýlky jednotlivých hodnôt atribútu od aritmetického priemeru, t.j. Koreň a možno nájsť takto:

1. Pre primárny riadok:

2. Pre sériu variácií:

Transformácia vzorca smerodajnej odchýlky ho privedie do formy vhodnejšej pre praktické výpočty:

Smerodajná odchýlka určuje, o koľko sa v priemere konkrétne možnosti odchyľujú od svojej priemernej hodnoty, a je tiež absolútnou mierou variability charakteristiky a vyjadruje sa v rovnakých jednotkách ako možnosti, a preto sa dobre interpretuje.

Príklady zisťovania štandardnej odchýlky: ,

Pre alternatívne charakteristiky vzorec štandardnej odchýlky vyzerá takto:

kde p je podiel jednotiek v populácii, ktoré majú určitú charakteristiku;

q je podiel jednotiek, ktoré túto charakteristiku nemajú.

Koncept priemernej lineárnej odchýlky

Priemerná lineárna odchýlka je definovaný ako aritmetický priemer absolútnych hodnôt odchýlok jednotlivých možností od .

1. Pre primárny riadok:

2. Pre sériu variácií:

kde je súčet n súčet frekvencií variačných radov.

Príklad nájdenia priemernej lineárnej odchýlky:

Výhoda strednej absolútnej odchýlky ako miery rozptylu v rozsahu variácií je zrejmá, pretože táto miera je založená na zohľadnení všetkých možné odchýlky. Tento ukazovateľ má však značné nevýhody. Svojvoľné odmietnutie algebraických znakov odchýlok môže viesť k tomu, že matematické vlastnosti tohto ukazovateľa nie sú ani zďaleka elementárne. To veľmi sťažuje použitie strednej absolútnej odchýlky pri riešení úloh zahŕňajúcich pravdepodobnostné výpočty.

Preto sa priemerná lineárna odchýlka ako miera variácie charakteristiky v štatistickej praxi používa len zriedka, najmä keď sčítanie ukazovateľov bez zohľadnenia znamienok dáva ekonomický zmysel. S jeho pomocou sa analyzuje napríklad obrat zahraničného obchodu, zloženie pracovníkov, rytmus výroby atď.

Hlavné námestie

Použitý priemerný štvorec, napríklad na výpočet priemernej veľkosti strán n štvorcových sekcií, priemerných priemerov kmeňov, rúr atď. Rozdeľuje sa na dva typy.

Jednoduchý stredný štvorec. Ak je pri nahradení jednotlivých hodnôt charakteristiky priemernou hodnotou potrebné ponechať nezmenený súčet druhých mocnín pôvodných hodnôt, potom bude priemer kvadratickou priemernou hodnotou.

Je to druhá odmocnina podielu delenia súčtu druhých mocnín jednotlivých hodnôt atribútov ich počtom:

Vážená stredná štvorec sa vypočíta pomocou vzorca:

kde f je znak hmotnosti.

Priemerný kubický

Platí priemerný kubický, napríklad pri definovaní stredná dĺžka strany a kocky. Delí sa na dva typy.
Priemerná kubická jednoduchá:

Pri výpočte priemerných hodnôt a rozptylu v intervaloch distribučných radov sa skutočné hodnoty atribútu nahradia strednými hodnotami intervalov, ktoré sa líšia od aritmetického priemeru hodnôt zahrnutých v intervale. To vedie k systematickej chybe pri výpočte rozptylu. V.F. Sheppard to určil chyba vo výpočte rozptylu, spôsobené použitím zoskupených údajov, je 1/12 druhej mocniny hodnoty intervalu, a to v smere zvyšovania aj klesania veľkosti rozptylu.

Sheppardov dodatok by sa malo použiť, ak je rozdelenie blízke normálnemu, vzťahuje sa na charakteristiku s nepretržitým charakterom variácie a je založené na významnom množstve počiatočných údajov (n > 500). Avšak na základe skutočnosti, že v niektorých prípadoch sa obe chyby, pôsobiace rôznymi smermi, navzájom kompenzujú, je niekedy možné odmietnuť zavedenie opráv.

Ako menšiu hodnotu rozptyl a smerodajnú odchýlku, čím homogénnejšia bude populácia a tým typickejší bude priemer.
V praxi štatistiky často vzniká potreba porovnávať variácie rôznych charakteristík. Napríklad je veľmi zaujímavé porovnať rozdiely vo veku pracovníkov a ich kvalifikáciu, dĺžku služby a mzdy, náklady a zisky, dĺžku služby a produktivitu práce atď. Pre takéto porovnania sú ukazovatele absolútnej variability charakteristík nevhodné: nemožno porovnávať variabilitu pracovných skúseností vyjadrenú v rokoch s variáciou miezd vyjadrenou v rubľoch.

Na uskutočnenie takýchto porovnaní, ako aj porovnania variability tej istej charakteristiky vo viacerých populáciách s rôznymi aritmetickými priemermi sa používa relatívny ukazovateľ variácie - variačný koeficient.

Štrukturálne priemery

Charakterizovať ústrednú tendenciu v štatistické distribúcieČasto je racionálne použiť spolu s aritmetickým priemerom určitú hodnotu atribútu X, ktorá vzhľadom na určité znaky jeho umiestnenia v distribučnom rade môže charakterizovať jeho úroveň.

Toto je obzvlášť dôležité, keď v distribučnom rade majú extrémne hodnoty charakteristiky nejasné hranice. Z tohto dôvodu presná definícia Aritmetický priemer je zvyčajne nemožný alebo veľmi ťažký. V takých prípadoch priemerná úroveň možno určiť napríklad tak, že sa vezme hodnota funkcie, ktorá sa nachádza v strede frekvenčného radu alebo ktorá sa v aktuálnom rade vyskytuje najčastejšie.

Takéto hodnoty závisia iba od povahy frekvencií, t.j. od štruktúry distribúcie. Sú typické umiestnením v sérii frekvencií, preto sa takéto hodnoty považujú za charakteristiky stredu distribúcie, a preto dostali definíciu štrukturálnych priemerov. Používajú sa na štúdium vnútorná štruktúra a štruktúru distribučných radov hodnôt atribútov. Takéto ukazovatele zahŕňajú:

Stojí za zmienku, že tento výpočet rozptylu má nevýhodu - ukazuje sa ako neobjektívny, t.j. jeho matematické očakávanie sa nerovná skutočnej hodnote rozptylu. Prečítajte si o tom viac. Zároveň nie je všetko také zlé. S narastajúcou veľkosťou vzorky sa stále približuje k svojmu teoretickému analógu, t.j. je asymptoticky nezaujatý. Preto pri práci s veľké veľkosti vzorky, môžete použiť vzorec uvedený vyššie.

Je užitočné preložiť jazyk znakov do jazyka slov. Ukazuje sa, že rozptyl je priemerný štvorec odchýlok. To znamená, že najprv sa vypočíta priemerná hodnota, potom sa vezme rozdiel medzi každou pôvodnou a priemernou hodnotou, umocní sa, pripočíta sa a potom sa vydelí počtom hodnôt v populácii. Rozdiel medzi jednotlivou hodnotou a priemerom odráža mieru odchýlky. Umocňuje sa tak, aby sa všetky odchýlky stali výlučne kladnými číslami a aby sa zabránilo vzájomnému zničeniu kladných a záporných odchýlok pri ich sčítavaní. Potom, vzhľadom na druhú mocninu odchýlok, jednoducho vypočítame aritmetický priemer. Priemer - štvorec - odchýlky. Odchýlky sa umocnia na druhú a vypočíta sa priemer. Riešenie spočíva len v troch slovách.

Avšak v čistej forme, ako je aritmetický priemer alebo index, rozptyl sa nepoužíva. Ide skôr o pomocný a prechodný ukazovateľ, ktorý je potrebný pre iné typy štatistických analýz. Nemá ani normálnu mernú jednotku. Súdiac podľa vzorca, ide o druhú mocninu jednotky merania pôvodných údajov. Bez fľaše, ako sa hovorí, na to nemôžete prísť.

(modul 111)

Aby sa odchýlka vrátila do reality, teda aby sa použila na prízemnejšie účely, vytiahne sa z nej druhá odmocnina. Ukazuje sa tzv štandardná odchýlka (RMS). Existujú názvy „štandardná odchýlka“ alebo „sigma“ (z názvu gréckeho písmena). Vzorec štandardnej odchýlky je:

Ak chcete získať tento ukazovateľ pre vzorku, použite vzorec:

Rovnako ako v prípade rozptylu existuje trochu iná možnosť výpočtu. Ale ako vzorka rastie, rozdiel mizne.

Smerodajná odchýlka, samozrejme, tiež charakterizuje mieru rozptylu údajov, ale teraz (na rozdiel od rozptylu) ju možno porovnať s pôvodnými údajmi, pretože majú rovnaké jednotky merania (je to zrejmé z výpočtového vzorca). Tento ukazovateľ vo svojej čistej forme však nie je príliš informatívny, pretože obsahuje príliš veľa medzivýpočtov, ktoré sú mätúce (odchýlka, druhá mocnina, súčet, priemer, odmocnina). So štandardnou odchýlkou ​​je však už možné pracovať priamo, pretože vlastnosti tohto ukazovateľa sú dobre preštudované a známe. Napríklad je tu toto pravidlo troch sigma, ktorý uvádza, že údaje majú 997 hodnôt z 1000 v rozmedzí ±3 sigma aritmetického priemeru. Smerodajná odchýlka ako miera neistoty je tiež súčasťou mnohých štatistických výpočtov. S jeho pomocou sa určuje stupeň presnosti rôznych odhadov a predpovedí. Ak je odchýlka veľmi veľká, potom bude veľká aj smerodajná odchýlka, preto bude predpoveď nepresná, čo bude vyjadrené napr. intervaly spoľahlivosti.

Variačný koeficient

Štandardná odchýlka poskytuje absolútny odhad miery disperzie. Preto, aby sme pochopili, aké veľké je rozpätie vzhľadom na samotné hodnoty (t. j. bez ohľadu na ich rozsah), je potrebný relatívny ukazovateľ. Tento indikátor sa nazýva koeficient variácie a vypočíta sa pomocou nasledujúceho vzorca:

Variačný koeficient sa meria v percentách (ak sa vynásobí 100 %). Pomocou tohto indikátora môžete porovnávať rôzne javy bez ohľadu na ich rozsah a jednotky merania. Práve táto skutočnosť robí variačný koeficient tak populárnym.

V štatistike sa uznáva, že ak je hodnota variačného koeficientu menšia ako 33 %, potom sa populácia považuje za homogénnu, ak je viac ako 33 %, potom je heterogénna. Ťažko sa mi tu niečo vyjadruje. Neviem, kto to definoval a prečo, ale považuje sa to za axiómu.

Cítim, že som unesený suchou teóriou a potrebujem priniesť niečo vizuálne a obrazné. Na druhej strane všetky variačné ukazovatele opisujú približne to isté, len sa odlišne počítajú. Preto je ťažké ukázať rôzne príklady Iba hodnoty ukazovateľov sa môžu líšiť, ale nie ich podstata. Poďme teda porovnať, ako sa líšia hodnoty rôznych variačných indikátorov pre rovnaký súbor údajov. Zoberme si príklad výpočtu priemernej lineárnej odchýlky (od ). Tu sú zdrojové údaje:

A plán, ktorý vám to pripomenie.

Pomocou týchto údajov vypočítame rôzne ukazovatele variácie.

Priemerná hodnota je obvyklý aritmetický priemer.

Rozsah variácie je rozdiel medzi maximom a minimom:

Priemerná lineárna odchýlka sa vypočíta podľa vzorca:

štandardná odchýlka:

Zhrňme si výpočet do tabuľky.

Ako je možné vidieť, lineárny priemer a štandardná odchýlka poskytujú podobné hodnoty pre stupeň variácie údajov. Rozptyl je sigma na druhú, takže bude vždy relatívny Vysoké číslo, čo v skutočnosti nič neznamená. Rozsah variácií je rozdiel medzi extrémnymi hodnotami a môže veľa povedať.

Zhrňme si niektoré výsledky.

Variácia ukazovateľa odráža variabilitu procesu alebo javu. Jeho stupeň je možné merať pomocou viacerých ukazovateľov.

1. Rozsah variácie je rozdiel medzi maximom a minimom. Odráža rozsah možné hodnoty.
2. Priemerná lineárna odchýlka – vyjadruje priemer absolútnych (modulo) odchýlok všetkých hodnôt analyzovanej populácie od ich priemernej hodnoty.
3. Disperzia - priemerný štvorec odchýlok.
4. Smerodajná odchýlka je odmocnina disperzie (stredná štvorec odchýlok).
5. Variačný koeficient je najuniverzálnejším ukazovateľom, ktorý odráža mieru rozptylu hodnôt bez ohľadu na ich stupnicu a jednotky merania. Variačný koeficient sa meria v percentách a možno ho použiť na porovnanie variácií rôznych procesov a javov.

V štatistickej analýze teda existuje systém ukazovateľov, ktoré odrážajú homogenitu javov a stabilitu procesov. Variačné ukazovatele často nemajú nezávislý význam a používajú sa na ďalšiu analýzu údajov (výpočet intervalov spoľahlivosti

Páčil sa vám článok? Zdieľaj to