Čo je to smerodajná odchýlka - použitie funkcie smerodajnej odchýlky na výpočet smerodajnej odchýlky v exceli. štandardná odchýlka vzorca v exceli

Inštrukcia

Nech je niekoľko čísel charakterizujúcich - alebo homogénne veličiny. Napríklad výsledky meraní, vážení, štatistických pozorovaní atď. Všetky prezentované množstvá sa musia merať rovnakým meraním. Ak chcete nájsť štandardnú odchýlku, postupujte takto.

Určte aritmetický priemer všetkých čísel: spočítajte všetky čísla a vydeľte súčet celkovým počtom čísel.

Určte rozptyl (rozptyl) čísel: sčítajte druhé mocniny skôr zistených odchýlok a výsledný súčet vydeľte počtom čísel.

Na oddelení je sedem pacientov s teplotou 34, 35, 36, 37, 38, 39 a 40 stupňov Celzia.

Je potrebné určiť priemernú odchýlku od priemeru.
Riešenie:
"na oddelení": (34+35+36+37+38+39+40)/7=37 ºС;

Odchýlky teploty od priemeru (v tomto prípade normálnej hodnoty): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, ukazuje sa: -3, -2, -1, 0, 1, 2, 3 (°С);

Vydeľte súčet čísel získaných skôr ich počtom. Pre presnosť výpočtu je lepšie použiť kalkulačku. Výsledkom delenia je aritmetický priemer sčítancov.

Venujte veľkú pozornosť všetkým fázam výpočtu, pretože chyba aspoň v jednom z výpočtov povedie k nesprávnemu konečnému ukazovateľu. V každej fáze skontrolujte prijaté výpočty. Aritmetický priemer má rovnaký meter ako súčty čísel, to znamená, že ak určíte priemernú návštevnosť, všetky ukazovatele budú „osoba“.

Táto metóda výpočet sa používa iba v matematických a štatistických výpočtoch. Takže napríklad priemer aritmetická hodnota v informatike má iný výpočtový algoritmus. Aritmetický priemer je veľmi podmienený ukazovateľ. Ukazuje pravdepodobnosť udalosti za predpokladu, že má iba jeden faktor alebo indikátor. Pre čo najpodrobnejšiu analýzu je potrebné vziať do úvahy veľa faktorov. Na to sa používa výpočet všeobecnejších veličín.

Aritmetický priemer je jednou z mier centrálnej tendencie, ktorá sa široko používa v matematike a štatistických výpočtoch. Nájdenie aritmetického priemeru niekoľkých hodnôt je veľmi jednoduché, ale každá úloha má svoje vlastné nuansy, ktoré je jednoducho potrebné poznať, aby bolo možné vykonať správne výpočty.

Kvantitatívne výsledky takýchto experimentov.

Ako nájsť aritmetický priemer

Nájdenie priemeru aritmetické číslo pre pole čísel by ste mali začať určením algebraického súčtu týchto hodnôt. Napríklad, ak pole obsahuje čísla 23, 43, 10, 74 a 34, ich algebraický súčet bude 184. Pri zápise sa aritmetický priemer označuje písmenom μ (mu) alebo x (x s čiarkou) . Ďalej by sa mal algebraický súčet vydeliť počtom čísel v poli. V tomto príklade bolo päť čísel, takže aritmetický priemer bude 184/5 a bude 36,8.

Funkcie práce so zápornými číslami

Ak pole obsahuje záporné čísla, potom sa nájde aritmetický priemer podľa podobného algoritmu. Rozdiel je len pri výpočte v programovacom prostredí, alebo ak sú v úlohe ďalšie podmienky. V týchto prípadoch nájdenie aritmetického priemeru čísel s rôzne znamenia scvrkáva sa na tri kroky:

1. Nájdenie spoločného aritmetického priemeru štandardnou metódou;
2. Nájdenie aritmetického priemeru záporných čísel.
3. Výpočet aritmetického priemeru kladných čísel.

Odpovede na každú z akcií sú napísané oddelené čiarkami.

Prirodzené a desatinné zlomky

Ak je uvedené pole čísel desatinné miesta, riešenie nastáva podľa spôsobu výpočtu aritmetického priemeru celých čísel, ale výsledok sa redukuje podľa požiadaviek úlohy na presnosť odpovede.

Pri práci s prírodné frakcie mali by sa zredukovať na spoločného menovateľa, ktorý sa vynásobí počtom čísel v poli. Čitateľ odpovede bude súčtom daných čitateľov pôvodných zlomkových prvkov.

Vykonanie akejkoľvek štatistickej analýzy je nemysliteľné bez výpočtov. V tomto článku sa pozrieme na to, ako vypočítať rozptyl, smerodajnú odchýlku, variačný koeficient a ďalšie štatistické ukazovatele v Exceli.

Maximálna a minimálna hodnota

Priemerná lineárna odchýlka

Priemerná lineárna odchýlka je priemer absolútnych (modulo) odchýlok od v analyzovanom súbore údajov. Matematický vzorec vyzerá takto:

a je priemerná lineárna odchýlka,

X- analyzovaný ukazovateľ,

X- priemerná hodnota ukazovateľa,

V Exceli sa táto funkcia volá SROTCL.

Po zvolení funkcie SIRT určíme rozsah údajov, pre ktorý má výpočet prebiehať. Kliknite na „OK“.

Disperzia

(modul 111)

Možno nie každý vie, čo to je, takže vysvetlím - toto je miera, ktorá charakterizuje šírenie údajov okolo matematického očakávania. Zvyčajne je však k dispozícii iba vzorka, takže sa používa nasledujúci vzorec rozptylu:

s2 – rozptyl vzorky vypočítané z pozorovacích údajov,

X- individuálne hodnoty,

X je aritmetický priemer vzorky,

n je počet hodnôt v analyzovanom súbore údajov.

Relevantné Funkcia Excel — DISP.G. Pri analýze relatívne malých vzoriek (do približne 30 pozorovaní) by ste mali použiť hodnotu , ktorá sa vypočíta podľa nasledujúceho vzorca.

Rozdiel je zrejme len v menovateli. Excel má funkciu na výpočet vzorového nezaujatého rozptylu DISP.B.

Vyberte požadovanú možnosť (všeobecnú alebo selektívnu), zadajte rozsah a kliknite na tlačidlo "OK". Výsledná hodnota môže byť veľmi veľká v dôsledku predbežnej kvadratúry odchýlok. Rozptyl v štatistikách je veľmi dôležitým ukazovateľom, ale zvyčajne sa nepoužíva čistej forme a pre ďalšie výpočty.

Smerodajná odchýlka

Štandardná odchýlka (RMS) je koreňom rozptylu. Tento ukazovateľ sa tiež nazýva štandardná odchýlka a vypočíta sa podľa vzorca:

podľa bežnej populácie

podľa vzorky

Môžete jednoducho vziať koreň odchýlky, ale v Exceli pre smerodajná odchýlka existujú hotové funkcie: STDEV.G a STDEV.V(pre všeobecnú a vzorovú populáciu).

Štandardná a štandardná odchýlka, opakujem, sú synonymá.

Ďalej, ako obvykle, zadajte požadovaný rozsah a kliknite na "OK". Smerodajná odchýlka má rovnaké jednotky merania ako analyzovaný ukazovateľ, preto je porovnateľná s pôvodnými údajmi. Viac o tom nižšie.

Variačný koeficient

Všetky vyššie uvedené ukazovatele sú spojené s rozsahom počiatočných údajov a neumožňujú získať obraznú predstavu o variácii analyzovanej populácie. Ak chcete získať relatívnu mieru rozptylu údajov, použite variačný koeficient, ktorý sa vypočíta delením smerodajná odchýlka na priemer. Vzorec pre variačný koeficient je jednoduchý:

Neexistuje žiadna hotová funkcia na výpočet variačného koeficientu v Exceli, čo nie je veľký problém. Výpočet je možné vykonať jednoduchým delením smerodajná odchýlka na priemernú hodnotu. Ak to chcete urobiť, do riadka vzorcov napíšte:

STDEV.G()/AVERAGE()

Rozsah údajov je uvedený v zátvorkách. V prípade potreby použite štandardnú odchýlku vzorky (STDEV.B).

Variačný koeficient sa zvyčajne vyjadruje v percentách, takže bunka so vzorcom môže byť orámovaná v percentuálnom formáte. Požadované tlačidlo sa nachádza na páse s nástrojmi na karte „Domov“:

Formát môžete zmeniť aj výberom z kontextového menu po výbere požadovanej bunky a kliknutím pravým tlačidlom myši.

Variačný koeficient sa na rozdiel od iných ukazovateľov rozptylu hodnôt používa ako nezávislý a veľmi informatívny ukazovateľ variácie údajov. V štatistike sa všeobecne uznáva, že ak je variačný koeficient menší ako 33 %, potom je súbor údajov homogénny, ak je viac ako 33 %, potom je heterogénny. Tieto informácie môžu byť užitočné na predbežný popis údajov a na identifikáciu príležitostí na ďalšiu analýzu. Okrem toho variačný koeficient, meraný v percentách, umožňuje porovnať stupeň rozptylu rôznych údajov bez ohľadu na ich rozsah a jednotky merania. Užitočný majetok.

Oscilačný faktor

Ďalším meradlom rozptylu dát je dnes koeficient oscilácie. Toto je pomer rozsahu variácie (rozdiel medzi maximálnymi a minimálnymi hodnotami) k priemeru. Dokončené Excel vzorce nie, tak si musíte dať dokopy tri funkcie: MAX, MIN, AVERAGE.

Koeficient oscilácie označuje stupeň variácie vzhľadom na priemer, ktorý možno použiť aj na porovnanie rôznych súborov údajov.

Vo všeobecnosti sa pomocou Excelu veľa štatistických ukazovateľov vypočítava veľmi jednoducho. Ak niečo nie je jasné, vždy môžete použiť vyhľadávacie pole vo funkcii vložiť. No, Google na záchranu.

Funkcia smerodajnej odchýlky je už z kategórie vyššej matematiky súvisiacej so štatistikou. V Exceli existuje niekoľko možností na použitie funkcie štandardnej odchýlky:

Funkcia STDEV.
Funkcia STDEV.
Funkcia STDEV

Tieto funkcie budeme potrebovať v štatistikách predaja na identifikáciu stability predaja (XYZ analýza). Tieto údaje je možné použiť ako pre cenotvorbu, tak aj pre tvorbu (úpravu) matice sortimentu a pre ďalšie užitočné analýzy predaja, o ktorých určite budem hovoriť v ďalších článkoch.

Predslov

Pozrime sa najprv na vzorce v matematickom jazyku a potom (nižšie v texte) podrobne rozoberieme vzorec v Exceli a ako sa výsledný výsledok aplikuje pri analýze štatistík predaja.

Štandardná odchýlka je teda odhadom štandardnej odchýlky náhodná premenná X ohľadom jeho matematického očakávania na základe nezaujatého odhadu jeho rozptylu)))) Nebojte sa nezrozumiteľných slov, buďte trpezliví a všetko pochopíte!

Opis vzorca: Smerodajná odchýlka sa meria v jednotkách najnáhodnejšej premennej a používa sa pri výpočte štandardnej chyby aritmetického priemeru, pri konštrukcii intervaly spoľahlivosti, pri štatistickom testovaní hypotéz, pri meraní lineárneho vzťahu medzi náhodnými premennými. Definovaný ako Odmocnina z rozptylu náhodnej premennej

Teraz je štandardná odchýlka odhadom štandardnej odchýlky náhodnej premennej X vzhľadom na jeho matematické očakávanie založené na nezaujatom odhade jeho rozptylu:

disperzia;

- i-ty prvok vzorky;

Veľkosť vzorky;

Vzorový aritmetický priemer:

Treba poznamenať, že oba odhady sú skreslené. Vo všeobecnom prípade nie je možné vytvoriť nezaujatý odhad. Odhad založený na nezaujatom odhade rozptylu je však konzistentný.

pravidlo troch sigma() - takmer všetky hodnoty normálne rozloženej náhodnej premennej ležia v intervale . Presnejšie, s pravdepodobnosťou približne 0,9973 leží hodnota normálne rozloženej náhodnej premennej v špecifikovanom intervale (za predpokladu, že hodnota je pravdivá a nie je získaná ako výsledok spracovania vzorky). Použijeme zaokrúhlený interval 0,1

Ak je skutočná hodnota neznáma, mali by ste použiť nie, ale s. Pravidlo troch sigma sa teda transformuje na pravidlo troch s. Práve toto pravidlo nám pomôže určiť stabilitu predaja, ale o tom neskôr...

Teraz funkcia štandardnej odchýlky v Exceli

Dúfam, že som ťa nezahltil matematikou? Možno niekto bude potrebovať tieto informácie na abstraktné alebo iné účely. Teraz sa pozrime na to, ako tieto vzorce fungujú v Exceli...

Na zistenie stability predaja sa nemusíme vŕtať vo všetkých možnostiach funkcií smerodajnej odchýlky. Použijeme iba jeden:

Funkcia STDEV

STDEV(číslo 1;číslo2;... )

Číslo1, Číslo2,..- od 1 do 30 číselných argumentov zodpovedajúcich bežnej populácii.

Teraz sa pozrime na príklad:

Vytvorme knihu a provizórnu tabuľku. Tento príklad si môžete stiahnuť v Exceli na konci článku.

Pokračovanie nabudúce!!!

Ahoj zas. No!? Máte voľnú minútu. Pokračujme?

A tak stabilita predaja s pomocou Funkcie STDEV

Pre prehľadnosť si zoberme niekoľko improvizovaných tovarov:

V analytike, či už ide o prognózu, výskum alebo niečo iné, čo súvisí so štatistikou, je vždy potrebné vziať tri obdobia. Môže to byť týždeň, mesiac, štvrťrok alebo rok. Je možné a dokonca najlepšie brať čo najviac menštruácií, ale nie menej ako tri.

Konkrétne som ukázal prehnané predaje, kde voľným okom vidíte, čo sa dôsledne predáva a čo nie. Uľahčí to pochopenie fungovania vzorcov.

A tak máme tržby, teraz musíme vypočítať priemerné hodnoty predaja podľa obdobia.

Vzorec priemernej hodnoty AVERAGE (údaje za obdobie) v mojom prípade vzorec vyzerá takto = AVERAGE(C6:E6)

Napíname vzorec pre všetky produkty. Môžete to urobiť tak, že podržíte pravý roh vybranej bunky a pretiahnete ju na koniec zoznamu. Alebo umiestnite kurzor na stĺpec s produktom a stlačte nasledujúce kombinácie klávesov:

Ctrl + Down presunie kurzor na koniec zoznamu.

Ctrl + Doprava, presun kurzora na pravá strana tabuľky. Ešte raz doprava a dostaneme sa do stĺpca so vzorcom.

Teraz upneme

Ctrl + Shift a stlačte nahor. Vyberieme teda oblasť natiahnutia vzorca.

A kombinácia Klávesy Ctrl+ D roztiahne funkciu tam, kde ju potrebujeme.

Pamätajte na tieto kombinácie, skutočne zvyšujú rýchlosť v Exceli, najmä keď pracujete s veľkými poľami.

Ďalší krok, samotná funkcia smerodajnej odchýlky, ako som už povedal, použijeme len jednu STDEV

Predpíšeme funkciu a do hodnôt funkcií vložíme predajné hodnoty každého obdobia. Ak máte v tabuľke tržby za sebou, môžete použiť rozsah, ako v mojom vzorci =STDEV(C6:E6) alebo uviesť požadované bunky s bodkočiarkou =STDEV(C6;D6;E6)

Tu sú všetky výpočty a pripravené. Ako však viete, čo sa konzistentne predáva a čo nie? Položme konvenciu XYZ, kde

X je stabilný

Y - s malými odchýlkami

Z - nie je stabilný

Na tento účel používame intervaly chýb. ak dôjde k výkyvom do 10 %, budeme predpokladať, že tržby sú stabilné.

Ak je medzi 10 a 25 percentami, bude to Y.

A ak hodnoty variácie presiahnu 25% - nejde o stabilitu.

Pre správne nastavenie písmen pre každý produkt použijeme vzorec IF podrobnejšie o. V mojej tabuľke bude táto funkcia vyzerať takto:

IF(H6<0,1;"X";ЕСЛИ(H6<0,25;"Y";"Z"))

Podľa toho roztiahneme všetky vzorce pre všetky mená.

Pokúsim sa okamžite odpovedať na otázku Prečo intervaly 10% a 25%?

V skutočnosti môžu byť intervaly odlišné, všetko závisí od konkrétnej úlohy. Konkrétne som vám ukázal prehnané predajné hodnoty, kde je rozdiel viditeľný "okom". Je zrejmé, že produkt 1 sa nepredáva konzistentne, ale dynamika ukazuje nárast predaja. Nechajte túto položku na pokoji...

Ale produkt 2, na tvári už dochádza k destabilizácii. A naše výpočty ukazujú Z, čo nám hovorí o nestabilite predaja. Položka 3 a položka 5 vykazujú stabilný výkon, upozorňujeme, že odchýlka je v rámci 10 %.

Tie. Položka 5 so skóre 45, 46 a 45 ukazuje 1 % variáciu, čo je stabilný číselný rad.

Produkt 2 so skóre 10, 50 a 5 však vykazuje 93 % variáciu, čo NIE JE stabilný číselný rad.

Po všetkých výpočtoch si môžete dať filter a odfiltrovať stabilitu, takže ak sa vaša tabuľka skladá z niekoľkých tisíc položiek, môžete ľahko vybrať, ktoré nie sú stabilné v predaji, alebo naopak, ktoré sú stabilné.

"Y" mi v tabuľke nefungovalo, myslím, že pre prehľadnosť číselného radu ho treba doplniť. Vyžrebujem tovar 6...

Vidíte, číselný rad 40, 50 a 30 ukazuje 20% variáciu. Zdá sa, že nejde o žiadnu veľkú chybu, ale šírenie je stále značné ...

A tak, aby som to zhrnul:

10,50,5 - Z nie je stabilný. Variácia viac ako 25 %

40,50,30 - Y môžete venovať pozornosť tomuto produktu a zlepšiť jeho predaj. Odchýlka menšia ako 25 %, ale väčšia ako 10 %

45,46,45 - X je stabilita, s týmto produktom zatiaľ netreba nič robiť. Variácia menšia ako 10 %

To je všetko! Dúfam, že som všetko jasne vysvetlil, ak nie, opýtajte sa, čo nie je jasné. A budem vám vďačný za každý komentár, či už to bude pochvala alebo kritika. Takže budem vedieť, že čítate mňa a vás, čo je veľmi DÔLEŽITÉ, zaujímavé. A podľa toho sa objavia nové lekcie.

Smerodajná odchýlka je jedným z tých štatistických pojmov v korporátnom svete, ktorý zviditeľňuje ľudí, ktorým sa to podarí úspešne pokaziť v konverzácii alebo prezentácii, a zanecháva nejasné nedorozumenie pre tých, ktorí nevedia, čo to je, ale hanbia sa za to. opýtať sa. V skutočnosti väčšina manažérov nerozumie konceptu štandardnej odchýlky a ak ste jedným z nich, je načase, aby ste prestali žiť v klamstve. V dnešnom článku vám ukážem, ako vám táto podceňovaná štatistika môže pomôcť lepšie pochopiť dáta, s ktorými pracujete.

Čo meria smerodajná odchýlka?

Predstavte si, že ste majiteľom dvoch predajní. A aby sa predišlo stratám, je dôležité, aby existovala jasná kontrola stavu zásob. V snahe zistiť, kto je najlepší správca akcií, sa rozhodnete analyzovať akcie za posledných šesť týždňov. Priemerné týždenné náklady na zásoby oboch predajní sú približne rovnaké a predstavujú približne 32 bežných jednotiek. Priemerná hodnota akcií na prvý pohľad ukazuje, že obaja manažéri pracujú rovnako.

Ak sa ale bližšie pozriete na činnosť druhého obchodu, môžete vidieť, že hoci je priemerná hodnota správna, variabilita akcií je veľmi vysoká (od 10 do 58 USD). Dá sa teda usúdiť, že priemer nie vždy správne odhadne údaje. Tu prichádza na rad štandardná odchýlka.

Smerodajná odchýlka ukazuje, ako sú hodnoty rozdelené v porovnaní s priemerom v našom . Inými slovami, môžete pochopiť, aký veľký je odtok z týždňa na týždeň.

V našom príklade sme použili funkciu Excel STDEV na výpočet štandardnej odchýlky spolu s priemerom.

V prípade prvého manažéra bola smerodajná odchýlka 2. To nám hovorí, že každá hodnota vo vzorke sa odchyľuje v priemere o 2 od priemeru. Je to dobré? Pozrime sa na otázku z iného uhla – smerodajná odchýlka 0 nám hovorí, že každá hodnota vo vzorke sa rovná jej strednej hodnote (v našom prípade 32,2). Napríklad štandardná odchýlka 2 sa príliš nelíši od 0, čo naznačuje, že väčšina hodnôt je blízko priemeru. Čím je štandardná odchýlka bližšie k 0, tým je priemer spoľahlivejší. Okrem toho štandardná odchýlka blízka 0 naznačuje malú variabilitu v údajoch. To znamená, že hodnota poklesu so štandardnou odchýlkou 2 označuje neuveriteľnú konzistenciu prvého manažéra.

V prípade druhého obchodu bola smerodajná odchýlka 18,9. To znamená, že náklady na odtok sa z týždňa na týždeň odchyľujú od priemernej hodnoty v priemere o 18,9. Bláznivá nátierka! Čím ďalej je štandardná odchýlka od 0, tým je priemer menej presný. V našom prípade údaj 18,9 naznačuje, že priemernej hodnote (32,8 USD za týždeň) sa jednoducho nedá veriť. Tiež nám hovorí, že týždenný odtok je veľmi variabilný.

Toto je v skratke koncept štandardnej odchýlky. Hoci neposkytuje pohľad na iné dôležité štatistické merania (režim, medián...), v skutočnosti štandardná odchýlka zohráva kľúčovú úlohu vo väčšine štatistických výpočtov. Pochopenie princípov štandardnej odchýlky objasní podstatu mnohých procesov vo vašej činnosti.

Ako vypočítať smerodajnú odchýlku?

Takže teraz vieme, čo hovorí údaj o štandardnej odchýlke. Pozrime sa, ako sa to počíta.

Zoberme si množinu údajov od 10 do 70 v krokoch po 10. Ako vidíte, už som pre ne vypočítal smerodajnú odchýlku pomocou funkcie STDEV v bunke H2 (oranžová).

Nižšie sú uvedené kroky, ktoré Excel podnikne, aby dosiahol 21.6.

Upozorňujeme, že všetky výpočty sú pre lepšie pochopenie vizualizované. V Exceli je výpočet v skutočnosti okamžitý a všetky kroky zostávajú v zákulisí.

Excel najprv nájde priemer vzorky. V našom prípade sa ukázal priemer 40, ktorý sa v ďalšom kroku odpočíta od každej hodnoty vzorky. Každý výsledný rozdiel sa umocní na druhú a spočíta sa. Dostali sme sumu rovnajúcu sa 2800, ktorú treba vydeliť počtom prvkov vzorky mínus 1. Keďže máme 7 prvkov, ukáže sa, že musíme 2800 vydeliť 6. Z výsledku nájdeme druhú odmocninu, toto číslo bude smerodajná odchýlka.

Pre tých, ktorým nie je úplne jasný princíp výpočtu smerodajnej odchýlky pomocou vizualizácie, uvádzam matematický výklad zistenia tejto hodnoty.

Funkcie výpočtu smerodajnej odchýlky v Exceli

V Exceli existuje niekoľko druhov vzorcov štandardnej odchýlky. Stačí zadať =STDEV a uvidíte sami.

Stojí za zmienku, že funkcie STDEV.V a STDEV.G (prvá a druhá funkcia v zozname) duplikujú funkcie STDEV a STDEV (piata a šiesta funkcia v zozname), ktoré boli zachované kvôli kompatibilite s predchádzajúcimi funkciami. verzie Excelu.

Vo všeobecnosti, rozdiel v koncovkách Funkcie In a G označujú princíp výpočtu smerodajnej odchýlky vzorky alebo populácie. Rozdiel medzi týmito dvoma poliami som už vysvetlil v predchádzajúcom.

Funkciou STDEV a STDEVPA (tretia a štvrtá funkcia v zozname) je, že pri výpočte štandardnej odchýlky poľa sa berú do úvahy logické a textové hodnoty. Text a true booleans sú 1, a false booleans sú 0. Je pre mňa ťažké predstaviť si situáciu, kedy by som potreboval tieto dve funkcie, takže si myslím, že ich možno ignorovať.

Najdokonalejšou charakteristikou variácie je štandardná odchýlka, ktorá sa nazýva štandard (alebo štandardná odchýlka). Smerodajná odchýlka() sa rovná druhej odmocnine stredného štvorca odchýlok hodnôt jednotlivých znakov od aritmetického priemeru:

Štandardná odchýlka je jednoduchá:

Vážená štandardná odchýlka sa použije na zoskupené údaje:

Medzi strednou kvadratickou a strednou lineárnou odchýlkou v podmienkach normálneho rozdelenia platí nasledujúci vzťah: ~ 1,25.

Štandardná odchýlka, ktorá je hlavnou absolútnou mierou variácie, sa používa pri určovaní hodnôt ordinát normálnej distribučnej krivky, vo výpočtoch súvisiacich s organizáciou pozorovania vzorky a stanovením presnosti charakteristík vzorky, ako aj pri posúdenie hraníc variácie znaku v homogénnej populácii.

Disperzia, jej typy, smerodajná odchýlka.

Rozptyl náhodnej premennej- miera šírenia danej náhodnej veličiny, teda jej odchýlky od matematického očakávania. V štatistike sa často používa označenie alebo. Druhá odmocnina rozptylu sa nazýva štandardná odchýlka, štandardná odchýlka alebo štandardné rozpätie.

Celkový rozptyl (σ2) meria variáciu vlastnosti v celej populácii pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobili. Zároveň je vďaka metóde zoskupovania možné izolovať a merať odchýlky v dôsledku funkcie zoskupovania a odchýlky, ktoré sa vyskytujú pod vplyvom nezohľadnených faktorov.

Medziskupinový rozptyl (σ 2 m.g) charakterizuje systematickú variáciu, t. j. rozdiely vo veľkosti študovaného znaku vznikajúce pod vplyvom znaku – faktora, ktorý je základom zoskupenia.

smerodajná odchýlka(synonymá: smerodajná odchýlka, smerodajná odchýlka, smerodajná odchýlka; podobné výrazy: smerodajná odchýlka, štandardné rozpätie) - v teórii pravdepodobnosti a štatistike najbežnejší ukazovateľ rozptylu hodnôt náhodnej premennej vo vzťahu k jej matematickému očakávaniu. Pri obmedzených poliach vzoriek hodnôt sa namiesto matematického očakávania používa aritmetický priemer súboru vzoriek.

Smerodajná odchýlka sa meria v jednotkách samotnej náhodnej premennej a používa sa pri výpočte štandardnej chyby aritmetického priemeru, pri konštrukcii intervalov spoľahlivosti, pri štatistickom testovaní hypotéz a pri meraní lineárneho vzťahu medzi náhodnými premennými. Je definovaná ako druhá odmocnina rozptylu náhodnej premennej.

Štandardná odchýlka:

Smerodajná odchýlka(odhad štandardnej odchýlky náhodnej premennej X v porovnaní s jeho matematickým očakávaním na základe nezaujatého odhadu jeho rozptylu):

kde je disperzia; — i-ty prvok vzorky; - veľkosť vzorky; - aritmetický priemer vzorky:

Treba poznamenať, že oba odhady sú skreslené. Vo všeobecnom prípade nie je možné vytvoriť nezaujatý odhad. Odhad založený na nezaujatom odhade rozptylu je však konzistentný.

Podstata, rozsah a postup určenia módu a mediánu.

Okrem mocninových priemerov v štatistike sa pre relatívnu charakteristiku veľkosti premenlivého znaku a vnútornej štruktúry distribučných radov používajú štrukturálne priemery, ktoré sú reprezentované najmä režim a medián.

Móda- Toto je najbežnejší variant série. Móda sa používa napríklad pri určovaní veľkosti oblečenia, obuvi, o ktoré je medzi kupujúcimi najväčší dopyt. Režim pre diskrétnu sériu je variant s najvyššou frekvenciou. Pri výpočte režimu pre sériu variácií intervalu musíte najprv určiť modálny interval (podľa maximálnej frekvencie) a potom hodnotu modálnej hodnoty atribútu podľa vzorca:

- - módna hodnota

- - dolná hranica modálneho intervalu

- - hodnota intervalu

- - frekvencia modálnych intervalov

- - frekvencia intervalu pred modálom

- - frekvencia intervalu nasledujúceho po spôsobe

Medián - toto je hodnota funkcie, ktorá je základom hodnotenej série a rozdeľuje túto sériu na dve časti s rovnakým počtom.

Ak chcete určiť medián v diskrétnej sérii za prítomnosti frekvencií, najskôr vypočítajte polovičný súčet frekvencií a potom určte, aká hodnota variantu na ňu pripadá. (Ak zoradený riadok obsahuje nepárny počet prvkov, potom sa stredný počet vypočíta podľa vzorca:

M e \u003d (n (počet prvkov v súhrne) + 1) / 2,

v prípade párneho počtu prvkov sa medián bude rovnať priemeru dvoch prvkov v strede riadku).

Pri výpočte mediány pre sériu intervalových variácií najprv určte medián intervalu, v ktorom sa medián nachádza, a potom hodnotu mediánu podľa vzorca:

- je požadovaný medián

- je spodná hranica intervalu, ktorý obsahuje medián

- - hodnota intervalu

- - súčet frekvencií alebo počtu členov série

Súčet akumulovaných frekvencií intervalov predchádzajúcich mediánu

- je frekvencia stredného intervalu

Príklad. Nájdite režim a medián.

Riešenie:
V tomto príklade je modálny interval vo vekovej skupine 25-30 rokov, pretože tento interval predstavuje najvyššiu frekvenciu (1054).

Vypočítajme hodnotu režimu:

To znamená, že modálny vek študentov je 27 rokov.

Vypočítajte medián. Medián intervalu je vo vekovej skupine 25-30 rokov, keďže v rámci tohto intervalu existuje variant, ktorý rozdeľuje populáciu na dve rovnaké časti (Σf i /2 = 3462/2 = 1731). Ďalej do vzorca dosadíme potrebné číselné údaje a získame hodnotu mediánu:

To znamená, že polovica študentov má menej ako 27,4 rokov a druhá polovica má viac ako 27,4 rokov.

Okrem režimu a mediánu je možné použiť ukazovatele, ako sú kvartily, ktoré rozdeľujú zoradené série na 4 rovnaké časti, decilov- 10 dielov a percentilov - na 100 dielov.

Pojem selektívneho pozorovania a jeho rozsah.

Selektívne pozorovanie platí pri aplikácii nepretržitého pozorovania fyzicky nemožné z dôvodu veľkého množstva dát resp ekonomicky nepraktické. Fyzická nemožnosť nastáva napríklad pri štúdiu tokov cestujúcich, trhových cien, rodinných rozpočtov. Ekonomická neúčelnosť nastáva pri posudzovaní kvality tovaru spojeného s jeho zničením, napríklad pri ochutnávaní, skúšaní tehál na pevnosť atď.

Štatistické jednotky vybrané na pozorovanie tvoria vzorku alebo vzorku a celé ich pole - všeobecnú populáciu (GS). V tomto prípade počet jednotiek vo vzorke označuje n a v celom HS - N. Postoj n/N nazývaná relatívna veľkosť alebo podiel vzorky.

Kvalita výsledkov odberu vzoriek závisí od reprezentatívnosti vzorky, t. j. jej reprezentatívnosti v HS. Na zabezpečenie reprezentatívnosti vzorky je potrebné pozorovať princíp náhodného výberu jednotiek, ktorý predpokladá, že zaradenie jednotky HS do vzorky nemôže ovplyvniť žiadny iný faktor ako náhoda.

Existuje 4 spôsoby náhodného výberu vzorkovať:

Vlastne náhodne výber alebo „metóda loto“, kedy sa štatistickým hodnotám priraďujú poradové čísla, zadávajú sa na určité predmety (napríklad sudy), ktoré sa potom zmiešajú v nejakej nádobe (napríklad vo vreci) a náhodne sa vyberú. V praxi sa táto metóda vykonáva pomocou generátora náhodných čísel alebo matematických tabuliek náhodných čísel.
Mechanický výber, podľa ktorého každý ( N/n)-tá hodnota bežnej populácie. Ak napríklad obsahuje 100 000 hodnôt a chcete vybrať 1 000, do vzorky bude spadať každá 100 000 / 1 000 = 100. hodnota. Navyše, ak nie sú zoradené, potom sa prvý náhodne vyberie z prvej stovky a čísla ostatných budú o sto viac. Napríklad, ak bola jednotka číslo 19 prvá, potom by malo nasledovať číslo 119, potom číslo 219, potom číslo 319 atď. Ak sú jednotky populácie zoradené, potom sa najprv vyberie #50, potom #150, potom #250 atď.
Vykoná sa výber hodnôt z heterogénneho dátového poľa stratifikované(stratifikovaná) metóda, kedy je všeobecná populácia predtým rozdelená do homogénnych skupín, na ktoré sa uplatňuje náhodný alebo mechanický výber.
Špeciálna metóda odberu vzoriek je sériový selekcia, pri ktorej sa náhodne alebo mechanicky nevyberajú jednotlivé veličiny, ale ich série (sekvencie od nejakého čísla po nejaké za sebou), v rámci ktorej sa uskutočňuje nepretržité pozorovanie.

Kvalita pozorovaní vzoriek závisí aj od typ odberu vzoriek: opakované alebo neopakovateľné.

O opätovný výberštatistické hodnoty alebo ich série, ktoré spadli do vzorky, sa po použití vrátia bežnej populácii a majú šancu dostať sa do novej vzorky. Všetky hodnoty bežnej populácie majú zároveň rovnakú pravdepodobnosť, že budú zahrnuté do vzorky.

Neopakujúci sa výber znamená, že štatistické hodnoty alebo ich série zahrnuté vo vzorke sa po použití nevracajú bežnej populácii, a preto sa zvyšuje pravdepodobnosť, že sa dostanú do ďalšej vzorky pre zostávajúce hodnoty.

Neopakovateľné vzorkovanie poskytuje presnejšie výsledky, preto sa používa častejšie. Sú však situácie, keď sa to nedá použiť (štúdia tokov cestujúcich, dopyt spotrebiteľov atď.) a potom sa vykoná opätovný výber.

Hraničná chyba pozorovanej vzorky, priemerná chyba vzorky, poradie, v ktorom sú vypočítané.

Pozrime sa podrobne na vyššie uvedené metódy tvorby vzorky populácie a na chyby, ktoré v tomto prípade vznikajú. reprezentatívnosť .
Vlastne-náhodne vzorka je založená na náhodnom výbere jednotiek zo všeobecnej populácie bez akýchkoľvek prvkov konzistentnosti. Technicky sa správny náhodný výber vykonáva žrebovaním (napríklad lotérie) alebo tabuľkou náhodných čísel.

V skutočnosti sa náhodný výber "vo svojej čistej forme" v praxi selektívneho pozorovania používa zriedka, ale je prvým medzi ostatnými typmi výberu, implementuje základné princípy selektívneho pozorovania. Uvažujme o niektorých otázkach teórie metódy výberu vzoriek a chybového vzorca pre jednoduchú náhodnú vzorku.

Chyba pri odbere vzoriek- ide o rozdiel medzi hodnotou parametra v bežnej populácii a jeho hodnotou vypočítanou z výsledkov výberového pozorovania. Pre priemernú kvantitatívnu charakteristiku je výberová chyba určená

Ukazovateľ sa nazýva hraničná výberová chyba.
Priemer vzorky je náhodná premenná, ktorá môže nadobúdať rôzne hodnoty v závislosti od toho, ktoré jednotky sú vo vzorke. Preto sú výberové chyby tiež náhodné premenné a môžu nadobudnúť rôzne hodnoty. Preto určite priemer možných chýb - stredná vzorkovacia chyba, ktorá závisí od:

Veľkosť vzorky: čím väčšie číslo, tým menšia priemerná chyba;

Stupeň zmeny študovaného znaku: čím menšia je variácia znaku a následne aj rozptyl, tým menšia je priemerná výberová chyba.

O náhodný opätovný výber vypočíta sa priemerná chyba:
.
V praxi nie je všeobecný rozptyl presne známy, ale v teória pravdepodobnosti dokázal to
.
Keďže hodnota pre dostatočne veľké n je blízka 1, môžeme predpokladať, že . Potom sa môže vypočítať stredná vzorkovacia chyba:
.
Ale v prípadoch malej vzorky (pre n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

O náhodné vzorkovanie uvedené vzorce sú opravené o hodnotu . Potom je priemerná chyba bez vzorkovania:
a .
Pretože je vždy menšia ako , potom je faktor () vždy menší ako 1. To znamená, že priemerná chyba pri neopakovanom výbere je vždy menšia ako pri opakovanom výbere.
Mechanický odber vzoriek sa používa vtedy, keď je všeobecná populácia nejakým spôsobom zoradená (napríklad zoznamy voličov v abecednom poradí, telefónne čísla, čísla domov, bytov). Výber jednotiek sa vykonáva v určitom intervale, ktorý sa rovná prevrátenej hodnote percenta vzorky. Takže pri 2 % vzorke sa vyberie každých 50 jednotiek = 1 / 0,02, pri 5 % sa vyberie každá 1 / 0,05 = 20 jednotiek všeobecnej populácie.

Počiatok sa vyberá rôznymi spôsobmi: náhodne, od stredu intervalu, so zmenou pôvodu. Hlavnou vecou je vyhnúť sa systematickým chybám. Napríklad pri 5 % vzorke, ak sa ako prvá jednotka vyberie 13., potom ďalších 33, 53, 73 atď.

Z hľadiska presnosti je mechanický výber blízky správnemu náhodnému vzorkovaniu. Preto sa na určenie priemernej chyby mechanického odberu vzoriek používajú vzorce správneho náhodného výberu.

O typický výber skúmaná populácia je predbežne rozdelená do homogénnych, jednotypových skupín. Napríklad pri prieskume podnikov to môžu byť odvetvia, pododvetvia, pričom sa študuje populácia – oblasti, sociálne alebo vekové skupiny. Potom sa uskutoční nezávislý výber z každej skupiny mechanickým alebo správnym náhodným spôsobom.

Typický odber vzoriek poskytuje presnejšie výsledky ako iné metódy. Typifikácia všeobecnej populácie zabezpečuje zastúpenie každej typologickej skupiny vo vzorke, čo umožňuje vylúčiť vplyv medziskupinového rozptylu na priemernú výberovú chybu. Preto pri hľadaní chyby typickej vzorky podľa pravidla sčítania rozptylov () je potrebné brať do úvahy len priemer skupinových rozptylov. Potom je stredná vzorkovacia chyba:
v opätovnom výbere
,
s neopakujúcim sa výberom
,
kde je priemer vnútroskupinových rozptylov vo vzorke.

Sériový (alebo vnorený) výber používa sa, keď je populácia rozdelená do sérií alebo skupín pred začiatkom výberového zisťovania. Tieto série môžu byť balíčky hotových výrobkov, študentské skupiny, tímy. Série na vyšetrenie sa vyberajú mechanicky alebo náhodne av rámci série sa vykonáva kompletný prieskum jednotiek. Preto priemerná výberová chyba závisí iba od medziskupinového (medzisériového) rozptylu, ktorý sa vypočíta podľa vzorca:

kde r je počet vybraných sérií;
- priemer i-tej série.

Priemerná sériová vzorkovacia chyba sa vypočíta:

pri opätovnom výbere:
,
s jednorazovým výberom:
,
kde R je celkový počet sérií.

Kombinované výber je kombináciou uvažovaných metód výberu.

Priemerná výberová chyba pre ktorúkoľvek metódu výberu závisí hlavne od absolútnej veľkosti vzorky a v menšej miere od percenta vzorky. Predpokladajme, že 225 pozorovaní sa uskutoční v prvom prípade z populácie 4 500 jednotiek a v druhom prípade z 225 000 jednotiek. Odchýlky v oboch prípadoch sa rovnajú 25. Potom, v prvom prípade, pri 5% výbere, bude výberová chyba:

V druhom prípade sa pri výbere 0,1 % bude rovnať:

Touto cestou, s poklesom percenta vzorky o 50-krát sa výberová chyba mierne zvýšila, pretože veľkosť vzorky sa nezmenila.
Predpokladajme, že veľkosť vzorky sa zväčší na 625 pozorovaní. V tomto prípade je vzorkovacia chyba:

Nárast vzorky o 2,8-násobok pri rovnakej veľkosti všeobecnej populácie znižuje veľkosť výberovej chyby viac ako 1,6-krát.

Metódy a prostriedky tvorby výberovej populácie.

V štatistike sa používajú rôzne metódy tvorby súborov vzoriek, čo je určené cieľmi štúdie a závisí od špecifík predmetu štúdia.

Hlavnou podmienkou vykonania výberového zisťovania je zamedzenie vzniku systematických chýb vyplývajúcich z porušenia princípu rovnosti príležitostí vstupu každej jednotky bežnej populácie do výberového súboru. Predchádzanie systematickým chybám je dosiahnuté použitím vedecky podložených metód na vytvorenie vzorky populácie.

Existujú nasledujúce spôsoby výberu jednotiek z bežnej populácie:

1) individuálny výber - vo vzorke sú vybrané jednotlivé jednotky;

2) skupinový výber – do vzorky spadajú kvalitatívne homogénne skupiny alebo série skúmaných jednotiek;

3) kombinovaný výber je kombináciou individuálneho a skupinového výberu.
Spôsoby výberu sú určené pravidlami pre tvorbu výberovej populácie.

Vzorka môže byť:

správna náhoda spočíva v tom, že vzorka vzniká ako výsledok náhodného (neúmyselného) výberu jednotlivých jednotiek z bežnej populácie. V tomto prípade sa počet jednotiek vybraných v súbore vzoriek zvyčajne určuje na základe akceptovaného podielu vzorky. Podiel vzorky je pomer počtu jednotiek vo výberovej populácii n k počtu jednotiek vo všeobecnej populácii N, t.j.

mechanický spočíva v tom, že výber jednotiek vo vzorke sa robí zo všeobecnej populácie, rozdelenej do rovnakých intervalov (skupín). V tomto prípade sa veľkosť intervalu vo všeobecnej populácii rovná prevrátenej hodnote podielu vzorky. Takže pri 2% vzorke sa vyberie každá 50. jednotka (1:0,02), pri 5% vzorke každá 20. jednotka (1:0,05) atď. Všeobecná populácia je teda v súlade s akceptovaným podielom selekcie akoby mechanicky rozdelená do rovnakých skupín. Z každej skupiny vo vzorke je vybratá len jedna jednotka.
typické - v ktorých sa všeobecná populácia najskôr rozdelí na homogénne typické skupiny. Potom sa z každej typickej skupiny uskutoční individuálny výber jednotiek do vzorky náhodnou alebo mechanickou vzorkou. Dôležitou vlastnosťou typickej vzorky je, že poskytuje presnejšie výsledky v porovnaní s inými metódami výberu jednotiek vo vzorke;
sériový- v ktorých je všeobecná populácia rozdelená do rovnako veľkých skupín - rad. Séria sa vyberá vo vzorovom súbore. V rámci série sa vykonáva nepretržité pozorovanie jednotiek, ktoré spadajú do série;
kombinované- odber vzoriek môže byť dvojstupňový. V tomto prípade je všeobecná populácia najskôr rozdelená do skupín. Potom sa vyberú skupiny a v rámci nich sa vyberú jednotlivé jednotky.

V štatistike sa rozlišujú tieto metódy výberu jednotiek vo vzorke::

jednostupňový vzorka - každá vybraná jednotka je okamžite podrobená štúdiu na danom základe (v skutočnosti náhodné a sériové vzorky);
viacstupňový odber vzoriek - výber sa uskutočňuje zo všeobecnej populácie jednotlivých skupín a zo skupín sa vyberajú jednotlivé jednotky (typická vzorka s mechanickou metódou výberu jednotiek v populácii vzorky).

Okrem toho existujú:

opätovný výber- podľa schémy vrátenej lopty. V tomto prípade sa každá jednotka alebo séria, ktorá spadla do vzorky, vráti do všeobecnej populácie, a preto má šancu byť opäť zahrnutá do vzorky;
neopakovateľný výber- podľa schémy nevrátenej lopty. Má presnejšie výsledky pre rovnakú veľkosť vzorky.

Stanovenie požadovanej veľkosti vzorky (pomocou Študentovej tabuľky).

Jedným z vedeckých princípov v teórii vzorkovania je zabezpečiť výber dostatočného počtu jednotiek. Teoreticky je potreba dodržania tohto princípu prezentovaná v dôkazoch limitných teorémov teórie pravdepodobnosti, ktoré umožňujú stanoviť, koľko jednotiek by sa malo vybrať zo všeobecnej populácie, aby to bolo dostatočné a zabezpečilo reprezentatívnosť vzorky.

Zníženie štandardnej chyby vzorky a následne zvýšenie presnosti odhadu je vždy spojené so zvýšením veľkosti vzorky, preto je potrebné už vo fáze organizovania pozorovania vzorky rozhodnúť aká by mala byť veľkosť vzorky, aby sa zabezpečila požadovaná presnosť výsledkov pozorovania. Výpočet požadovanej veľkosti vzorky sa zostavuje pomocou vzorcov odvodených zo vzorcov pre hraničné výberové chyby (A), ktoré zodpovedajú jednému alebo druhému typu a metóde výberu. Takže pre náhodnú opakovanú veľkosť vzorky (n) máme:

Podstatou tohto vzorca je, že pri náhodnom opätovnom výbere požadovaného počtu je veľkosť vzorky priamo úmerná druhej mocnine koeficientu spoľahlivosti (t2) a rozptyl variačného znaku (~2) a je nepriamo úmerný druhej mocnine medznej výberovej chyby (~2). Najmä zdvojnásobením medznej chyby možno štvornásobne znížiť požadovanú veľkosť vzorky. Z troch parametrov dva (t a?) nastavuje výskumník.

Zároveň výskumník Pre účely výberového zisťovania by sa mala rozhodnúť otázka: v akej kvantitatívnej kombinácii je lepšie tieto parametre zahrnúť, aby bol poskytnutý optimálny variant? V jednom prípade môže byť spokojnejší so spoľahlivosťou získaných výsledkov (t) ako s mierou presnosti (?), v druhom - naopak. Problém týkajúci sa hodnoty hraničnej výberovej chyby je ťažšie vyriešiť, keďže výskumník tento ukazovateľ v štádiu návrhu výberového pozorovania nemá, preto je v praxi zvykom nastaviť hraničnú výberovú chybu, napr. pravidlo, do 10 % očakávanej priemernej úrovne vlastnosti. K stanoveniu predpokladanej priemernej úrovne možno pristupovať rôznymi spôsobmi: použitím údajov z podobných predchádzajúcich prieskumov alebo použitím údajov z rámca vzorkovania a odberom malej pilotnej vzorky.

Najťažšie na stanovenie pri navrhovaní pozorovania vzorky je tretí parameter vo vzorci (5.2) – rozptyl populácie vzorky. V tomto prípade je potrebné využiť všetky informácie dostupné vyšetrovateľovi, získané z predchádzajúcich podobných a pilotných prieskumov.

Otázka definície Požadovaná veľkosť vzorky sa skomplikuje, ak výberové zisťovanie zahŕňa štúdium viacerých znakov výberových jednotiek. V tomto prípade sú priemerné úrovne každej z charakteristík a ich variácie spravidla rôzne, a preto je možné rozhodnúť, ktorému rozptylu ktorej z charakteristík dať prednosť, len s prihliadnutím na účel a ciele prieskum.

Pri navrhovaní výberového pozorovania sa predpokladá vopred stanovená hodnota prípustnej výberovej chyby v súlade s cieľmi konkrétnej štúdie a pravdepodobnosťou záverov na základe výsledkov pozorovania.

Vo všeobecnosti vám vzorec pre hraničnú chybu priemernej hodnoty vzorky umožňuje určiť:

Veľkosť možných odchýlok ukazovateľov všeobecnej populácie od ukazovateľov výberovej populácie;

Požadovaná veľkosť vzorky poskytujúca požadovanú presnosť, v ktorej hranice možnej chyby nepresiahnu určitú špecifikovanú hodnotu;

Pravdepodobnosť, že chyba vo vzorke bude mať daný limit.

Študentská distribúcia v teórii pravdepodobnosti je to jednoparametrová rodina absolútne spojitých rozdelení.

Rad dynamiky (interval, moment), uzavretie radu dynamiky.

Séria dynamiky- sú to hodnoty štatistických ukazovateľov, ktoré sú prezentované v určitej chronologickej postupnosti.

Každý časový rad obsahuje dve zložky:

1) ukazovatele časových období (roky, štvrťroky, mesiace, dni alebo dátumy);

2) ukazovatele charakterizujúce skúmaný objekt za časové obdobia alebo zodpovedajúce dátumy, ktoré sa nazývajú úrovne série.

Úrovne série sú vyjadrené absolútne aj priemerné alebo relatívne hodnoty. V závislosti od povahy ukazovateľov sa vytvárajú dynamické série absolútnych, relatívnych a priemerných hodnôt. Dynamické rady relatívnych a priemerných hodnôt sú postavené na základe derivačných radov absolútnych hodnôt. Existujú intervalové a momentové série dynamiky.

Dynamický intervalový rad obsahuje hodnoty ukazovateľov za určité časové obdobia. V intervalových radoch možno hladiny sčítať, čím sa získa objem javu za dlhšie obdobie, alebo takzvané akumulované súčty.

Dynamické momentové série odráža hodnoty ukazovateľov v určitom časovom okamihu (dátum času). V momentových radoch môže výskumníka zaujímať iba rozdiel javov, odrážajúci zmenu úrovne radu medzi určitými dátumami, keďže súčet úrovní tu nemá skutočný obsah. Tu sa nepočítajú kumulatívne súčty.

Najdôležitejšou podmienkou pre správnu konštrukciu dynamických radov je porovnateľnosť úrovní radov týkajúcich sa rôznych období. Úrovne by mali byť prezentované v homogénnych množstvách, mala by existovať rovnaká úplnosť pokrytia rôznych častí javu.

Komu Aby sa predišlo skresleniu skutočnej dynamiky, v štatistickej štúdii (uzávierka časového radu) sa vykonávajú predbežné výpočty, ktoré predchádzajú štatistickej analýze časového radu. Uzávierkou časových radov sa rozumie spojenie dvoch alebo viacerých radov do jedného radu, ktorých úrovne sú vypočítané podľa inej metodiky alebo nezodpovedajú územným hraniciam a pod. Uzavretie série dynamiky môže tiež znamenať redukciu absolútnych úrovní série dynamiky na spoločný základ, čím sa eliminuje nekompatibilita úrovní série dynamiky.

Koncept porovnateľnosti časových radov, koeficienty, rast a tempo rastu.

Séria dynamiky- sú to série štatistických ukazovateľov charakterizujúcich vývoj prírodných a spoločenských javov v čase. Štatistické zbierky vydané Štátnym štatistickým výborom Ruska obsahujú veľké množstvo časových radov v tabuľkovej forme. Séria dynamiky umožňuje odhaliť zákonitosti vývoja skúmaných javov.

Časové rady obsahujú dva typy ukazovateľov. Časové ukazovatele(roky, štvrťroky, mesiace atď.) alebo časové body (na začiatku roka, na začiatku každého mesiaca atď.). Indikátory úrovne riadkov. Ukazovatele úrovní časových radov možno vyjadriť v absolútnych hodnotách (výroba produktu v tonách alebo rubľoch), relatívnych hodnotách (podiel mestskej populácie v %) a priemerných hodnotách (priemerné mzdy pracovníkov v priemysle podľa rokov atď.). V tabuľkovej forme obsahuje časový rad dva stĺpce alebo dva riadky.

Správna konštrukcia časových radov zahŕňa splnenie niekoľkých požiadaviek:

všetky ukazovatele série dynamiky musia byť vedecky podložené, spoľahlivé;
ukazovatele série dynamiky by mali byť porovnateľné v čase, t.j. musia byť vypočítané pre rovnaké časové obdobia alebo v rovnakých dátumoch;
ukazovatele množstva dynamiky by mali byť porovnateľné na celom území;
ukazovatele radu dynamiky by mali byť obsahovo porovnateľné, t.j. vypočítané podľa jednotnej metodiky rovnakým spôsobom;
ukazovatele série dynamiky by mali byť porovnateľné v rámci celého radu uvažovaných fariem. Všetky ukazovatele série dynamiky by sa mali uvádzať v rovnakých meracích jednotkách.

Štatistické ukazovatele môže charakterizovať buď výsledky skúmaného procesu za určité časové obdobie, alebo stav skúmaného javu v určitom časovom bode, t.j. indikátory môžu byť intervalové (periodické) a okamžité. V súlade s tým môže byť spočiatku séria dynamiky buď intervalová alebo momentová. Momentový rad dynamiky zase môže byť s rovnakými a nerovnakými časovými intervalmi.

Počiatočnú sériu dynamiky je možné previesť na sériu priemerných hodnôt a sériu relatívnych hodnôt (reťazec a základňa). Takéto časové rady sa nazývajú odvodené časové rady.

Spôsob výpočtu priemernej úrovne v rade dynamiky je odlišný, vzhľadom na typ série dynamiky. Pomocou príkladov zvážte typy časových radov a vzorce na výpočet priemernej úrovne.

Absolútne zisky (Δy) ukazujú, o koľko jednotiek sa zmenila následná úroveň série v porovnaní s predchádzajúcou (stĺpec 3. - reťazové absolútne prírastky) alebo v porovnaní s počiatočnou úrovňou (stĺpec 4. - základné absolútne prírastky). Výpočtové vzorce možno zapísať takto:

S poklesom absolútnych hodnôt série dôjde k „zníženiu“, „poklesu“, resp.

Ukazovatele absolútneho rastu naznačujú, že napríklad v roku 1998 vzrástla produkcia produktu „A“ oproti roku 1997 o 4 000 ton a v porovnaní s rokom 1994 o 34 000 ton; pre ostatné roky, pozri tabuľku. 11,5 g. 3 a 4.

Rastový faktor ukazuje, koľkokrát sa úroveň série zmenila v porovnaní s predchádzajúcou (stĺpec 5 - reťazcové faktory rastu alebo poklesu) alebo v porovnaní s počiatočnou úrovňou (stĺpec 6 - základné faktory rastu alebo poklesu). Výpočtové vzorce možno zapísať takto:

Miery rastu ukázať, o koľko percent je ďalšia úroveň série v porovnaní s predchádzajúcou (stĺpec 7 - reťazcové miery rastu) alebo v porovnaní s počiatočnou úrovňou (stĺpec 8 - základné miery rastu). Výpočtové vzorce možno zapísať takto:

Takže napríklad v roku 1997 bol objem výroby produktu „A“ v porovnaní s rokom 1996 105,5 % (

Miera rastu ukazujú, o koľko percent sa úroveň vykazovaného obdobia zvýšila v porovnaní s predchádzajúcim (stĺpec 9 - reťazcové miery rastu) alebo v porovnaní s počiatočnou úrovňou (stĺpec 10 - základné miery rastu). Výpočtové vzorce možno zapísať takto:

T pr \u003d Tp - 100 % alebo T pr \u003d absolútny nárast / úroveň predchádzajúceho obdobia * 100 %

Takže napríklad v roku 1996 sa v porovnaní s rokom 1995 vyrobil produkt „A“ viac o 3,8 % (103,8 % - 100 %) alebo (8:210) x 100 % a v porovnaní s rokom 1994. - o 9 % ( 109 % - 100 %).

Ak sa absolútne úrovne v rade znížia, potom bude miera nižšia ako 100 % a podľa toho bude miera poklesu (miera rastu so znamienkom mínus).

Absolútna hodnota nárastu o 1 %.(stĺpec 11) ukazuje, koľko kusov sa musí vyrobiť v danom období, aby sa úroveň predchádzajúceho obdobia zvýšila o 1 %. V našom príklade bolo v roku 1995 potrebné vyrobiť 2,0 tisíc ton a v roku 1998 - 2,3 tisíc ton, t.j. oveľa väčší.

Existujú dva spôsoby, ako určiť veľkosť absolútnej hodnoty 1% rastu:

Vydeľte úroveň predchádzajúceho obdobia 100;

Vydeľte absolútne miery rastu reťazca zodpovedajúcimi mierami rastu reťazca.

Absolútna hodnota 1% nárastu =

V dynamike, najmä počas dlhého obdobia, je dôležité spoločne analyzovať tempo rastu s obsahom každého percentuálneho nárastu alebo poklesu.

Upozorňujeme, že uvažovaná metodika analýzy časových radov je použiteľná pre časové rady, ktorých úrovne sú vyjadrené v absolútnych hodnotách (t, tisíc rubľov, počet zamestnancov atď.), ako aj pre časové rady úrovne ktoré sú vyjadrené v relatívnych ukazovateľoch (% šrotu, % popolnatosti uhlia atď.) alebo priemernými hodnotami (priemerná úroda v c/ha, priemerné mzdy atď.).

Spolu s uvažovanými analytickými ukazovateľmi vypočítanými pre každý rok v porovnaní s predchádzajúcou alebo počiatočnou úrovňou je pri analýze časového radu potrebné vypočítať priemerné analytické ukazovatele za obdobie: priemerná úroveň radu, priemerný ročný absolútny nárast (pokles) a priemernú ročnú mieru rastu a mieru rastu.

Metódy na výpočet priemernej úrovne série dynamiky boli diskutované vyššie. V intervalovom rade dynamiky, ktorý uvažujeme, sa priemerná úroveň radu vypočíta podľa vzorca jednoduchého aritmetického priemeru:

Priemerná ročná produkcia produktu za roky 1994-1998. predstavoval 218,4 tisíc ton.

Priemerný ročný absolútny prírastok sa tiež vypočíta podľa vzorca jednoduchého aritmetického priemeru:

Ročné absolútne prírastky sa v priebehu rokov pohybovali od 4 do 12 tisíc ton (pozri gr. 3) a priemerný ročný nárast produkcie za obdobie 1995 - 1998. predstavoval 8,5 tisíc ton.

Metódy na výpočet priemernej miery rastu a priemernej miery rastu si vyžadujú podrobnejšie zváženie. Zoberme si ich na príklade ročných ukazovateľov úrovne radu uvedených v tabuľke.

Stredná úroveň rozsahu dynamiky.

Rad dynamiky (alebo časový rad)- sú to číselné hodnoty určitého štatistického ukazovateľa v po sebe nasledujúcich okamihoch alebo časových úsekoch (t. j. usporiadané v chronologickom poradí).

Nazývajú sa číselné hodnoty konkrétneho štatistického ukazovateľa, ktorý tvorí sériu dynamiky úrovne čísla a zvyčajne sa označuje písmenom r. Prvý člen série y 1 nazývané počiatočné resp základná línia, a posledný y n - finálny, konečný. Momenty alebo časové obdobia, na ktoré sa úrovne vzťahujú, sú označené t.

Dynamické rady sú spravidla prezentované vo forme tabuľky alebo grafu a časová mierka je zostavená pozdĺž osi x t a pozdĺž zvislej osi - mierka úrovní série r.

Priemerné ukazovatele série dynamiky

Každú sériu dynamiky možno považovať za určitý súbor nčasovo premenné ukazovatele, ktoré možno zhrnúť ako priemery. Takéto zovšeobecnené (priemerné) ukazovatele sú potrebné najmä pri porovnávaní zmien jedného alebo druhého ukazovateľa v rôznych obdobiach, v rôznych krajinách atď.

Všeobecnou charakteristikou série dynamiky môže byť predovšetkým priemerná úroveň riadkov. Spôsob výpočtu priemernej úrovne závisí od toho, či ide o momentový rad alebo intervalový (dobový) rad.

Kedy interval radu, jeho priemernú úroveň určíme vzorcom jednoduchého aritmetického priemeru úrovní radu, t.j.

=
Ak je k dispozícii moment riadok obsahujúci núrovne ( y1, y2, …, yn) s rovnakými intervalmi medzi dátumami (časovými bodmi), potom je možné takýto rad jednoducho previesť na sériu priemerných hodnôt. Zároveň ukazovateľ (úroveň) na začiatku každého obdobia je súčasne ukazovateľom na konci predchádzajúceho obdobia. Potom je možné vypočítať priemernú hodnotu ukazovateľa pre každé obdobie (interval medzi dátumami) ako polovičný súčet hodnôt pri na začiatku a na konci obdobia, t.j. ako . Počet takýchto priemerov bude . Ako už bolo spomenuté, pre série priemerov sa priemerná úroveň vypočítava z aritmetického priemeru.

Preto môžeme napísať:
.
Po prevode čitateľa dostaneme:
,

kde Y1 a Yn- prvá a posledná úroveň série; Yi- stredné úrovne.

Tento priemer je v štatistike známy ako priemerne chronologicky pre momentové série. Tento názov dostala od slova „cronos“ (čas, lat.), keďže sa vypočítava z ukazovateľov, ktoré sa časom menia.

V prípade nerovnakého intervaloch medzi dátumami možno chronologický priemer pre momentovú sériu vypočítať ako aritmetický priemer priemerných hodnôt úrovní pre každú dvojicu momentov, vážený vzdialenosťami (časovými intervalmi) medzi dátumami, t.j.
.
V tomto prípade predpokladá sa, že v intervaloch medzi dátumami nadobudli úrovne rôzne hodnoty a sme z dvoch známych ( yi a yi+1) určíme priemery, z ktorých potom vypočítame celkový priemer za celé analyzované obdobie.
Ak sa predpokladá, že každá hodnota yi zostáva nezmenená až do nasledujúceho (i+ 1)- moment, t.j. je známy presný dátum zmeny úrovní, potom je možné vykonať výpočet pomocou vzorca váženého aritmetického priemeru:
,

kde je čas, počas ktorého hladina zostala nezmenená.

Okrem priemernej úrovne v rade dynamiky sa počítajú aj ďalšie priemerné ukazovatele - priemerná zmena úrovní radu (základné a reťazové metódy), priemerná miera zmeny.

Základná hodnota znamená absolútnu zmenu je podiel poslednej základnej absolútnej zmeny vydelený počtom zmien. Teda

Reťaz znamená absolútnu zmenu úrovne radu je kvocient delenia súčtu všetkých reťazových absolútnych zmien počtom zmien, t.j.

Podľa znamienka priemerných absolútnych zmien sa priemerne posudzuje aj charakter zmeny javu: rast, pokles alebo stabilita.

Z pravidla pre riadenie základných a reťazových absolútnych zmien vyplýva, že základné a reťazové priemerné zmeny sa musia rovnať.

Spolu s priemernou absolútnou zmenou sa pomocou základnej a reťazovej metódy vypočíta aj priemerná relatívna.

Základná priemerná relatívna zmena sa určuje podľa vzorca:

Reťaz znamená relatívnu zmenu sa určuje podľa vzorca:

Prirodzene, základné a reťazové priemerné relatívne zmeny by mali byť rovnaké a ich porovnaním s hodnotou kritéria 1 sa urobí záver o povahe priemernej zmeny javu: rast, pokles alebo stabilita.
Odčítaním 1 od základnej alebo reťazovej priemernej relatívnej zmeny, zodpovedajúca priemerná miera zmeny, podľa znaku ktorého možno posudzovať aj povahu zmeny skúmaného javu, ktorá sa odráža v tomto rade dynamiky.

Sezónne výkyvy a sezónne indexy.

Sezónne výkyvy sú stabilné medziročné výkyvy.

Základným princípom riadenia pre dosiahnutie maximálneho efektu je maximalizácia príjmov a minimalizácia nákladov. Štúdiom sezónnych výkyvov sa rieši problém maximálnej rovnice v každej úrovni roka.

Pri štúdiu sezónnych výkyvov sa riešia dve vzájomne súvisiace úlohy:

1. Identifikácia špecifík vývoja javu v medziročnej dynamike;

2. Meranie sezónnych výkyvov s konštrukciou modelu sezónnych vĺn;

Na meranie sezónnosti sa zvyčajne počítajú sezónne morky. Vo všeobecnosti sú určené pomerom pôvodných rovníc série dynamiky k teoretickým rovniciam, ktoré slúžia ako základ pre porovnanie.

Keďže náhodné odchýlky sa prekrývajú so sezónnymi výkyvmi, indexy sezónnosti sa spriemerujú, aby sa odstránili.

V tomto prípade sa pre každé obdobie ročného cyklu stanovujú zovšeobecnené ukazovatele vo forme priemerných sezónnych indexov:

Priemerné indexy sezónnych výkyvov sú bez vplyvu náhodných odchýlok hlavného vývojového trendu.

V závislosti od povahy trendu môže mať vzorec pre priemerný index sezónnosti tieto formy:

1.Pre série medziročnej dynamiky s výrazným hlavným vývojovým trendom:

2. Pre sériu medziročnej dynamiky, v ktorej neexistuje stúpajúci alebo klesajúci trend alebo je nevýznamná:

Kde je všeobecný priemer;

Metódy analýzy hlavného trendu.

Vývoj javov v čase ovplyvňujú faktory rôzneho charakteru a sily vplyvu. Niektoré z nich sú náhodného charakteru, iné pôsobia takmer neustále a tvoria určitý vývojový trend v rade dynamiky.

Dôležitou úlohou štatistiky je identifikovať trend v sérii dynamiky, oslobodený od pôsobenia rôznych náhodných faktorov. Na tento účel sa časové rady spracovávajú metódami zväčšovania intervalov, kĺzavého priemeru a analytického zarovnania atď.

Metóda intervalového zhrubnutia je založená na zväčšovaní časových úsekov, ktoré zahŕňajú úrovne série dynamiky, t.j. je nahradenie údajov týkajúcich sa malých časových období údajmi z väčších období. Je to obzvlášť účinné, keď sú počiatočné úrovne série na krátke časové obdobia. Napríklad série ukazovateľov súvisiacich s dennými udalosťami sú nahradené sériami týkajúcimi sa týždenných, mesačných atď. To sa ukáže jasnejšie "Os rozvoja fenoménu". Priemer vypočítaný na základe zväčšených intervalov umožňuje identifikovať smer a charakter (zrýchlenie alebo spomalenie rastu) hlavného vývojového trendu.

metóda kĺzavého priemeru podobne ako v predchádzajúcom, ale v tomto prípade sú skutočné hladiny nahradené priemernými hladinami vypočítanými pre postupne sa pohybujúce (kĺzavé) rozšírené intervaly pokrývajúce múrovne riadkov.

Napríklad ak bude prijatý m=3, potom sa najprv vypočíta priemer prvých troch úrovní série, potom - z rovnakého počtu úrovní, ale počnúc od druhej v rade, potom - od tretej atď. Priemer teda akoby „kĺzal“ po sérii dynamiky a pohyboval sa po dobu jedného obdobia. Vypočítané z mčleny kĺzavých priemerov sa vzťahujú na stred (stred) každého intervalu.

Táto metóda eliminuje iba náhodné výkyvy. Ak má séria sezónnu vlnu, zostane po vyhladení metódou kĺzavého priemeru.

Analytické zarovnanie. Aby sa eliminovali náhodné výkyvy a identifikoval trend, úrovne radov sú zarovnané podľa analytických vzorcov (alebo analytického zarovnania). Jej podstatou je nahradenie empirických (aktuálnych) úrovní teoretickými, ktoré sú vypočítané podľa určitej rovnice branej ako matematický model trendu, kde teoretické úrovne sú uvažované ako funkcia času: . V tomto prípade sa každá aktuálna úroveň považuje za súčet dvoch zložiek: , kde je systematická zložka a je vyjadrená určitou rovnicou a je náhodnou premennou, ktorá spôsobuje výkyvy okolo trendu.

Úloha analytického zarovnania je nasledovná:

1. Na základe aktuálnych údajov určiť typ hypotetickej funkcie, ktorá môže čo najprimeranejšie odrážať trend vývoja skúmaného ukazovateľa.

2. Nájdenie parametrov zadanej funkcie (rovnice) z empirických údajov

3. Výpočet podľa nájdenej rovnice teoretických (nivelizovaných) úrovní.

Voľba konkrétnej funkcie sa spravidla uskutočňuje na základe grafického znázornenia empirických údajov.

Modely sú regresné rovnice, ktorých parametre sú vypočítané metódou najmenších štvorcov

Nižšie sú uvedené najbežnejšie používané regresné rovnice na vyrovnávanie časových radov, ktoré naznačujú, ktoré vývojové trendy sú najvhodnejšie na vyjadrenie.

Na nájdenie parametrov vyššie uvedených rovníc existujú špeciálne algoritmy a počítačové programy. Najmä na nájdenie parametrov rovnice priamky možno použiť nasledujúci algoritmus:

Ak sú periódy alebo časové okamihy očíslované tak, že sa získa St = 0, potom sa vyššie uvedené algoritmy výrazne zjednodušia a zmenia sa na

Zarovnané úrovne na grafe budú umiestnené na jednej priamke prechádzajúcej v najbližšej vzdialenosti od skutočných úrovní tohto dynamického radu. Súčet štvorcových odchýlok je odrazom vplyvu náhodných faktorov.

S jeho pomocou vypočítame priemernú (štandardnú) chybu rovnice:

Tu n je počet pozorovaní a m je počet parametrov v rovnici (máme dva z nich - b 1 a b 0).

Hlavný trend (trend) ukazuje, ako systematické faktory ovplyvňujú úrovne série dynamiky, a kolísanie úrovní okolo trendu () slúži ako miera vplyvu reziduálnych faktorov.

Používa sa aj na posúdenie kvality použitého modelu časových radov Fisherov F test. Je to pomer dvoch rozptylov, a to pomer rozptylu spôsobeného regresiou, t.j. študovaný faktor, k rozptylu spôsobenému náhodnými príčinami, t.j. zvyškový rozptyl:

V rozšírenej forme môže byť vzorec pre toto kritérium reprezentovaný takto:

kde n je počet pozorovaní, t.j. počet úrovní riadkov,

m je počet parametrov v rovnici, y je skutočná úroveň radu,

Zarovnaná úroveň riadku, - priemerná úroveň riadku.

Úspešnejší ako ostatné, model nemusí byť vždy dostatočne uspokojivý. Môže byť uznaná ako taká, iba ak kritérium F pre ňu prekročí určitú kritickú hranicu. Táto hranica je nastavená pomocou F distribučných tabuliek.

Podstata a klasifikácia indexov.

Index v štatistike sa chápe ako relatívny ukazovateľ, ktorý charakterizuje zmenu veľkosti javu v čase, priestore alebo v porovnaní s akoukoľvek normou.

Hlavným prvkom vzťahu indexu je indexovaná hodnota. Indexovanou hodnotou sa rozumie hodnota znaku štatistickej populácie, ktorej zmena je predmetom skúmania.

Indexy slúžia na tri hlavné účely:

1) posúdenie zmien v komplexnom jave;

2) určenie vplyvu jednotlivých faktorov na zmenu komplexného javu;

3) porovnanie veľkosti nejakého javu s veľkosťou minulého obdobia, veľkosťou iného územia, ako aj s normami, plánmi, prognózami.

Indexy sú klasifikované podľa 3 kritérií:

2) podľa stupňa pokrytia zložiek obyvateľstva;

3) metódami výpočtu všeobecných indexov.

Podľa obsahu indexovaných hodnôt sa indexy delia na indexy kvantitatívnych (objemových) ukazovateľov a indexy kvalitatívnych ukazovateľov. Indexy kvantitatívnych ukazovateľov - indexy fyzického objemu priemyselnej výroby, fyzického objemu tržieb, počtu a pod. Indexy kvalitatívnych ukazovateľov - indexy cien, nákladov, produktivity práce, priemerných miezd a pod.

Podľa stupňa pokrytia jednotiek obyvateľstva sú indexy rozdelené do dvoch tried: individuálne a všeobecné. Na ich charakterizáciu uvádzame nasledujúce konvencie prijaté v praxi aplikácie indexovej metódy:

q- množstvo (objem) akéhokoľvek naturálneho produktu ; R- jednotková cena výroby; z- jednotkové výrobné náklady; t- čas strávený výrobou jednotky výstupu (náročnosť práce) ; w- produkcia v hodnote za jednotku času; v- výstup vo fyzickom vyjadrení za jednotku času; T- celkový čas strávený alebo počet zamestnancov.

Aby bolo možné rozlíšiť, ku ktorému obdobiu alebo objektu patria indexované hodnoty, je zvykom vkladať dolné indexy za príslušný symbol vpravo dole. Napríklad v indexoch dynamiky sa spravidla pre porovnávané (bežné, vykazované) obdobia používa dolný index 1 a pre obdobia, s ktorými sa porovnáva,

Jednotlivé indexy slúžia na charakterizáciu zmeny jednotlivých prvkov komplexného javu (napríklad zmena objemu produkcie jedného druhu produktu). Predstavujú relatívne hodnoty dynamiky, plnenia záväzkov, porovnanie indexovaných hodnôt.

Stanoví sa individuálny index fyzického objemu produkcie

Z analytického hľadiska sú uvedené jednotlivé indexy dynamiky podobné koeficientom (tempám) rastu a charakterizujú zmenu indexovanej hodnoty v aktuálnom období oproti základnej, t. j. ukazujú, koľkokrát sa zvýšila (poklesla). ) alebo o koľko percent ide o rast (pokles). Hodnoty indexu sú vyjadrené v koeficientoch alebo percentách.

Všeobecný (zložený) index odráža zmenu všetkých prvkov komplexného javu.

Súhrnný index je základná forma indexu. Nazýva sa agregát, pretože jeho čitateľ a menovateľ sú množinou „agregátov“

Priemerné indexy, ich definícia.

Okrem agregovaných indexov sa v štatistike používa ich ďalšia forma – indexy váženého priemeru. K ich výpočtu sa pristupuje vtedy, keď dostupné informácie neumožňujú vypočítať všeobecný súhrnný index. Ak teda neexistujú údaje o cenách, ale existujú informácie o nákladoch na produkty v bežnom období a sú známe individuálne cenové indexy pre každý produkt, potom všeobecný cenový index nemožno určiť ako súhrnný, ale je možné vypočítať ako priemer jednotlivých. Rovnako, ak nie sú známe množstvá jednotlivých vyrobených výrobkov, ale sú známe jednotlivé indexy a výrobné náklady základného obdobia, potom je možné celkový index fyzického objemu výroby určiť ako vážený priemer.

Priemerný index - toto je index vypočítaný ako priemer jednotlivých indexov. Agregovaný index je základnou formou všeobecného indexu, preto musí byť priemerný index totožný s agregovaným indexom. Pri výpočte priemerných indexov sa používajú dve formy priemerov: aritmetické a harmonické.

Index aritmetického priemeru je totožný so súhrnným indexom, ak váhy jednotlivých indexov sú členmi menovateľa súhrnného indexu. Iba v tomto prípade sa hodnota indexu vypočítaná vzorcom aritmetického priemeru bude rovnať súhrnnému indexu.