Kontakty

Distribučné rady. Štatistické zhrnutie a zoskupenie

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Dobrá práca na stránku">

Študenti, postgraduálni študenti, mladí vedci, ktorí pri štúdiu a práci využívajú vedomostnú základňu, vám budú veľmi vďační.

Uverejnené dňa http://www.allbest.ru/

ÚLOHA1

K dispozícii sú nasledujúce informácie o mzdy zamestnanci v podniku:

Tabuľka 1.1

Výška miezd v konv. Brloh. Jednotky

Je potrebné vytvoriť intervalový rad distribúcie, podľa ktorého sa má nájsť;

1) priemerná mzda;

2) priemer lineárna odchýlka;

4) priemer smerodajná odchýlka;

5) rozsah variácií;

6) koeficient oscilácie;

7) lineárny variačný koeficient;

8) jednoduchý variačný koeficient;

10) medián;

11) koeficient asymetrie;

12) Pearsonov index asymetrie;

13) koeficient špičatosti.

Riešenie

Ako viete, možnosti (rozpoznané hodnoty) sú usporiadané vo vzostupnom poradí diskrétne variačné série. S veľkým počtom variant (viac ako 10), aj v prípade diskrétnej variácie sa budujú intervalové rady.

Ak je intervalový rad zostavený s párnymi intervalmi, potom sa rozsah variácie vydelí určeným počtom intervalov. V tomto prípade, ak je získaná hodnota celočíselná a jednoznačná (čo je zriedkavé), potom sa dĺžka intervalu rovná tomuto číslu. V iných prípadoch vyrobené zaokrúhľovanie nevyhnutne v strane zväčšenie, Takže do posledná zostávajúca číslica bola párna. Je zrejmé, že s nárastom dĺžky intervalu, rozsah variácie o hodnotu rovnajúcu sa súčinu počtu intervalov: o rozdiel medzi vypočítanou a počiatočnou dĺžkou intervalu

a) Ak je hodnota rozšírenia rozsahu variácie nevýznamná, potom sa buď pripočíta k najväčšej alebo odpočíta od najmenšej hodnoty atribútu;

b) Ak je veľkosť rozšírenia rozsahu variácie hmatateľná, potom, aby nedošlo k premiešaniu stredu rozsahu, sa približne rozdelí na polovicu, pričom sa súčasne pridá k najväčšiemu a odpočíta sa od najmenšie hodnoty znamenie.

Ak je intervalový rad zostavený s nerovnakými intervalmi, potom sa proces zjednoduší, ale ako predtým, dĺžka intervalov musí byť vyjadrená ako číslo s poslednou párnou číslicou, čo výrazne zjednodušuje následné výpočty. číselné charakteristiky.

30 - veľkosť vzorky.

Zostavme intervalový distribučný rad pomocou Sturgesovho vzorca:

K \u003d 1 + 3,32 * lg n,

K - počet skupín;

K \u003d 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Rozpätie znamienka - mzdy zamestnancov v podniku - (x) zistíme podľa vzorca

R \u003d xmax - xmin a delenie 6; R=195-112=83

Potom bude dĺžka intervalu l dráha = 83:6 = 13,83

Začiatok prvého intervalu bude 112. Pridáva sa k 112 l ras=13,83, dostaneme jeho konečnú hodnotu 125,83, čo je zároveň začiatok druhého intervalu atď. koniec piateho intervalu je 195.

Pri hľadaní frekvencií by sme sa mali riadiť pravidlom: "ak sa hodnota znaku zhoduje s hranicou vnútorného intervalu, potom by sa mala vzťahovať na predchádzajúci interval."

Získame intervalový rad frekvencií a kumulatívnu frekvenciu.

Tabuľka 1.2

Platy teda majú 3 zamestnanci. platba od 112 do 125,83 konvenčných jednotiek. Najvyšší plat platba od 181,15 do 195 konvenčných jednotiek. len 6 robotníkov.

Na výpočet numerických charakteristík konvertujeme intervalový rad na diskrétny, pričom ako variant berieme stred intervalov:

Tabuľka 1.3

14131,83

Podľa vzorca váženého aritmetického priemeru

cond.mon.un.

Priemerná lineárna odchýlka:

kde xi je hodnota študovaného znaku v i-tej jednotke populácie,

Priemerná hodnota študovaného znaku.

Uverejnené dňa http://www.allbest.ru/

LPoslané dňa http://www.allbest.ru/

Podmienené peňažné jednotky

štandardná odchýlka:

Rozptyl:

Relatívny rozsah variácie (koeficient oscilácie): c=R:,

Relatívna lineárna odchýlka: q = L:

Variačný koeficient: V = y:

Koeficient oscilácie ukazuje relatívne kolísanie extrémnych hodnôt vlastnosti okolo aritmetického priemeru a koeficient variácie charakterizuje stupeň a homogenitu populácie.

c \u003d R: \u003d 83 / 159,485 * 100 % \u003d 52,043 %

Rozdiel medzi extrémnymi hodnotami je teda o 5,16 % (= 94,84 % – 100 %) nižší ako priemerná mzda zamestnancov v podniku.

q \u003d L: \u003d 17,765 / 159,485 * 100 % \u003d 11,139 %

V \u003d y: \u003d 21,704 / 159,485 * 100 % \u003d 13,609 %

Variačný koeficient je menší ako 33 %, čo naznačuje slabé kolísanie miezd zamestnancov v podniku, t.j. že priemer je typickou charakteristikou miezd pracovníkov (homogénny agregát).

V intervalovom distribučnom rade móda sa určuje podľa vzorca -

Frekvencia modálneho intervalu, t.j. intervalu obsahujúceho najväčší počet možnosť;

Frekvencia intervalu pred modálom;

Frekvencia intervalu nasledujúceho po spôsobe;

dĺžka modálneho intervalu;

Dolná hranica modálneho intervalu.

Na určenie mediány v intervalovom rade použijeme vzorec

kde je kumulatívna (kumulatívna) frekvencia intervalu predchádzajúceho mediánu;

Dolná hranica stredného intervalu;

Frekvencia stredného intervalu;

Dĺžka stredného intervalu.

Stredný interval- interval, ktorého akumulovaná frekvencia (=3+3+5+7) presahuje polovicu súčtu frekvencií - (153,49; 167,32).

Vypočítajme šikmosť a špičatosť, pre ktoré zostavíme nový pracovný list:

Tabuľka 1.4

Faktické údaje

Odhadované údaje

Vypočítajte moment tretieho rádu

Preto je asymetria

Od 0,3553 0,25 sa asymetria považuje za významnú.

Vypočítajte moment štvrtého rádu

Preto je špičatosť

Pretože< 0, то эксцесс является плосковершинным.

Stupeň šikmosti možno určiť pomocou Pearsonovho koeficientu šikmosti (As): oscilácia vzorka obrat nákladov

kde je aritmetický priemer distribučného radu; -- móda; -- štandardná odchýlka.

Pri symetrickom (normálnom) rozdelení = Mo teda koeficient asymetrie nula. Ak Аs > 0, potom existuje viac módov, preto existuje pravostranná asymetria.

Ak As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Rozloženie nie je symetrické, ale má ľavostrannú asymetriu.

ÚLOHA 2

Aká by mala byť veľkosť vzorky, aby bola pravdepodobnosť 0,954, že výberová chyba nepresiahne 0,04, ak je rozptyl z predchádzajúcich prieskumov známy ako 0,24?

Riešenie

Veľkosť vzorky pre neopakované vzorkovanie sa vypočíta podľa vzorca:

t - koeficient spoľahlivosti (s pravdepodobnosťou 0,954 sa rovná 2,0; určený z tabuliek integrálov pravdepodobnosti),

y2 = 0,24 - štandardná odchýlka;

10 000 ľudí - veľkosť vzorky;

Dx =0,04 - hraničná chyba priemeru vzorky.

S pravdepodobnosťou 95,4% možno tvrdiť, že veľkosť vzorky, ktorá poskytuje relatívnu chybu nie väčšiu ako 0,04, by mala byť aspoň 566 rodín.

ÚLOHA3

K dispozícii sú nasledujúce údaje o príjmoch z hlavnej činnosti podniku, milióny rubľov.

Ak chcete analyzovať sériu dynamiky, určte nasledujúce ukazovatele:

1) reťaz a základné:

Absolútne zisky;

miery rastu;

miery rastu;

2) stredná

Úroveň dynamického rozsahu;

Absolútny rast;

Tempo rastu;

Miera nárastu;

3) absolútna hodnota 1% rastu.

Riešenie

1. Absolútny rast (Dy)- toto je rozdiel medzi ďalšou úrovňou série a predchádzajúcou (alebo základnou):

reťaz: Du \u003d yi - yi-1,

základné: Du \u003d yi - y0,

yi - úroveň riadkov,

i - číslo úrovne riadku,

y0 - úroveň základného roka.

2. Miera rastu (Tu) je pomer ďalšej úrovne série a predchádzajúcej úrovne (alebo základného roku 2001):

reťazec: Tu = ;

základné: Tu =

3. Rýchlosť rastu (TD) - je pomer absolútneho rastu k predchádzajúcej úrovni, vyjadrený v %.

reťazec: Tu = ;

základné: Tu =

4. Absolútna hodnota zvýšenia o 1 % (A) je pomer absolútneho rastu reťazca k rýchlosti rastu, vyjadrený v %.

ALE =

Úroveň stredného radu vypočítané pomocou vzorca aritmetického priemeru.

Priemerná úroveň príjmu z hlavných činností za 4 roky:

Priemerný absolútny rast vypočítané podľa vzorca:

kde n je počet úrovní v riadku.

V priemere za rok vzrástli príjmy z hlavných činností o 3,333 milióna rubľov.

Priemerná ročná miera rastu vypočítané podľa geometrického priemeru:

уn - posledná úroveň série,

r0 - Prvá úroveň riadok.

Ut \u003d 100 % \u003d 102,174 %

Priemerná ročná miera rastu vypočítané podľa vzorca:

T? \u003d Tu - 100 % \u003d 102,74 % - 100 % \u003d 2,74 %.

V priemere za rok tak príjmy z hlavnej činnosti podniku vzrástli o 2,74 %.

ÚLOHYALE4

Vypočítať:

1. Individuálne cenové indexy;

2. všeobecný index obratu;

3. Súhrnný cenový index;

4. Súhrnný index fyzického objemu predaja tovaru;

5. Absolútny nárast hodnoty obratu a rozklad podľa faktorov (v dôsledku zmien cien a počtu predaných tovarov);

6. Urobte stručné závery o všetkých získaných ukazovateľoch.

Riešenie

1. Jednotlivé cenové indexy produktov A, B, C podľa stavu predstavovali -

ipA = 1,20; ipB = 1,15; iрВ = 1,00.

2. Celkový index obratu sa vypočíta podľa vzorca:

I w \u003d \u003d 1470/1045 * 100 % \u003d 140,67 %

Obchodný obrat vzrástol o 40,67 % (140,67 % -100 %).

V priemere ceny komodít vzrástli o 10,24 %.

Výška dodatočných nákladov pre kupujúcich v dôsledku zvýšenia ceny:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333,478 \u003d 136,522 milióna rubľov.

V dôsledku rastúcich cien museli kupujúci minúť ďalších 136,522 milióna rubľov.

4. Všeobecný index fyzického objemu obchodu:

Fyzický objem obchodu vzrástol o 27,61 %.

5. Určme celkovú zmenu obratu v druhom období v porovnaní s prvým obdobím:

w \u003d 1470- 1045 \u003d 425 miliónov rubľov.

z dôvodu zmeny cien:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 milióna rubľov.

zmenou fyzického objemu:

w(q) \u003d 1333,478 - 1045 \u003d 288,478 milióna rubľov.

Tržby za tovar vzrástli o 40,67 %. Ceny v priemere za 3 tovary vzrástli o 10,24 %. Fyzický objem obchodu vzrástol o 27,61 %.

Vo všeobecnosti sa objem predaja zvýšil o 425 miliónov rubľov, a to aj v dôsledku rastúcich cien, zvýšil sa o 136,522 milióna rubľov a v dôsledku zvýšenia objemu predaja - o 288,478 milióna rubľov.

ÚLOHA5

Pre 10 závodov v jednom odvetví sú k dispozícii nasledujúce údaje.

Továreň č.

Výstup, tisíc kusov (X)

Na základe uvedených údajov:

I) potvrdiť ustanovenia logickej analýzy o prítomnosti lineárnej korelácie medzi znakom faktora (výrobný výkon) a výsledným znakom (spotreba elektrickej energie), vykresliť počiatočné údaje do grafu korelačného poľa a vyvodiť závery o forma vzťahu, uveďte jeho vzorec;

2) určiť parametre rovnice spojenia a vyniesť výslednú teoretickú čiaru do grafu korelačného poľa;

3) vypočítajte koeficient lineárnej korelácie,

4) vysvetlite hodnoty ukazovateľov získaných v odsekoch 2) a 3);

5) pomocou získaného modelu urobte predpoveď o možnej spotrebe elektriny v závode s objemom výroby 4,5 tisíc kusov.

Riešenie

Znakové údaje - objem výstupu (faktor), označený хi; znak - spotreba elektriny (výsledok) cez ui; body so súradnicami (x, y) sú vynesené do korelačného poľa OXY.

Body korelačného poľa sú umiestnené pozdĺž nejakej priamky. Preto je súvislosť lineárna, regresnú rovnicu budeme hľadať v tvare priamky Yx=ax+b. Aby sme to našli, používame systém normálnych rovníc:

Vytvorme si tabuľku.

Na základe zistených priemerov zostavíme systém a vyriešime ho s ohľadom na parametre a a b:

Takže dostaneme regresnú rovnicu pre y na x: \u003d 3,57692 x + 3,19231

Na korelačnom poli postavíme regresnú priamku.

Dosadením hodnôt x zo stĺpca 2 do regresnej rovnice získame vypočítané hodnoty (stĺpec 7) a porovnáme ich s údajmi y, čo sa odráža v stĺpci 8. Mimochodom, správnosť výpočtov je tiež potvrdená zhodou priemerných hodnôt y a.

Koeficientlineárna korelácia vyhodnotí tesnosť vzťahu medzi znakmi x a y a vypočíta sa podľa vzorca

Uhlový koeficient priamej regresie a (v x) charakterizuje smer identifikovanéhozávislostiznaky: pre a>0 sú rovnaké, pre a<0- противоположны. Jeho absolútna hodnota - miera zmeny výsledného znamienka pri zmene znamienka faktora na jednotku merania.

Voľný člen priamej regresie odhaľuje smer a jeho absolútnu hodnotu - kvantitatívnu mieru vplyvu na efektívny znak všetkých ostatných faktorov.

Ak< 0, potom sa zdroj atribútu faktora jednotlivého objektu použije s menej a kedy>0 svyšší výkon ako je priemer pre celú množinu objektov.

Urobme postregresnú analýzu.

Koeficient pri x priamej regresie je 3,57692 > 0, preto s nárastom (poklesom) výkonu rastie (klesá) spotreba elektriny. Zvýšenie produkcie o 1 tisíc kusov. udáva priemerný nárast spotreby elektriny o 3,57692 tisíc kWh.

2. Voľný člen priamej regresie je 3,19231, preto vplyv iných faktorov zvyšuje silu vplyvu výkonu na spotrebu el. absolútne meranie o 3,19231 tisíc kWh.

3. Korelačný koeficient 0,8235 odhaľuje veľmi úzku závislosť spotreby elektriny od výkonu.

Je ľahké robiť predpovede pomocou rovnice regresného modelu. Na tento účel sa do regresnej rovnice nahradia hodnoty x ako objem výstupu a predpovedá sa spotreba elektriny. V tomto prípade môžu byť hodnoty x prijaté nielen v rámci daného rozsahu, ale aj mimo neho.

Urobme predpoveď o možnej spotrebe elektriny v závode s objemom výroby 4,5 tisíc kusov.

3,57692*4,5 + 3,19231= 19,288 45 tisíc kWh.

ZOZNAM POUŽITÝCH ZDROJOV

1. Zacharenkov S.N. Sociálno-ekonomická štatistika: Študijná príručka. - Minsk: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Všeobecná teóriaštatistiky. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Štatistiky. - M.: Prospekt, 2002.

4. Všeobecná teória štatistiky / Ed. vyd. O.E. Bashina, A.A. Spirín. - M.: Financie a štatistika, 2000.

5. Sociálno-ekonomická štatistika: Učebnica.-prac. príspevok / Zacharenkov S.N. atď. - Minsk: YSU, 2004.

6. Sociálno-ekonomická štatistika: Proc. príspevok. / Ed. Nesterovič S.R. - Minsk: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics. - Minsk, 2000.

8. Charčenko L.P. Štatistiky. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Štatistiky. - M.: INFRA - M, 1999.

10. Ekonomická štatistika / Ed. Yu.N. Ivanova - M., 2000.

Hostené na Allbest.ru

...

Podobné dokumenty

    Výpočet aritmetického priemeru intervalového distribučného radu. Stanovenie všeobecného indexu fyzického objemu obchodu. Analýza absolútnej zmeny celkových výrobných nákladov v dôsledku zmien fyzického objemu. Výpočet variačného koeficientu.

    test, pridané 19.07.2010

    Podstata veľkoobchodu, maloobchodu a verejného obchodu. Vzorce na výpočet individuálnych, súhrnných indexov obratu. Výpočet charakteristík intervalového distribučného radu - aritmetický priemer, modus a medián, variačný koeficient.

    ročníková práca, pridaná 5.10.2013

    Výpočet plánovaného a skutočného objemu predaja, percento plánu, absolútna zmena obratu. Stanovenie absolútneho rastu, priemerných temp rastu a rastu peňažných príjmov. Výpočet štrukturálnych priemerov: mody, mediány, kvartily.

    test, pridané 24.02.2012

    Intervalové rady rozdelenia bánk podľa objemu zisku. Zistenie modu a mediánu získaných intervalových distribučných radov grafickou metódou a výpočtom. Výpočet charakteristík intervalového distribučného radu. Výpočet aritmetického priemeru.

    test, pridaný 15.12.2010

    Vzorce na určenie priemerných hodnôt intervalových sérií - režimy, mediány, rozptyly. Výpočet analytických ukazovateľov časových radov podľa reťazových a základných schém, temp rastu a rastu. Pojem zloženého indexu nákladov, cien, nákladov a obratu.

    ročníková práca, pridaná 27.02.2011

    Pojem a účel, poradie a pravidlá na zostavenie variačného radu. Analýza homogenity údajov v skupinách. Indikátory variácie (kolísania) vlastnosti. Stanovenie strednej lineárnej a štvorcovej odchýlky, koeficientu oscilácie a variácie.

    test, pridané 26.04.2010

    Pojem modus a medián ako typické charakteristiky, poradie a kritériá na ich určenie. Nájdenie módu a mediánu v sérii diskrétnych a intervalových variácií. Kvartily a decily ako ďalšie charakteristiky variácie štatistický rad.

    test, pridané 9.11.2010

    Konštrukcia intervalového radu distribúcie na základe zoskupenia. Charakterizácia odchýlky frekvenčného rozloženia od symetrického tvaru, výpočet ukazovateľov špičatosti a asymetrie. Analýza ukazovateľov súvahy alebo výkazu ziskov a strát.

    kontrolné práce, doplnené 19.10.2014

    Transformácia empirických radov na diskrétne a intervalové. Definícia stredná veľkosť v diskrétnom rade s využitím jeho vlastností. Výpočet diskrétnej série módov, mediánov, variačných ukazovateľov (disperzia, odchýlka, oscilačný koeficient).

    test, pridané 17.04.2011

    Konštrukcia štatistického radu rozloženia organizácií. Grafická definícia hodnoty módu a mediánu. Tesnosť korelácie s použitím koeficientu determinácie. Definícia vzorkovacej chyby priemerný počet zamestnancov pracovníkov.

Ak je študovaná náhodná premenná spojitá, potom poradie a zoskupenie pozorovaných hodnôt často neumožňujú vyčleniť charakterové rysy meniace sa jeho hodnoty. Je to kvôli individuálnym hodnotám náhodná premenná sa môžu navzájom líšiť tak málo, ako je žiaduce, a preto sa v súhrne pozorovaných údajov zriedkavo môžu vyskytnúť rovnaké hodnoty množstva a frekvencie variantov sa od seba líšia len málo.

Je tiež nepraktické zostaviť diskrétnu sériu pre diskrétnu náhodnú premennú, ktorej počet možných hodnôt je veľký. V takýchto prípadoch by sa malo stavať intervalové variačné série distribúcia.

Na vytvorenie takejto série je celý interval variácií pozorovaných hodnôt náhodnej premennej rozdelený do série čiastkové intervaly a počítanie frekvencie výskytu hodnôt magnitúdy v každom čiastočnom intervale.

interval variačný rad nazývaný usporiadaný súbor intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo relatívnymi frekvenciami zásahov v každej z hodnôt hodnoty.

Na zostavenie intervalovej série potrebujete:

  1. definovať hodnotu čiastočné intervaly;
  2. definovať šírka intervaly;
  3. nastavte pre každý interval to top a nižšia hranica ;
  4. zoskupiť výsledky pozorovania.

1 . O otázke výberu počtu a šírky intervalov zoskupovania je potrebné rozhodnúť v každom konkrétnom prípade na základe Ciele výskum, objem odber vzoriek a stupeň variácie funkcia vo vzorke.

Približný počet intervalov k možno odhadnúť len z veľkosti vzorky n jedným z nasledujúcich spôsobov:

  • podľa vzorca Sturges : k = 1 + 3,32 log n ;
  • pomocou tabuľky 1.

stôl 1

2 . Vo všeobecnosti sú preferované intervaly rovnakej šírky. Na určenie šírky intervalov h vypočítať:

  • rozsah variácií R - vzorové hodnoty: R = x max - x min ,

kde xmax a xmin - možnosti maximálnej a minimálnej vzorky;

  • šírka každého intervalu h určuje sa podľa nasledujúceho vzorca: h = R/k .

3 . Spodná čiara prvý interval x h1 sa volí tak, aby minimálny vzorový variant xmin klesol približne v strede tohto intervalu: x h1 = x min - 0,5 h .

Intervaly získaná pripočítaním dĺžky čiastkového intervalu ku koncu predchádzajúceho intervalu h :

xhi = xhi-1 + h.

Konštrukcia škály intervalov na základe výpočtu hraníc intervalov pokračuje až do hodnoty x ahoj vyhovuje vzťahu:

x ahoj< x max + 0,5·h .

4 . V súlade so stupnicou intervalov sú hodnoty atribútu zoskupené - pre každý čiastkový interval sa vypočíta súčet frekvencií n i zachytený variant i -tý interval. V tomto prípade interval obsahuje hodnoty náhodnej premennej väčšie alebo rovné dolnej hranici a menšie ako horná hranica intervalu.

Polygón a histogram

Pre prehľadnosť sú zostavené rôzne grafy štatistického rozdelenia.

Na základe údajov diskrétnych variačných radov konštruujeme mnohouholník frekvencie alebo relatívnej frekvencie.

Frekvenčný polygón x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Na vytvorenie mnohouholníka frekvencií na osi x sú možnosti vyčlenené x i a na osi y - zodpovedajúce frekvencie n i . Body ( x i ; n i ) sú spojené segmentmi priamych čiar a získa sa frekvenčný mnohouholník (obr. 1).

Polygón relatívnej frekvencie sa nazýva lomená čiara, ktorej segmenty spájajú body ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; Wk ). Ak chcete vytvoriť mnohouholník relatívnych frekvencií na úsečke, zrušte možnosti x i a na osi y - im zodpovedajúce relatívne frekvencie Wi . Body ( x i ; Wi ) sú spojené segmentmi priamych čiar a získa sa mnohouholník relatívnych frekvencií.

Kedy súvislá vlastnosť je účelné stavať histogram .

frekvenčný histogram nazývaný stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastkové intervaly dĺžky h a výšky sa rovnajú pomeru NIH (hustota frekvencie).

Na vytvorenie histogramu frekvencií sa na os x vynesú čiastočné intervaly a nad nimi sa nakreslia segmenty rovnobežne s osou x vo vzdialenosti NIH .

2. Koncept distribučnej série. Diskrétne a intervalové distribučné rady

distribučné riadky nazývajú sa zoskupenia špeciálneho typu, v ktorých je pre každý atribút, skupinu atribútov alebo triedu atribútov známy počet jednotiek v skupine alebo podiel tohto počtu na celkovom súčte. Tie. distribučná séria– usporiadaná množina hodnôt atribútov usporiadaných vzostupne alebo zostupne s ich zodpovedajúcimi váhami. Distribučné rady môžu byť zostavené buď podľa kvantitatívneho alebo podľa atribútu.

Distribučné série postavené na kvantitatívnom základe sa nazývajú variačné série. Oni sú diskrétne a intervalové. Distribučný rad môže byť postavený na kontinuálne sa meniacej funkcii (keď funkcia môže nadobúdať ľubovoľné hodnoty v rámci intervalu) a na diskrétne sa meniacej funkcii (nadobúda presne definované celočíselné hodnoty).

diskrétne séria variačných distribúcií je súbor variantov s ich zodpovedajúcimi frekvenciami alebo podrobnosťami. Varianty diskrétnej série sú diskrétne diskontinuálne sa meniace hodnoty znamienka, zvyčajne je to výsledok počítania.

Diskrétne

série variácií sa zvyčajne zostavujú, ak sa hodnoty študovaného znaku môžu navzájom líšiť aspoň o určitú konečnú hodnotu. V diskrétnych sériách sú špecifikované bodové hodnoty prvku. Príklad : Distribúcia pánskych oblekov predávaných predajňami za mesiac podľa veľkosti.

interval

variačná séria je usporiadaná množina intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo frekvenciami hodnôt množstva, ktoré spadajú do každej z nich. Intervalové rady sú určené na analýzu rozloženia neustále sa meniaceho znaku, ktorého hodnota sa najčastejšie zaznamenáva meraním alebo vážením. Varianty takéhoto radu je zoskupenie.

Príklad : Rozdelenie nákupov v obchode s potravinami podľa sumy.

Ak sa v diskrétnych variačných radoch frekvenčná odozva vzťahuje priamo na variant radu, potom v intervalových na skupinu variantov.

Rozdelenie radov je vhodné analyzovať pomocou ich grafického znázornenia, čo umožňuje posúdiť formu rozdelenia aj vzory. Diskrétne série zobrazené na grafe ako prerušovaná čiara - distribučná oblasť. Aby ste ho vytvorili v pravouhlom súradnicovom systéme, zoradené (usporiadané) hodnoty premenlivého atribútu sa vynesú na úsečku v rovnakej mierke a stupnica na vyjadrenie frekvencií sa vynesie pozdĺž ordináty.

Intervalové série sú zobrazené ako distribučné histogramy(t.j. stĺpcové grafy).

Pri konštrukcii histogramu sú hodnoty intervalov vynesené na osi x a frekvencie sú znázornené obdĺžnikmi vytvorenými na zodpovedajúcich intervaloch. Výška stĺpcov v prípade rovnakých intervalov by mala byť úmerná frekvenciám.

Akýkoľvek histogram je možné previesť na mnohouholník rozložení, preto je potrebné spojiť vrcholy jeho obdĺžnikov s rovnými segmentmi.

2. Indexová metóda na analýzu vplyvu priemernej produkcie a priemerného počtu zamestnancov na zmeny produkcie

Indexová metóda slúži na analýzu dynamiky a porovnanie všeobecných ukazovateľov, ako aj faktorov ovplyvňujúcich zmenu úrovní týchto ukazovateľov. Pomocou indexov je možné odhaliť vplyv priemerného výkonu a priemerného počtu zamestnancov na zmeny v objeme výroby. Tento problém je vyriešený vytvorením systému analytických indexov.

Index objemu výroby s indexom priemerného počtu zamestnancov a indexom priemernej produkcie súvisí rovnako, ako objem produkcie (Q) súvisí s produkciou ( w) a číslo ( r) .

Môžeme konštatovať, že objem výroby sa bude rovnať súčinu priemerného výkonu a priemerného počtu zamestnancov:

Q = w r, kde Q je objem výroby,

w - priemerný výkon,

r je priemerný počet zamestnancov.

Ako je vidieť, rozprávame sa o vzťahu javov v statike: súčin dvoch faktorov udáva celkový objem výsledného javu. Je tiež zrejmé, že toto spojenie je funkčné, preto sa dynamika tohto spojenia študuje pomocou indexov. Pre uvedený príklad je to nasledujúci systém:

Jw × Jr = Jwr.

Napríklad index objemu výroby Jwr, ako index výsledného javu, možno rozložiť na dva indexové faktory: index priemernej produkcie (Jw) a index priemerného počtu zamestnancov (Jr):

Index Index Index

objem priemeru

výstupná sila výroby

kde J w- index produktivity práce vypočítaný podľa Laspeyresovho vzorca;

J r- index počtu zamestnancov, vypočítaný podľa Paascheho vzorca.

Indexové systémy slúžia na určenie vplyvu jednotlivých faktorov na tvorbu úrovne efektívneho ukazovateľa, umožňujú určiť hodnotu neznámeho 2 známymi hodnotami indexu.

Na základe vyššie uvedenej sústavy indexov možno zistiť aj absolútny nárast objemu produkcie, rozložený na vplyv faktorov.

1. Celkový nárast objemu výroby:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Rast v dôsledku pôsobenia ukazovateľa priemerného výstupu:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Rast v dôsledku pôsobenia ukazovateľa priemerného počtu zamestnancov:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Príklad. Nasledujúce informácie sú známe

Vieme určiť, ako sa zmenil objem produkcie v relatívnom a absolútnom vyjadrení a ako jednotlivé faktory túto zmenu ovplyvnili.

Objem výroby predstavoval:

v základnom období

w 0 * r 0 \u003d 2000 * 90 \u003d 180 000,

a v prehľadoch

w 1 * r 1 \u003d 2100 * 100 \u003d 210000.

V dôsledku toho sa objem výroby zvýšil o 30 000 alebo 1,16%.

∆wr=∑w 1 r 1 - ∑w 0 r 0= (210000-180000)=30000

alebo (210000:180000)*100%=1,16%.

Táto zmena v objeme výroby bola spôsobená:

1) zvýšenie priemerného počtu zamestnancov o 10 osôb alebo o 111,1 %

r 1 / r 0 \u003d 100/90 \u003d 1,11 alebo 111,1 %.

V absolútnom vyjadrení sa vďaka tomuto faktoru objem výroby zvýšil o 20 000:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

2) zvýšenie priemernej produkcie o 105 % alebo o 10 000:

w 1 r 1 / w 0 r 1 \u003d 2100 * 100 / 2000 * 100 \u003d 1,05 alebo 105%.

V absolútnom vyjadrení je nárast:

w 1 r 1 - w 0 r 1 \u003d (w 1 - w 0) r 1 \u003d (2100-2000) * 100 \u003d 10000.

Kombinovaný vplyv faktorov bol teda:

1. V absolútnom vyjadrení

10000 + 20000 = 30000

2. V relatívnom vyjadrení

1,11 * 1,05 = 1,16 (116%)

Nárast je teda 1,16 %. Oba výsledky boli získané skôr.

Slovo „index“ v preklade znamená ukazovateľ, ukazovateľ. V štatistike sa index interpretuje ako relatívny ukazovateľ, ktorý charakterizuje zmenu javu v čase, priestore alebo v porovnaní s plánom. Keďže index je relatívna hodnota, názvy indexov sú v súlade s názvami relatívnych hodnôt.

V prípadoch, keď analyzujeme zmenu porovnávaného produktu v čase, môžeme si položiť otázku, ako v rôzne podmienky(v rôznych oblastiach) sa menia zložky indexu (cena, fyzický objem, štruktúra produkcie či tržieb). určité typy Produkty). V tomto ohľade sa budujú indexy konštantného zloženia, variabilného zloženia a štrukturálnych posunov.

Trvalý (pevný) index zloženia - ide o index, ktorý charakterizuje dynamiku priemernej hodnoty pri rovnakej fixnej ​​štruktúre obyvateľstva.

Princípom konštrukcie indexu konštantného zloženia je eliminovať vplyv zmien v štruktúre váh na indexovanú hodnotu výpočtom úrovne váženého priemeru indexovaného ukazovateľa s rovnakými váhami.

Index konštantného zloženia je vo forme identický s agregovaným indexom. Súhrnná forma je najbežnejšia.

Konštantný index zloženia sa počíta s váhami pevne stanovenými na úrovni jedného z ľubovoľného obdobia a zobrazuje zmenu iba v indexovanej hodnote. Konštantný index zloženia eliminuje vplyv zmien v štruktúre váh na indexovanú hodnotu výpočtom váženej priemernej úrovne indexovaného indikátora s rovnakými váhami. V indexoch konštantného zloženia sa porovnávajú ukazovatele vypočítané na základe konštantnej štruktúry javov.

Pri spracovávaní veľkého množstva informácií, čo je obzvlášť dôležité pri vykonávaní moderného vedeckého vývoja, výskumník čelí vážnej úlohe správneho zoskupenia počiatočných údajov. Ak sú údaje diskrétne, potom, ako sme videli, neexistujú žiadne problémy - stačí vypočítať frekvenciu každej funkcie. Ak má skúmaná vlastnosť nepretržitý znak (čo je v praxi bežnejšie), potom nie je výber optimálneho počtu intervalov na zoskupenie znaku v žiadnom prípade triviálnou úlohou.

Na zoskupenie spojitých náhodných premenných je celý rozsah variácií prvku rozdelený do určitého počtu intervalov do.

Zoskupený interval (nepretržitý) variačný rad nazývané intervaly zoradené podľa hodnoty znaku (), kde je spolu s príslušnými frekvenciami () označený počet pozorovaní, ktoré spadali do r "tého intervalu, alebo relatívne frekvencie ():

Charakteristické intervaly hodnôt

mi frekvencia

stĺpcový graf a kumulovať (ogiva), ktoré sme už podrobne rozoberali, sú vynikajúcim nástrojom na vizualizáciu údajov, ktorý vám umožní primárne pochopiť štruktúru údajov. Takéto grafy (obr. 1.15) sú zostavené pre spojité dáta rovnakým spôsobom ako pre diskrétne dáta, len s prihliadnutím na skutočnosť, že spojité dáta úplne vypĺňajú oblasť svojich možných hodnôt, pričom majú akékoľvek hodnoty.

Ryža. 1.15.

Preto stĺpce na histograme a kumulácii musia byť v kontakte, nesmú mať oblasti, kde hodnoty atribútov nespadajú do všetkých možných(t. j. histogram a kumulácia by nemali mať pozdĺž osi x "diery", do ktorých neklesajú hodnoty skúmanej premennej, ako na obr. 1.16). Výška stĺpca zodpovedá frekvencii - počtu pozorovaní, ktoré spadajú do daného intervalu, alebo relatívnej frekvencii - podielu pozorovaní. Intervaly nesmie prekročiť a zvyčajne majú rovnakú šírku.

Ryža. 1.16.

Histogram a polygón sú aproximáciou krivky hustoty pravdepodobnosti (diferenciálna funkcia) f(x) teoretické rozdelenie, uvažované v rámci teórie pravdepodobnosti. Preto má ich konštrukcia taký význam pri primárnom štatistickom spracovaní kvantitatívnych spojitých údajov - podľa ich tvaru možno usudzovať na zákon hypotetického rozdelenia.

Kumulovať - ​​krivka akumulovaných frekvencií (frekvencií) intervalových variačných radov. Graf integrálnej distribučnej funkcie sa porovnáva s kumuláciou F(x), tiež uvažované v rámci teórie pravdepodobnosti.

V zásade sú pojmy histogram a kumulácie spojené presne so spojitými údajmi a ich intervalovými variačnými sériami, pretože ich grafy sú empirickými odhadmi funkcie hustoty pravdepodobnosti a distribučnej funkcie.

Konštrukcia intervalového variačného radu začína určením počtu intervalov k. A táto úloha je azda najťažšia, najdôležitejšia a najkontroverznejšia v skúmanej problematike.

Počet intervalov by nemal byť príliš malý, pretože histogram bude príliš hladký ( prehladený), stráca všetky znaky variability východiskových údajov – na obr. 1.17 vidno, ako tie isté údaje, na ktorých sú grafy na obr. 1.15 sa používajú na zostavenie histogramu s menším počtom intervalov (ľavý graf).

Počet intervalov by zároveň nemal byť príliš veľký - inak nebudeme môcť odhadnúť hustotu distribúcie skúmaných údajov pozdĺž číselnej osi: histogram sa ukáže ako nedostatočne vyhladený (nevyhladený) s nevyplnenými intervalmi, nerovnomerné (pozri obr. 1.17, pravý graf).

Ryža. 1.17.

Ako určiť najviac preferovaný počet intervalov?

Už v roku 1926 Herbert Sturges navrhol vzorec na výpočet počtu intervalov, do ktorých je potrebné rozdeliť počiatočnú množinu hodnôt študovaného atribútu. Tento vzorec sa skutočne stal veľmi populárnym - väčšina štatistických učebníc ho ponúka a mnohé štatistické balíky ho štandardne používajú. Či je to opodstatnené a vo všetkých prípadoch je to veľmi vážna otázka.

Na čom je teda Sturgesov vzorec založený?

Zvážte binomické rozdelenie)

Páčil sa vám článok? Zdieľaj to