Kontakty

Zoskupovanie údajov a vytváranie distribučných radov. Konštrukcia diskrétnej variačnej série

Ak máme k dispozícii štatistické pozorovacie údaje charakterizujúce konkrétny jav, je potrebné ich v prvom rade usporiadať, t.j. dať systematický charakter

anglický štatistik. UJReichman o neusporiadaných zbierkach obrazne povedal, že stretnutie s množstvom nezobecnených údajov sa rovná situácii, keď je človek bez kompasu hodený do húštiny. Aká je systematizácia štatistických údajov vo forme distribučných radov?

Štatistické rady rozdelenia sú usporiadané štatistické agregáty (tabuľka 17). Najjednoduchším typom štatistického distribučného radu je rad zoradený, t.j. rad čísel vo vzostupnom alebo zostupnom poradí, ktoré menia charakteristiky. Takáto séria neumožňuje posúdiť vzorce obsiahnuté v distribuovaných údajoch: ktorá hodnota má zoskupenú väčšinu ukazovateľov, aké sú odchýlky od tejto hodnoty; ako aj celkový obraz distribúcie. Na tento účel sú údaje zoskupené a ukazujú, ako často sa jednotlivé pozorovania vyskytujú v ich celkovom počte (schéma 1a 1).

. Tabuľka 17

. Všeobecná forma štatistický rad distribúcia

. Schéma 1. Štatistická schéma distribučná séria

Rozdelenie populačných jednotiek podľa charakteristík, ktoré nemajú kvantitatívne vyjadrenie, sa nazýva tzv atribútový rad(napríklad rozdelenie podnikov podľa ich výrobnej oblasti)

Rad rozdelenia jednotiek populácie podľa charakteristík, majú kvantitatívne vyjadrenie, sú tzv variačná séria. V takýchto radoch sú hodnoty charakteristiky (možnosti) vo vzostupnom alebo zostupnom poradí

Vo variačnom distribučnom rade sa rozlišujú dva prvky: varianty a frekvencia . Možnosť- toto je samostatný význam charakteristík zoskupenia frekvencia- číslo, ktoré ukazuje, koľkokrát sa každá možnosť vyskytne

V matematickej štatistike sa počíta ešte jeden prvok variačného radu - čiastočne. Ten je definovaný ako pomer frekvencie prípadov daného intervalu k celkovému súčtu frekvencií časť je určená v zlomkoch jednotky, percento (%) v ppm (%o)

Séria distribúcie variácií je teda séria, v ktorej sú možnosti usporiadané vo vzostupnom alebo zostupnom poradí a sú uvedené ich frekvencie alebo frekvencie. Variačné rady sú diskrétne (intervaly) a ostatné intervaly (spojité).

. Séria diskrétnych variácií- ide o distribučné rady, v ktorých variant ako hodnota kvantitatívnej charakteristiky môže nadobudnúť len určitú hodnotu. Možnosti sa navzájom líšia jednou alebo viacerými jednotkami

Počet vyrobených dielov za zmenu konkrétnym pracovníkom teda môže byť vyjadrený len jedným určitý počet(6, 10, 12 atď.). Príkladom série diskrétnych variácií môže byť rozdelenie pracovníkov podľa počtu vyrobených dielov (tabuľka 18 18).

. Tabuľka 18

. Diskrétna distribúcia sérií _

. Intervalový (kontinuálny) variačný rad- také distribučné rady, v ktorých sa hodnota opcií uvádza vo forme intervalov, t.j. hodnoty vlastností sa môžu navzájom líšiť o ľubovoľne malé množstvo. Pri konštrukcii série variácií perivariantných charakteristík NEP nie je možné označiť každú hodnotu variantu, takže populácia je rozdelená do intervalov. Posledné môžu byť rovnaké alebo nerovnaké. Pre každý z nich sú uvedené frekvencie alebo frekvencie (tabuľka 1 9 19).

V intervalových distribučných radoch s nerovnakými intervalmi sa vypočítajú matematické charakteristiky, ako je hustota distribúcie a relatívna hustota distribúcie na danom intervale. Prvá charakteristika je určená pomerom frekvencie k hodnote toho istého intervalu, druhá - pomerom frekvencie k hodnote toho istého intervalu. Vo vyššie uvedenom príklade bude hustota distribúcie v prvom intervale 3: 5 = 0,6 a relatívna hustota v tomto intervale je 7,5: 5 = 1,55 %.

. Tabuľka 19

. Intervalové distribučné série _

Čo je to zoskupenie štatistických údajov a ako súvisí s distribučnými radmi, sme rozoberali v tejto prednáške, kde sa dozviete aj o tom, čo je diskrétny a variačný distribučný rad.

Distribučné rady sú jednou z odrôd štatistických radov (okrem nich sa v štatistike používajú dynamické rady), používajú sa na analýzu údajov o javoch. verejný život. Vytvorenie variačnej série je celkom uskutočniteľná úloha pre každého. Existujú však pravidlá, ktoré je potrebné mať na pamäti.

Ako zostaviť diskrétny variačný distribučný rad

Príklad 1 Existujú údaje o počte detí v 20 skúmaných rodinách. Zostavte diskrétnu sériu variácií rodinné rozdelenie podľa počtu detí.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Riešenie:

  1. Začnime rozložením tabuľky, do ktorej následne zadáme údaje. Keďže distribučné riadky majú dva prvky, tabuľka bude pozostávať z dvoch stĺpcov. Prvý stĺpec je vždy možnosť - čo študujeme - názov preberáme z úlohy (koniec vety s úlohou v podmienkach) - podľa počtu detí– to znamená, že naša voľba je počet detí.

Druhý stĺpec je frekvencia - ako často sa náš variant vyskytuje v skúmanom jave - názov stĺpca preberáme aj z úlohy - rodinné rozdelenie – to znamená, že naša frekvencia je počet rodín s príslušným počtom detí.

  1. Teraz zo zdrojových údajov vyberieme tie hodnoty, ktoré sa vyskytnú aspoň raz. V našom prípade je

A usporiadajme tieto údaje v prvom stĺpci našej tabuľky v logickom poradí, v tomto prípade zvyšovaním od 0 do 4. Získame

A nakoniec spočítajme, koľkokrát sa každá hodnota variantu objaví.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

V dôsledku toho získame vyplnenú tabuľku alebo požadovaný riadok rozdelenia rodín podľa počtu detí.

Cvičenie . Existujú údaje o tarifných kategóriách 30 pracovníkov v podniku. Vytvorte diskrétnu sériu variácií na rozdelenie pracovníkov podľa tarifnej kategórie. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Ako zostaviť intervalový variačný distribučný rad

Zostrojme intervalový distribučný rad a uvidíme, ako sa jeho konštrukcia líši od diskrétneho radu.

Príklad 2 Existujú údaje o výške zisku prijatého 16 podnikmi, milióny rubľov. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Zostrojte intervalový variačný rad rozdelenia podnikov podľa objemu zisku, pričom identifikujte 3 skupiny s rovnakými intervalmi.

Všeobecným princípom konštrukcie série, samozrejme, zostanú rovnaké dva stĺpce, rovnaké možnosti a frekvencia, ale v tomto prípade budú možnosti umiestnené v intervale a frekvencie sa budú počítať inak.

Riešenie:

  1. Začnime podobne ako v predchádzajúcej úlohe zostavením rozloženia tabuľky, do ktorej následne zadáme údaje. Keďže distribučné riadky majú dva prvky, tabuľka bude pozostávať z dvoch stĺpcov. Prvý stĺpec je vždy možnosť - čo študujeme - názov preberáme z úlohy (koniec vety s úlohou v podmienkach) - podľa výšky zisku - čo znamená, že naša možnosť je výška získaného zisku .

Druhý stĺpec je frekvencia - ako často sa náš variant vyskytuje v skúmanom jave - názov stĺpca preberáme aj z úlohy - rozdelenie podnikov - čiže naša frekvencia je počet podnikov s príslušným ziskom, v r. tento prípad spadá do intervalu.

V dôsledku toho bude naše rozloženie tabuľky vyzerať takto:

kde i je hodnota alebo dĺžka intervalu,

Xmax a Xmin – maximálna a minimálna hodnota atribútu,

n je požadovaný počet skupín podľa podmienok úlohy.

Vypočítajme veľkosť intervalu pre náš príklad. Aby sme to urobili, medzi počiatočnými údajmi nájdeme najväčší a najmenší

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – maximálna hodnota je 118 miliónov rubľov a minimálna je 9 miliónov rubľov. Vykonajte výpočet pomocou vzorca.

Vo výpočte nám vyšlo číslo 36, (3) tri v perióde, v takýchto situáciách treba hodnotu intervalu zaokrúhliť nahor, aby sa po výpočtoch nestratilo maximum údajov, preto vo výpočte hodnota interval je 36,4 milióna rubľov.

  1. Teraz zostrojme intervaly - naše možnosti v tomto probléme. Prvý interval sa začne zostavovať z minimálnej hodnoty, k nemu sa pripočíta hodnota intervalu a získa sa horná hranica prvého intervalu. Potom sa horná hranica prvého intervalu stane spodnou hranicou druhého intervalu, hodnota intervalu sa k nej pripočíta a získa sa druhý interval. A tak ďalej toľkokrát, koľkokrát je potrebné zostrojiť intervaly podľa podmienky.

Všimnime si, že ak by sme nezaokrúhlili hodnotu intervalu na 36,4, ale nechali ju na 36,3, tak posledná hodnota by bola 117,9. Aby sa predišlo strate údajov, je potrebné zaokrúhliť hodnotu intervalu na väčšiu hodnotu.

  1. Spočítajme počet podnikov spadajúcich do každého konkrétneho intervalu. Pri spracovaní údajov musíte pamätať na to, že horná hodnota intervalu v danom intervale sa neberie do úvahy (nie je zahrnutá v tomto intervale), ale je zohľadnená v nasledujúcom intervale (spodná hranica intervalu je zahrnutá). v tomto intervale a horný nie je zahrnutý), s výnimkou posledného intervalu.

Pri vykonávaní spracovania údajov je najlepšie označiť vybrané údaje symbolmi alebo farbami, aby sa spracovanie zjednodušilo.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Označujeme prvý interval žltá- a určiť, koľko údajov spadá do intervalu od 9 do 45,4, pričom týchto 45,4 sa bude brať do úvahy v druhom intervale (za predpokladu, že je v údajoch) - nakoniec dostaneme 7 podnikov v prvom intervale. A tak ďalej vo všetkých intervaloch.

  1. (dodatočná akcia) Vypočítajme celkovú výšku zisku prijatého podnikmi pre každý interval a vo všeobecnosti. Ak to chcete urobiť, spočítajte údaje označené rôznymi farbami a získate celkovú hodnotu zisku.

Pre prvý interval - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 miliónov rubľov.

Pre druhý interval - 48 + 57 + 48 + 56 + 63 = 272 miliónov rubľov.

Pre tretí interval - 118 + 87 + 98 + 88 = 391 miliónov rubľov.

Cvičenie . Existujú údaje o výške vkladov v banke 30 vkladateľov, tisíc rubľov. 150, 120, 300, 650, 1 500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Stavať intervalové variačné série rozdelenie vkladateľov podľa veľkosti vkladu, pričom sa identifikujú 4 skupiny s rovnakými intervalmi. Pre každú skupinu vypočítajte celkovú výšku vkladov.

Štatistiky študované charakteristiky sa líšia (odlišujú sa od seba) medzi rôznymi jednotkami populácie v rovnakom období alebo časovom bode. Napríklad výška obratu zahraničného obchodu sa líši medzi divíziami Federálnej colnej služby; výška vývozu (dovozu) sa líši podľa smeru vývozu (pre rôzne partnerské krajiny v zahraničnom obchode), podľa druhu tovaru a pod.

Dôvod variácie sú rôzne podmienky existencie rôznych jednotiek totality. Napríklad, obrovské číslo dôvodov ovplyvňuje rozsah zahraničného obchodu v rôznych krajinách sveta.

Na riadenie a štúdium variácie pomocou štatistiky boli vyvinuté špeciálne metódy na štúdium variácie, systém ukazovateľov, pomocou ktorých sa variácie merajú a charakterizujú sa jej vlastnosti.

Prvou fázou štatistického skúmania variácie je konštrukcia distribučná séria(alebo variačná séria) – usporiadané rozdelenie jednotiek populácie podľa rastúcich (častejšie) alebo klesajúcich (menej často) hodnôt charakteristiky a počítaním počtu jednotiek s konkrétnou hodnotou charakteristiky.

Sú tam 3 milý distribučný riadok:

1) hodnotená séria– ide o zoznam jednotlivých jednotiek populácie vo vzostupnom poradí podľa skúmanej charakteristiky (napríklad tabuľka 11); ak je počet populačných jednotiek dostatočne veľký, zoradený rad sa stáva ťažkopádnym a v takýchto prípadoch sa distribučný rad zostavuje zoskupením populačných jednotiek podľa hodnôt študovanej charakteristiky (ak charakteristika neberie veľké číslo hodnoty, potom buduje diskrétne série, a inak – intervalové rady);

2) diskrétne série- toto je tabuľka pozostávajúca z dvoch stĺpcov (riadkov) - konkrétne hodnoty premenlivej charakteristiky Xi a počet populačných jednotiek s danou charakteristickou hodnotou fi- frekvencie; počet skupín v diskrétnej sérii je určený počtom skutočne existujúcich hodnôt meniacej sa charakteristiky;

3) intervalové série- toto je tabuľka pozostávajúca z dvoch stĺpcov (riadkov) - intervalov s rôznou charakteristikou Xi a počet jednotiek populácie spadajúcich do daného intervalu (frekvencií), alebo podiel tohto počtu v celkový počet agregáty (frekvencie).

Zostrojme sériu rozdelenia obratu zahraničného obchodu (FO) na colných staniciach v Rusku, pre ktoré je potrebné vykonať štatistické pozorovanie, teda zbierať primárny štatistický materiál, ktorý predstavuje hodnotu VO na colných staniciach.

Výsledky pozorovania VO na 35 colných miestach v kraji za sledované obdobie predstavíme vo forme distribučného radu zoradeného podľa zvyšujúcej sa hodnoty VO (tabuľka 11).

Tabuľka 11. Obrat zahraničného obchodu (FO) pre 35 colných staníc, milión dolárov.

Číslo príspevku

Číslo príspevku

Číslo príspevku

Poďme definovať priemerná veľkosť VO podľa vzorca (10), pričom ako X hodnotu VO a pre N- počet príspevkov:

= = 2100/35 = 60 (milión dolárov)

Rozptyl určíme (hovoríme o ňom trochu neskôr - v 4. štádiu analýzy variácie v tejto téme) pomocou vzorca (28):

= = 445,778 (2 milióny dolárov)

Zostrojme intervalový rad rozdelenia VO colnými poštami, pre ktoré je potrebné zvoliť optimálny počet skupín (atribútových intervalov) a nastaviť dĺžku (rozsah) intervalu. Keďže pri analýze distribučného radu sa porovnávajú frekvencie v rôznych intervaloch, je potrebné, aby dĺžka intervalov bola konštantná. Optimálny počet skupín sa volí tak, aby sa dostatočne odrážala diverzita hodnôt atribútov v súhrne a zároveň nedošlo k skresleniu distribučného vzoru náhodnými frekvenčnými výkyvmi. Ak je skupín príliš málo, vzor variácie sa nezobrazí; ak je skupín príliš veľa, náhodné frekvenčné skoky skreslia tvar rozloženia.

Najčastejšie sa počet skupín v distribučnej sérii určuje pomocou Sturgessovho vzorca (19) alebo (20):

(19) resp ,(20)

Kde k– počet skupín (zaokrúhlený na najbližšie celé číslo); N- veľkosť populácie.

Zo Sturgessovho vzorca je zrejmé, že počet skupín je funkciou objemu údajov ( N).

Keď poznáte počet skupín, vypočítajte dĺžku (rozpätie) intervalu pomocou vzorca (21):

,(21)

Kde X max a X min - maximálne a minimálne hodnoty spolu.

V našom príklade o VO pomocou Sturgessovho vzorca (19) určíme počet skupín:

k = 1 + 3,322lg 35 = 1+ 3,322*1,544 = 6,129 ≈ 6.

Vypočítajme dĺžku (rozpätie) intervalu pomocou vzorca (21):

h= (111,16 – 24,16)/6 = 87/6 = 14,5 (milión dolárov).

Teraz zostavme intervalovú sériu so 6 skupinami s intervalom 14,5 milióna dolárov. (pozri prvé 3 stĺpce tabuľky 12).

Tabuľka 12. Intervalové série distribúcie VO colnými poštami, milióny dolárov.

Skupiny príspevkov podľa veľkosti VO

Počet príspevkov

Stred intervalu

X ja fi

Akumulácia frekvencia

| Xi- |fi

(Xi- )2 fi

(Xi- )3 fi

(Xi- )4 fi

96,66 – 111,16

Grafické znázornenie poskytuje významnú pomoc pri analýze distribučného radu a jeho vlastností. Intervalový rad je znázornený stĺpcovým grafom, v ktorom základne stĺpcov umiestnené pozdĺž osi x sú intervaly hodnôt premenlivej charakteristiky a výšky stĺpcov sú frekvencie zodpovedajúce mierke pozdĺž osi y. os. Grafické znázornenie rozloženia colných zásielok vo vzorke podľa hodnoty VO je na obr. 4. Tento typ diagramu sa nazýva histogram .

Ryža. 4. Histogram distribúcie Obr. 5. Distribučný polygón

Tabuľkové údaje 12 a obr. 4 ukazujú distribučný tvar charakteristický pre mnohé charakteristiky: hodnoty priemerných intervalov charakteristiky sú bežnejšie a extrémne (malé a veľké) hodnoty charakteristiky sú menej bežné. Tvar tohto rozdelenia je blízky zákonu normálneho rozdelenia, ktorý vzniká, ak je premenná premenná ovplyvňovaná veľkým počtom faktorov, z ktorých žiadny nemá prevažujúci význam.

Ak existuje diskrétny distribučný rad alebo sa použijú stredy intervalov (ako v našom príklade o VO - v tabuľke 12 v 4. stĺpci sú stredy intervalov vypočítané ako polovičný súčet hodnôt začiatku a koniec intervalu), potom sa nazýva grafické znázornenie takéhoto radu mnohouholník(pozri obr. 5), ktorý získame spojením bodov so súradnicami priamkami Xi A fi.

Príklad riešenia testu z matematickej štatistiky

Problém 1

Počiatočné údaje : študenti určitej skupiny pozostávajúcej z 30 ľudí zložili skúšku z kurzu „Informatika“. Známky, ktoré študenti dostanú, tvoria nasledujúci rad čísel:

I. Vytvorme variačný rad

m X

w X

m X nak

w X nak

Celkom:

II. Grafické znázornenie štatistických informácií.

III. Číselné charakteristiky vzorky.

1. Aritmetický priemer

2. Geometrický priemer

3. Móda

4. Medián

222222333333333 | 3 34444444445555

5. Rozptyl vzorky

7. Variačný koeficient

8. Asymetria

9. Koeficient asymetrie

10. Prebytok

11. Kurtózny koeficient

Problém 2

Počiatočné údaje : Žiaci určitej skupiny písali záverečný test. Skupinu tvorí 30 ľudí. Body dosiahnuté študentmi tvoria nasledujúci rad čísel

Riešenie

I. Keďže charakteristika nadobúda veľa rôznych hodnôt, zostrojíme pre ňu intervalový variačný rad. Najprv nastavte hodnotu intervalu h. Použime Stangerov vzorec

Vytvorme intervalovú stupnicu. V tomto prípade budeme brať ako hornú hranicu prvého intervalu hodnotu určenú vzorcom:

Horné hranice nasledujúcich intervalov určujeme pomocou nasledujúceho opakujúceho sa vzorca:

, Potom

Dokončujeme konštrukciu intervalovej stupnice, pretože horná hranica nasledujúceho intervalu je väčšia alebo rovná maximálnej hodnote vzorky
.

II. Grafické zobrazenie intervalových variačných sérií

III. Číselné charakteristiky vzorky

Na zistenie číselných charakteristík vzorky zostavíme pomocnú tabuľku

Sum:

1. Aritmetický priemer

2. Geometrický priemer

3. Móda

4. Medián

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Rozptyl vzorky

6. Štandardná odchýlka vzorky

7. Variačný koeficient

8. Asymetria

9. Koeficient asymetrie

10. Prebytok

11. Kurtózny koeficient

Problém 3

Podmienka : hodnota dielika ampérmetra je 0,1 A. Hodnoty sú zaokrúhlené na najbližší celý dielik. Nájdite pravdepodobnosť, že počas čítania dôjde k chybe, ktorá prekročí 0,02 A.

Riešenie.

Chybu zaokrúhľovania vzorky možno považovať za náhodnú premennú X, ktorá je rozložená rovnomerne v intervale medzi dvoma susednými celočíselnými dielikmi. Rovnomerná hustota distribúcie

Kde
- dĺžka intervalu obsahujúceho možné hodnoty X; mimo tohto intervalu
V tomto probléme je dĺžka intervalu obsahujúceho možné hodnoty X, sa rovná 0,1, takže

Chyba čítania presiahne 0,02, ak je v intervale (0,02; 0,08). Potom

odpoveď: R=0,6

Problém 4

Počiatočné údaje: matematické očakávanie a smerodajná odchýlka normálne rozloženej charakteristiky X rovná 10 a 2. Nájdite pravdepodobnosť, že ako výsledok testu X bude mať hodnotu obsiahnutú v intervale (12, 14).

Riešenie.

Použime vzorec

A teoretické frekvencie

Riešenie

Pre X je jeho matematické očakávanie M(X) a rozptyl D(X). Riešenie. Nájdite distribučnú funkciu F(x) náhodná premenná... chyba vzorky). Poďme skladať variačný riadokŠírka intervalu bude: Pre každú hodnotu riadok Poďme si spočítať, koľko...

  • Riešenie: separovateľná rovnica

    Riešenie

    Vo forme Ak chcete nájsť kvocient riešenia nehomogénna rovnica poďme sa nalíčiť systém Vyriešme výsledný systém... ; +47; +61; +10; -8. Interval zostavenia variačný riadok. Uveďte štatistické odhady priemernej hodnoty...

  • Riešenie: Vypočítajme reťazové a základné absolútne prírastky, miery rastu, miery rastu. Získané hodnoty zhrnieme v tabuľke 1

    Riešenie

    Objem výroby. Riešenie: Aritmetický priemer intervalu variačný riadok sa vypočíta takto: pre... Hraničná výberová chyba s pravdepodobnosťou 0,954 (t=2) bude: Δ w = t*μ = 2*0,0146 = 0,02927 Definujme hranice...

  • Riešenie. Podpísať

    Riešenie

    O koho pracovných skúsenostiach a vymyslené vzorka. Vzorová priemerná pracovná skúsenosť... týchto zamestnancov a vymyslené vzorka. Priemerná dĺžka trvania vzorky... 1,16, hladina významnosti α = 0,05. Riešenie. Variačné riadok z tejto vzorky vyzerá takto: 0,71 ...

  • Pracovný učebný plán z biológie pre ročníky 10-11 Zostavila: Polikarpova S.V.

    Pracovný učebný plán

    Najjednoduchšie schémy kríženia“ 5 L.r. " Riešenie elementárne genetické problémy“ 6 L.b. " Riešenie elementárne genetické problémy“ 7 L.r. "..., 110, 115, 112, 110." Skladať variačný riadok, kresliť variačný krivka, nájsť priemerná hodnota podpísať...

  • Pri konštrukcii intervalového distribučného radu sú vyriešené tri otázky:

    • 1. Koľko intervalov mám užívať?
    • 2. Aká je dĺžka intervalov?
    • 3. Aký je postup pri zaraďovaní jednotiek obyvateľstva do hraníc intervalov?
    • 1. Počet intervalov možno určiť podľa Sturgessov vzorec:

    2. Dĺžka intervalu alebo krok intervalu, zvyčajne určený vzorcom

    Kde R- rozsah variácií.

    3. Poradie zahrnutia jednotiek populácie v rámci hraníc intervalu

    môžu byť rôzne, ale pri konštrukcii intervalového radu musí byť rozdelenie striktne definované.

    Napríklad toto: [), v ktorom sú populačné jednotky zahrnuté v dolných hraniciach, ale nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval, ktorého horná hranica zahŕňa posledné číslo hodnotenej série.

    Hranice intervalov sú:

    • uzavreté - s dvoma extrémnymi hodnotami atribútu;
    • open - s jednou extrémnou hodnotou atribútu (predtým taký a taký počet resp cez také a také číslo).

    Za účelom asimilácie teoretického materiálu uvádzame informácie o pozadí pre riešenia end-to-end úloha.

    Existujú podmienené údaje o priemernom počte manažérov predaja, množstve nimi predávaného podobného tovaru, individuálnej trhovej cene tohto produktu, ako aj objeme predaja 30 spoločností v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka (tabuľka 2.1).

    Tabuľka 2.1

    Počiatočné informácie pre prierezovú úlohu

    číslo

    manažéri,

    Cena, tisíc rubľov

    Objem predaja, milióny rubľov.

    číslo

    manažéri,

    Množstvo predaného tovaru, ks.

    Cena, tisíc rubľov

    Objem predaja, milióny rubľov.

    Na základe prvotných informácií, ale aj doplňujúcich informácií nastavíme jednotlivé úlohy. Následne predstavíme metodiku ich riešenia a samotné riešenia.

    Prierezová úloha. Úloha 2.1

    Použitie počiatočných údajov z tabuľky. 2.1 zostrojiť diskrétnu sériu rozdelenia firiem podľa množstva predaného tovaru (tabuľka 2.2).

    Riešenie:

    Tabuľka 2.2

    Samostatné série distribúcie firiem podľa množstva predaného tovaru v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

    Prierezová úloha. Úloha 2.2

    požadovaný zostaviť zoradený rad 30 firiem podľa priemerného počtu manažérov.

    Riešenie:

    15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

    Prierezová úloha. Úloha 2.3

    Použitie počiatočných údajov z tabuľky. 2.1, požadovaný:

    • 1. Zostrojte intervalový rad rozmiestnenia firiem podľa počtu manažérov.
    • 2. Vypočítajte frekvencie distribučných radov firiem.
    • 3. Vyvodiť závery.

    Riešenie:

    Vypočítajme pomocou Sturgessovho vzorca (2.5) počet intervalov:

    Zoberieme teda 6 intervalov (skupín).

    Dĺžka intervalu, alebo intervalový krok, vypočítajte pomocou vzorca

    Poznámka. Poradie zaraďovania populačných jednotiek do hraníc intervalu je nasledovné: I), v ktorom populačné jednotky sú zahrnuté v dolných hraniciach, ale nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval I ], ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

    Zostavíme intervalový rad (tabuľka 2.3).

    Intervalové série rozmiestnenia firiem a priemerný počet manažérov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

    Záver. Najväčšou skupinou firiem je skupina s priemerný počet manažéri 25-30 ľudí, čo zahŕňa 8 spoločností (27%); Do najmenšej skupiny s priemerným počtom manažérov 40 – 45 osôb patrí len jedna firma (3 %).

    Použitie počiatočných údajov z tabuľky. 2.1, ako aj intervalový rad rozdelenia firiem podľa počtu manažérov (tabuľka 2.3), požadovaný vybudovať analytické zoskupenie vzťahu medzi počtom manažérov a objemom predaja firiem a na jeho základe vyvodiť záver o prítomnosti (alebo absencii) vzťahu medzi týmito charakteristikami.

    Riešenie:

    Analytické zoskupovanie je založené na faktorových charakteristikách. V našom probléme je faktorová charakteristika (x) počet manažérov a výsledná charakteristika (y) je objem predaja (tabuľka 2.4).

    Poďme teraz stavať analytické zoskupenie(Tabuľka 2.5).

    Záver. Na základe údajov vytvoreného analytického zoskupenia môžeme povedať, že s nárastom počtu obchodných manažérov sa zvyšuje aj priemerný objem predaja spoločnosti v skupine, čo naznačuje prítomnosť priameho spojenia medzi týmito charakteristikami.

    Tabuľka 2.4

    Pomocná tabuľka na zostavenie analytického zoskupenia

    Počet manažérov, ľudí,

    Číslo firmy

    Objem predaja, milióny rubľov, y

    " = 59 f = 9,97

    I-™ 4 - Yu.22

    74 '25 1PY1

    U 4 = 7 = 10,61

    pri = ’ =10,31 30

    Tabuľka 2.5

    Závislosť objemu predaja od počtu manažérov spoločnosti v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

    KONTROLNÉ OTÁZKY
    • 1. Čo je podstatou štatistického pozorovania?
    • 2. Vymenujte etapy štatistického pozorovania.
    • 3. Aké sú organizačné formy štatistického pozorovania?
    • 4. Vymenujte druhy štatistického pozorovania.
    • 5. Čo je to štatistický súhrn?
    • 6. Vymenujte typy štatistických výkazov.
    • 7. Čo je štatistické zoskupovanie?
    • 8. Vymenujte typy štatistických zoskupení.
    • 9. Čo je distribučná séria?
    • 10. Vymenujte konštrukčné prvky rozvodného radu.
    • 11. Aký je postup pri zostavovaní distribučnej série?
    Páčil sa vám článok? Zdieľaj to