Kontakty

Zoskupovanie údajov a vytváranie distribučných radov. Pre študentov a školákov - pomoc pri štúdiu

Pri konštrukcii intervalového distribučného radu sa riešia tri otázky:

  • 1. Koľko intervalov by som mal užívať?
  • 2. Aká je dĺžka intervalov?
  • 3. Aký je postup pri zaraďovaní jednotiek obyvateľstva do hraníc intervalov?
  • 1. Počet intervalov možno určiť podľa Sturgessov vzorec:

2. Dĺžka intervalu alebo krok intervalu, sa zvyčajne určuje podľa vzorca

kde R- rozsah variácií.

3. Poradie zaradenia jednotiek populácie do hraníc intervalu

môžu byť rôzne, ale pri konštrukcii intervalového radu je rozdelenie nevyhnutne striktne definované.

Napríklad toto: [), v ktorom sú jednotky populácie zahrnuté v dolných hraniciach a nie sú zahrnuté v horných hraniciach, ale sú prenesené do ďalšieho intervalu. Výnimkou z tohto pravidla je posledný interval , ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

Hranice intervalov sú:

  • uzavreté - s dvoma extrémnymi hodnotami atribútu;
  • otvorený - s jednou extrémnou hodnotou prvku (predtým nejaké číslo resp cez takéto číslo).

Za účelom asimilácie teoretického materiálu uvádzame informácie o pozadí pre riešenia cez úlohy.

Existujú podmienené údaje o priemernom počte manažérov predaja, počte nimi predaných tovarov jednej kvality, individuálnej trhovej cene tohto produktu, ako aj objeme predaja 30 firiem v jednom z regiónov Ruskej federácie v roku prvý štvrťrok vykazovaného roka (tabuľka 2.1).

Tabuľka 2.1

Počiatočné informácie pre prierezovú úlohu

populácia

manažérov

Cena, tisíc rubľov

Objem predaja, milióny rubľov

populácia

manažérov

Množstvo predaného tovaru, ks.

Cena, tisíc rubľov

Objem predaja, milióny rubľov

Na základe prvotných informácií, ale aj doplňujúcich informácií nastavíme jednotlivé úlohy. Následne uvádzame metodiku ich riešenia a samotné riešenia.

Prierezová úloha. Úloha 2.1

Pomocou pôvodnej tabuľky údajov. 2.1 vytvoriť diskrétnu sériu distribúcie firiem podľa počtu predaných tovarov (tabuľka 2.2).

Riešenie:

Tabuľka 2.2

Samostatná séria distribúcie firiem podľa počtu predaných tovarov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Prierezová úloha. Úloha 2.2

požadovaný vytvoriť rad 30 firiem podľa priemerného počtu manažérov.

Riešenie:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Prierezová úloha. Úloha 2.3

Pomocou pôvodnej tabuľky údajov. 2.1, požadovaný:

  • 1. Zostrojte intervalový rad pre rozdelenie firiem podľa počtu manažérov.
  • 2. Vypočítajte frekvencie distribučných radov firiem.
  • 3. Vyvodiť závery.

Riešenie:

Vypočítajte pomocou Sturgessovho vzorca (2.5) počet intervalov:

Zoberieme teda 6 intervalov (skupín).

Dĺžka intervalu, alebo intervalový krok, vypočítajte podľa vzorca

Poznámka. Poradie zaradenia jednotiek populácie do hraníc intervalu je nasledovné: I), v ktorom sú jednotky populácie zahrnuté v dolných hraniciach a nie sú zahrnuté v horných hraniciach, ale prenášajú sa do ďalšej interval. Výnimkou z tohto pravidla je posledný interval I ], ktorého horná hranica zahŕňa posledné číslo zoradeného radu.

Zostavíme intervalový rad (tabuľka 2.3).

Intervalové rady rozmiestnenia firiem, ale priemerný počet manažérov v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

Záver. Najväčšou skupinou firiem je skupina s priemerný počet zamestnancov manažéri 25-30 ľudí, čo zahŕňa 8 firiem (27%); do najmenšej skupiny s priemerným počtom manažérov 40-45 osôb patrí len jedna firma (3%).

Pomocou pôvodnej tabuľky údajov. 2.1, ako aj intervalové rady rozdelenia firiem podľa počtu manažérov (tabuľka 2.3), požadovaný vytvoriť analytické zoskupenie vzťahu medzi počtom manažérov a objemom predaja firiem a na základe toho vyvodiť záver o prítomnosti (alebo neprítomnosti) vzťahu medzi uvedenými znakmi.

Riešenie:

Analytické zoskupovanie je postavené na faktorovom základe. V našom probléme je znak faktora (x) počet manažérov a výsledný znak (y) je objem predaja (tabuľka 2.4).

Poďme teraz stavať analytické zoskupenie(Tabuľka 2.5).

Záver. Na základe údajov konštruovaného analytického zoskupenia možno povedať, že s nárastom počtu manažérov predaja sa zvyšuje aj priemerný objem predaja spoločnosti v skupine, čo naznačuje prítomnosť priameho vzťahu medzi týmito vlastnosťami.

Tabuľka 2.4

Pomocná tabuľka na vytvorenie analytického zoskupenia

Počet manažérov, osôb,

Číslo firmy

Objem predaja, milióny rubľov, y

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U 4 = 7 = 10,61

pri = ’ =10,31 30

Tabuľka 2.5

Závislosť objemu predaja od počtu manažérov spoločnosti v jednom z regiónov Ruskej federácie v prvom štvrťroku vykazovaného roka

TESTOVACIE OTÁZKY
  • 1. Čo je podstatou štatistického pozorovania?
  • 2. Vymenujte etapy štatistického pozorovania.
  • 3. Aké sú organizačné formy štatistického pozorovania?
  • 4. Vymenujte druhy štatistického pozorovania.
  • 5. Čo je to štatistický súhrn?
  • 6. Vymenujte typy štatistických výkazov.
  • 7. Čo je štatistické zoskupenie?
  • 8. Vymenujte typy štatistických zoskupení.
  • 9. Čo je distribučná séria?
  • 10. Vymenujte konštrukčné prvky distribučného radu.
  • 11. Aký je postup pri zostavovaní distribučnej série?

Ak je študovaná náhodná premenná spojitá, potom poradie a zoskupenie pozorovaných hodnôt často neumožňujú vyčleniť charakterové rysy meniace sa jeho hodnoty. Je to kvôli individuálnym hodnotám náhodná premenná sa môžu navzájom líšiť tak málo, ako je žiaduce, a preto sa v súhrne pozorovaných údajov zriedkavo môžu vyskytnúť rovnaké hodnoty množstva a frekvencie variantov sa od seba líšia len málo.

Je tiež nepraktické zostrojiť diskrétny rad pre diskrétnu náhodnú premennú, číslo možné hodnotyčo je skvelé. V takýchto prípadoch by sa malo stavať intervalové variačné série distribúcia.

Na vytvorenie takejto série je celý interval variácií pozorovaných hodnôt náhodnej premennej rozdelený do série čiastkové intervaly a počítanie frekvencie výskytu hodnôt magnitúdy v každom čiastočnom intervale.

interval variačný rad nazývaný usporiadaný súbor intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo relatívnymi frekvenciami zásahov v každej z hodnôt hodnoty.

Na zostavenie intervalovej série potrebujete:

  1. definovať hodnotu čiastočné intervaly;
  2. definovať šírka intervaly;
  3. nastavte pre každý interval to top a nižšia hranica ;
  4. zoskupiť výsledky pozorovania.

1 . O otázke výberu počtu a šírky intervalov zoskupovania je potrebné rozhodnúť v každom konkrétnom prípade na základe Ciele výskum, objem odber vzoriek a stupeň variácie funkcia vo vzorke.

Približný počet intervalov k možno odhadnúť len z veľkosti vzorky n jedným z nasledujúcich spôsobov:

  • podľa vzorca Sturges : k = 1 + 3,32 log n ;
  • pomocou tabuľky 1.

stôl 1

2 . Vo všeobecnosti sú preferované intervaly rovnakej šírky. Na určenie šírky intervalov h vypočítať:

  • rozsah variácií R - vzorové hodnoty: R = x max - x min ,

kde xmax a xmin - možnosti maximálnej a minimálnej vzorky;

  • šírka každého intervalu h určuje sa podľa nasledujúceho vzorca: h = R/k .

3 . Spodná čiara prvý interval x h1 sa volí tak, aby minimálny vzorový variant xmin klesol približne v strede tohto intervalu: x h1 = x min - 0,5 h .

Intervaly získaná pripočítaním dĺžky čiastkového intervalu ku koncu predchádzajúceho intervalu h :

xhi = xhi-1 + h.

Konštrukcia škály intervalov na základe výpočtu hraníc intervalov pokračuje až do hodnoty x ahoj vyhovuje vzťahu:

x ahoj< x max + 0,5·h .

4 . V súlade so stupnicou intervalov sú hodnoty atribútu zoskupené - pre každý čiastkový interval sa vypočíta súčet frekvencií n i zachytený variant i -tý interval. V tomto prípade interval obsahuje hodnoty náhodnej premennej väčšie alebo rovné dolnej hranici a menšie ako horná hranica intervalu.

Polygón a histogram

Pre prehľadnosť sú zostavené rôzne grafy štatistického rozdelenia.

Na základe údajov diskrétnych variačných radov konštruujeme mnohouholník frekvencie alebo relatívnej frekvencie.

Frekvenčný polygón x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Na vytvorenie mnohouholníka frekvencií na osi x sú možnosti vyčlenené x i a na osi y - zodpovedajúce frekvencie n i . Body ( x i ; n i ) sú spojené segmentmi priamych čiar a získa sa frekvenčný mnohouholník (obr. 1).

Polygón relatívnej frekvencie sa nazýva lomená čiara, ktorej segmenty spájajú body ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; Wk ). Ak chcete vytvoriť mnohouholník relatívnych frekvencií na úsečke, zrušte možnosti x i a na osi y - im zodpovedajúce relatívne frekvencie Wi . Body ( x i ; Wi ) sú spojené segmentmi priamych čiar a získa sa mnohouholník relatívnych frekvencií.

Kedy súvislá vlastnosť je účelné stavať histogram .

frekvenčný histogram nazývaný stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastkové intervaly dĺžky h a výšky sa rovnajú pomeru NIH (hustota frekvencie).

Na vytvorenie histogramu frekvencií sa na os x vynesú čiastočné intervaly a nad nimi sa nakreslia segmenty rovnobežne s osou x vo vzdialenosti NIH .

Majúc údaje štatistického pozorovania charakterizujúce ten či onen jav, je potrebné ich v prvom rade zefektívniť, t.j. urob to systematicky

anglický štatistik. UjReichman o neusporiadaných agregátoch obrazne povedal, že konfrontácia s množstvom nezobecnených údajov sa rovná situácii, keď je človek bez kompasu hodený do húštiny. Aká je systematizácia štatistických údajov vo forme distribučných radov?

Štatistický rad distribúcie sú usporiadané štatistické agregáty (tabuľka 17). Najjednoduchším druhom štatistických distribučných radov je zoradený rad, t.j. rad čísel vo vzostupnom alebo zostupnom poradí s rôznymi znakmi. Takýto rad nám neumožňuje posúdiť vzorce obsiahnuté v distribuovaných údajoch: ktorá hodnota má zoskupenú väčšinu ukazovateľov, aké sú odchýlky od tejto hodnoty; ako všeobecný distribučný vzor. Na tento účel sú údaje zoskupené a ukazujú, ako často sa jednotlivé pozorovania vyskytujú v ich celkovom počte (schéma 1a 1).

. Tabuľka 17

. Všeobecná formaštatistické distribučné rady

. Schéma 1. Schéma štatistiky distribučných radoch

Rozdelenie populačných jednotiek podľa charakteristík, ktoré nemajú kvantitatívne vyjadrenie, sa nazýva tzv rad atribútov(napríklad rozdelenie podnikov podľa ich výrobnej linky)

Distribučné rady populačných jednotiek podľa charakteristík, majú kvantitatívne vyjadrenie, sú tzv variačná séria. V takýchto sériách je hodnota prvku (možností) vo vzostupnom alebo zostupnom poradí

Vo variačnom rade distribúcie sa rozlišujú dva prvky: varianty a frekvencia . Možnosť- toto je samostatná hodnota funkcie zoskupenia frekvencia- číslo, ktoré ukazuje, koľkokrát sa každá možnosť vyskytne

V matematickej štatistike sa počíta ešte jeden prvok variačného radu - čiastočné. Ten je definovaný ako pomer frekvencie prípadov daného intervalu k celkovému počtu frekvencií, časť je určená v zlomkoch jednotky, percentá (%) v ppm (% o)

Variačný distribučný rad je teda séria, v ktorej sú možnosti usporiadané vo vzostupnom alebo zostupnom poradí, ich frekvencie alebo frekvencie sú uvedené. Variačné rady sú diskrétne (pererivné) a ostatné intervaly (spojité).

. Séria diskrétnych variácií- ide o distribučné rady, v ktorých variant ako hodnota kvantitatívneho znaku môže nadobudnúť len určitú hodnotu. Varianty sa od seba líšia jednou alebo viacerými jednotkami

Počet vyrobených dielov za zmenu konkrétnym pracovníkom teda môže byť vyjadrený len jedným určitý počet(6, 10, 12 atď.). Príkladom diskrétnej variačnej série môže byť rozdelenie pracovníkov podľa počtu vyrobených dielov (tabuľka 18-18).

. Tabuľka 18

. Diskrétny distribučný rozsah _

. Intervalové (kontinuálne) série variácií- také distribučné rady, v ktorých sa hodnota opcií uvádza ako intervaly, t.j. hodnoty vlastností sa môžu navzájom líšiť o ľubovoľne malé množstvo. Pri konštrukcii variačného radu NEP nie je možné označiť každú hodnotu variantov, takže súbor je rozdelený do intervalov. To posledné môže, ale nemusí byť rovnaké. Pre každý z nich sú uvedené frekvencie alebo frekvencie (tabuľka 1 9 19).

V intervalových distribučných radoch s nerovnakými intervalmi sa vypočítajú matematické charakteristiky, ako je hustota distribúcie a relatívna hustota distribúcie v danom intervale. Prvá charakteristika je určená pomerom frekvencie k hodnote toho istého intervalu, druhá - pomerom frekvencie k hodnote toho istého intervalu. Vo vyššie uvedenom príklade bude hustota distribúcie v prvom intervale 3: 5 = 0,6 a relatívna hustota v tomto intervale bude 7,5: 5 = 1,55 %.

. Tabuľka 19

. Intervalové distribučné série _

Najdôležitejšou etapou pri skúmaní sociálno-ekonomických javov a procesov je systematizácia primárnych údajov a na tomto základe získanie súhrnnej charakteristiky celého objektu pomocou zovšeobecňujúcich ukazovateľov, čo sa dosahuje sumarizáciou a zoskupovaním primárneho štatistického materiálu.

Štatistické zhrnutie - ide o komplex sekvenčných operácií na zovšeobecnenie konkrétnych jednotlivých faktov, ktoré tvoria súbor, na identifikáciu typických znakov a vzorov, ktoré sú vlastné skúmanému javu ako celku. Vykonanie štatistického súhrnu zahŕňa nasledujúce kroky :

  • výber funkcie zoskupenia;
  • určenie poradia vytvárania skupín;
  • vývoj systému štatistických ukazovateľov na charakterizáciu skupín a objektu ako celku;
  • vývoj rozložení štatistických tabuliek na prezentáciu súhrnných výsledkov.

Štatistické zoskupenie nazval rozdelenie jednotiek skúmanej populácie do homogénnych skupín podľa určitých charakteristík, ktoré sú pre ne podstatné. Zoskupenia sú najdôležitejšou štatistickou metódou sumarizácie štatistických údajov, základom pre správny výpočet štatistických ukazovateľov.

Existujú tieto typy zoskupení: typologické, štrukturálne, analytické. Všetky tieto zoskupenia spája skutočnosť, že jednotky objektu sú rozdelené do skupín podľa nejakého atribútu.

znak zoskupenia sa nazýva znak, ktorým sa jednotky obyvateľstva delia do samostatných skupín. Od správna voľba funkcia zoskupovania závisí od záverov štatistickej štúdie. Ako základ pre zoskupovanie je potrebné použiť významné, teoreticky podložené znaky (kvantitatívne alebo kvalitatívne).

Kvantitatívne znaky zoskupovania majú číselné vyjadrenie (objem obchodov, vek osoby, rodinný príjem a pod.), a kvalitatívne znaky zoskupenia odráža stav populačnej jednotky (pohlavie, rodinný stav, odvetvová príslušnosť podniku, jeho forma vlastníctva a pod.).

Po určení základu zoskupenia by sa malo rozhodnúť o počte skupín, do ktorých by sa mala študovaná populácia rozdeliť. Počet skupín závisí od cieľov štúdie a typu ukazovateľa, ktorý je základom zoskupenia, objemu populácie, stupňa variácie vlastnosti.

Napríklad zoskupenie podnikov podľa foriem vlastníctva zohľadňuje mestské, federálne a majetkové pomery subjektov federácie. Ak sa zoskupenie uskutočňuje podľa kvantitatívneho atribútu, potom je potrebné venovať osobitnú pozornosť počtu jednotiek skúmaného objektu a stupňu kolísania atribútu zoskupenia.

Keď sa určí počet skupín, potom by sa mali určiť intervaly zoskupovania. Interval - to sú hodnoty premennej charakteristiky, ktoré ležia v určitých hraniciach. Každý interval má svoju hodnotu, hornú a dolnú hranicu alebo aspoň jednu z nich.

Dolná hranica intervalu sa nazýva najmenšia hodnota atribútu v intervale, a Horná hranica - najväčšia hodnota atribútu v intervale. Hodnota intervalu je rozdiel medzi hornou a dolnou hranicou.

Intervaly zoskupovania v závislosti od ich veľkosti sú: rovnaké a nerovnaké. Ak sa variácia znaku prejavuje v relatívne úzkych hraniciach a distribúcia je rovnomerná, potom sa vytvorí zoskupenie s rovnakými intervalmi. Hodnota rovnakého intervalu je určená nasledujúcim vzorcom :

kde Xmax, Xmin - maximálne a minimálne hodnoty atribútu v súhrne; n je počet skupín.

Najjednoduchším zoskupením, v ktorom je každá vybraná skupina charakterizovaná jedným ukazovateľom, je distribučný rad.

Štatistické distribučné rady - ide o usporiadané rozdelenie jednotiek obyvateľstva do skupín podľa určitého atribútu. V závislosti od znaku, ktorý je základom tvorby distribučného radu, sa rozlišujú atribútové a variačné distribučné rady.

prívlastkový nazývané distribučné rady konštruované podľa kvalitatívnych znakov, teda znakov, ktoré nemajú číselný výraz(rozdelenie podľa druhov práce, podľa pohlavia, podľa profesie atď.). Rad rozdelenia atribútov charakterizuje zloženie populácie podľa jedného alebo druhého podstatného znaku. Tieto údaje, prevzaté z niekoľkých období, nám umožňujú študovať zmenu štruktúry.

Variačné riadky distribučné série postavené na kvantitatívnom základe. Každá variačná séria pozostáva z dvoch prvkov: variantov a frekvencií. možnosti sa nazývajú jednotlivé hodnoty atribútu, ktorý preberá variačná séria, teda špecifická hodnota premenného znaku.

Frekvencie nazývané číslo jednotlivého variantu alebo každej skupiny variačného radu, to znamená, že ide o čísla, ktoré ukazujú, ako často sa určité varianty vyskytujú v distribučnom rade. Súčet všetkých frekvencií určuje veľkosť celej populácie, jej objem. Frekvencie frekvencie sa nazývajú, vyjadrené v zlomkoch jednotky alebo ako percento z celku. V súlade s tým sa súčet frekvencií rovná 1 alebo 100 %.

V závislosti od povahy variácie znaku sa rozlišujú tri formy variačných sérií: zoradený rad, diskrétny rad a intervalový rad.

Hodnotené série variácií - ide o rozloženie jednotlivých jednotiek populácie vo vzostupnom alebo zostupnom poradí podľa skúmaného znaku. Ranking umožňuje jednoducho rozdeliť kvantitatívne údaje do skupín, okamžite odhaliť najmenšie a najväčšiu hodnotu zvýraznite hodnoty, ktoré sa najčastejšie opakujú.

Séria diskrétnych variácií charakterizuje rozdelenie populačných jednotiek podľa diskrétneho atribútu, ktorý nadobúda iba celočíselné hodnoty. Napríklad tarifná kategória, počet detí v rodine, počet zamestnancov v podniku atď.

Ak má znak nepretržitú zmenu, ktorá v rámci určitých limitov môže nadobudnúť akékoľvek hodnoty ("od - do"), potom pre toto označenie musíte postaviť intervalové variačné série . Napríklad výška príjmu, pracovné skúsenosti, náklady na fixné aktíva podniku atď.

Príklady riešenia úloh na tému "Štatistický súhrn a zoskupovanie"

Úloha 1 . Je tam informácia o počte kníh, ktoré študenti dostali predplatným za uplynulý akademický rok.

Zostavte sériu distribúcie s rozsahom a diskrétnu variáciu, ktorá označuje prvky série.

Riešenie

Táto sada je súbor možností pre počet kníh, ktoré študenti dostanú. Spočítajme počet takýchto variantov a usporiadame ich do podoby variačného usporiadaného a variačného diskrétneho distribučného radu.

Úloha 2 . Existujú údaje o hodnote fixných aktív pre 50 podnikov, tisíc rubľov.

Zostavte distribučnú sériu a zvýraznite 5 skupín podnikov (v rovnakých intervaloch).

Riešenie

Pre riešenie volíme najväčšie a najmenšia hodnota hodnota fixných aktív podnikov. Ide o 30,0 a 10,2 tisíc rubľov.

Nájdite veľkosť intervalu: h \u003d (30,0-10,2): 5 \u003d 3,96 tisíc rubľov.

Potom prvá skupina bude zahŕňať podniky, ktorých výška fixných aktív je od 10,2 tisíc rubľov. až 10,2 + 3,96 = 14,16 tisíc rubľov. Takýchto podnikov bude 9. Druhá skupina bude zahŕňať podniky, ktorých výška fixných aktív bude od 14,16 tisíc rubľov. až 14,16 + 3,96 = 18,12 tisíc rubľov. Takýchto podnikov bude 16. Podobne zistíme počet podnikov zaradených do tretej, štvrtej a piatej skupiny.

Výsledný distribučný rad sa umiestni do tabuľky.

Úloha 3 . Pre množstvo podnikov ľahkého priemyslu sa získali tieto údaje:

Vytvorte zoskupenie podnikov podľa počtu pracovníkov a vytvorte 6 skupín v rovnakých intervaloch. Počítajte pre každú skupinu:

1. počet podnikov
2. počet pracovníkov
3. objem vyrobených produktov za rok
4. priemerný skutočný výkon na pracovníka
5. výška fixných aktív
6. priemerná veľkosť investičného majetku jedného podniku
7. priemerná hodnota vyrobených výrobkov jedným podnikom

Výsledky výpočtu zaznamenajte do tabuliek. Urobte si vlastné závery.

Riešenie

Pre riešenie volíme najväčšie a najmenšie hodnoty priemerného počtu pracovníkov v podniku. Toto je 43 a 256.

Nájdite veľkosť intervalu: h = (256-43): 6 = 35,5

Potom do prvej skupiny budú zaradené podniky s priemerným počtom pracovníkov od 43 do 43 + 35,5 = 78,5 osôb. Takýchto podnikov bude 5. V druhej skupine budú podniky, ktorých priemerný počet pracovníkov bude od 78,5 do 78,5 + 35,5 = 114 osôb. Takýchto podnikov bude 12. Podobne zistíme počet podnikov zaradených do tretej, štvrtej, piatej a šiestej skupiny.

Výsledný distribučný rad dáme do tabuľky a vypočítame požadované ukazovatele pre každú skupinu:

Záver : Ako vidno z tabuľky, druhá skupina podnikov je najpočetnejšia. Zahŕňa 12 podnikov. Najmenšia je piata a šiesta skupina (po dva podniky). Ide o najväčšie podniky (z hľadiska počtu pracovníkov).

Keďže druhá skupina je najpočetnejšia, objem produkcie za rok podnikov tejto skupiny a objem fixných aktív sú oveľa vyššie ako ostatné. Zároveň priemerný skutočný výkon jedného pracovníka v podnikoch tejto skupiny nie je najvyšší. Tu vedú podniky štvrtej skupiny. Na túto skupinu pripadá aj pomerne veľké množstvo fixných aktív.

Na záver podotýkame, že priemerná veľkosť fixných aktív a priemerná hodnota vyrobené výrobky jedného podniku sú priamo úmerné veľkosti podniku (z hľadiska počtu pracovníkov).

Najjednoduchší spôsob, ako zovšeobecniť štatistický materiál, je zostaviť série. Výsledkom súhrnu štatistickej štúdie môžu byť distribučné série.

Po určení charakteristiky zoskupenia, počtu skupín a intervalov zoskupovania sú súhrnné a zoskupovacie údaje prezentované vo forme distribučných radov a sú prezentované vo forme štatistických tabuliek.

Distribučný rad je jedným typom zoskupenia.

Blízko distribúcie v štatistike sa nazýva usporiadané rozdelenie populačných jednotiek do skupín podľa jedného atribútu: kvalitatívneho alebo kvantitatívneho.

  1. Typy distribučných sérií

V závislosti od znaku, ktorý je základom tvorby distribučného radu, sa rozlišujú atribútové a variačné distribučné série:

    prívlastkové nazývané distribučné série postavené na kvalitatívnych základoch;

    distribučné série sa nazývajú variačné, zostavené vo vzostupnom alebo zostupnom poradí hodnôt kvantitatívneho znaku.

Séria variácií distribúcie pozostáva z dvoch stĺpcov. Prvý stĺpec obsahuje kvantitatívne hodnoty premennej charakteristiky, ktoré sa nazývajú varianty a sú označené. Diskrétny variant – vyjadrený ako celé číslo. Možnosť intervalu je v rozsahu od a do. V závislosti od typu variantov je možné zostaviť diskrétny alebo intervalový variačný rad. Druhý stĺpec obsahuje počet konkrétnych variantov vyjadrených frekvenciami alebo frekvenciami:

    frekvencie sú absolútne čísla, ktoré ukazujú, koľkokrát sa daná hodnota funkcie vyskytuje v súhrne; súčet všetkých frekvencií by sa mal rovnať počtu jednotiek celej populácie;

    frekvencie sú frekvencie vyjadrené ako percento z celku; súčet všetkých frekvencií vyjadrený v percentách sa musí rovnať 100 % v zlomkoch jednej.

Variačné série charakterizované dvoma prvkami: variantom (X) a frekvenciou (f). Variant je samostatná hodnota znaku samostatnej jednotky alebo skupiny obyvateľstva. Volá sa číslo, ktoré ukazuje, koľkokrát sa konkrétna hodnota funkcie vyskytne frekvencia. Ak je frekvencia vyjadrená ako relatívne číslo, potom sa nazýva frekvencia.

Variačné série môžu byť:

    interval, keď sú definované hranice "od" a "do", rad intervalového rozdelenia možno znázorniť graficky vo forme histogramu;

    diskrétne, keď je študovaný znak charakterizovaný určitým číslom.

  1. Grafické znázornenie distribučných radov

Distribučné série sú vizualizované pomocou grafických obrázkov.

Distribučné série sú zobrazené ako:

    mnohouholník;

    histogramy;

    kumuluje sa;

Pri stavbe skládka na vodorovnej osi (abscisa) sú vynesené hodnoty meniacej sa vlastnosti a na vertikálna os(os y) - frekvencie alebo frekvencie.

Na stavbu histogramy os x označuje hodnoty hraníc intervalov a na ich základe sú postavené obdĺžniky, ktorých výška je úmerná frekvenciám (alebo frekvenciám).

Rozdelenie vlastnosti vo variačnom rade podľa akumulovaných frekvencií (frekvencií) je znázornené pomocou kumulácie.

Kumulovať alebo kumulatívna krivka, na rozdiel od polygónu, je postavená na akumulovaných frekvenciách alebo frekvenciách. V tomto prípade sú charakteristické hodnoty umiestnené na osi x a nahromadené frekvencie alebo frekvencie sú umiestnené na osi y.

Ogiva je konštruovaný podobne ako kumulácia s jediným rozdielom, že akumulované frekvencie sú umiestnené na osi x a hodnoty vlastností sú umiestnené na osi y.

Obmenou kumulácie je krivka koncentrácie alebo Lorenzov graf. Na vykreslenie koncentračnej krivky sú obe osi pravouhlého súradnicového systému upravené v percentách od 0 do 100. V tomto prípade osi x označujú akumulované frekvencie a osi ordinátov zobrazujú akumulované hodnoty podielu (v percent) podľa objemu prvku.

Páčil sa vám článok? Zdieľaj to