Kapcsolatok

Elosztó sorozat felépítése. Statisztikai összesítés és csoportosítás

Ezek terjesztési sorozatok formájában jelennek meg, és formátumuk: .

Az elosztási sorozat a csoportosítás egyik típusa.

Elosztási tartomány- a vizsgált sokaság egységeinek csoportokba rendezett eloszlását jelenti egy bizonyos változó tulajdonság szerint.

Az eloszlási sorozat kialakulásának hátterében álló tulajdonságtól függően vannak attribúciós és variációs elosztási rangok:

  • jelző- nevezzük a minőségi alapokra épülő disztribúciós sorozatot.
  • A mennyiségi attribútum értékeinek növekvő vagy csökkenő sorrendjében összeállított eloszlási sorozatokat ún. variációs.
Az eloszlás variációs sorozata két oszlopból áll:

Az első oszlop tartalmazza mennyiségi értékek változó tulajdonság, amelyeket ún lehetőségekés meg vannak jelölve. Diszkrét változat – egész számként kifejezve. Az intervallum opció a és tól tartományba esik. A változatok típusától függően lehetőség van diszkrét vagy intervallum variációs sorozat felépítésére.
A második oszlop tartalmazza konkrét opciók száma, frekvenciákban vagy frekvenciákban kifejezve:

Frekvenciák- ezek abszolút számok, amelyek azt mutatják, hogy az aggregátumban hányszor fordul elő a jellemző adott értéke, amelyek jelölik. Az összes gyakoriság összegének egyenlőnek kell lennie a teljes sokaság egységeinek számával.

Frekvenciák() a gyakoriságok a teljes érték százalékában kifejezve. Az összes gyakoriság százalékban kifejezett összegének egyenlőnek kell lennie 100%-kal, az egy törtrészében.

Eloszlási sorozatok grafikus ábrázolása

A disztribúciós sorozatok grafikus képekkel jeleníthetők meg.

A terjesztési sorozatok a következőképpen jelennek meg:
  • Poligon
  • Hisztogramok
  • Halmozódik
  • ogves

Poligon

Ha sokszöget készítünk a vízszintes tengelyen (abszcissza tengely), a változó attribútum értékei megjelennek, és függőleges tengely(y-tengely) - frekvenciák vagy frekvenciák.

ábrán látható sokszög. A 6.1-et Oroszország lakosságának 1994-es mikro-összeírása szerint építették.

6.1. A háztartások méret szerinti megoszlása

Állapot: Valamelyik vállalkozás 25 főének tarifakategóriák szerinti megoszlására vonatkozó adatok:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Egy feladat: Építsen fel egy diszkrét variációs sorozatot, és ábrázolja grafikusan eloszlási sokszögként.
Megoldás:
Ebben a példában a lehetőségek a munkavállaló bérkategóriája. A gyakoriságok meghatározásához szükséges a megfelelő bérkategóriájú alkalmazottak létszámának kiszámítása.

A sokszög diszkrét variációs sorozatokhoz használatos.

Egy eloszlási sokszög (1. ábra) felépítéséhez az abszcissza (X) mentén ábrázoljuk a változó tulajdonságok mennyiségi értékeit - változatok, és az ordináta mentén - a frekvenciákat vagy frekvenciákat.

Ha a jellemző értékeket intervallumokban fejezzük ki, akkor egy ilyen sorozatot intervallumsorozatnak nevezünk.
intervallum sorozat az eloszlásokat grafikusan hisztogram, kumuláció vagy oklevél formájában jelenítjük meg.

Statisztikai táblázat

Állapot: A betétek nagyságára vonatkozó adatok 20 vannak megadva magánszemélyek egy bankban (ezer rubel) 60; 25; 12; tíz; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; tizennyolc; 7; 42.
Egy feladat: Intervallumváltozat-sorozat készítése egyenlő intervallumokkal.
Megoldás:

  1. A kezdeti sokaság 20 egységből áll (N = 20).
  2. A Sturgess-képlet segítségével definiáljuk szükséges mennyiség használt csoportok: n=1+3,322*lg20=5
  3. Számítsuk ki az egyenlő intervallum értékét: i=(152 - 2) /5 = 30 ezer rubel
  4. A kezdeti populációt 5 csoportra osztjuk, 30 ezer rubel intervallummal.
  5. A csoportosítás eredményeit a táblázat tartalmazza:

Egy folyamatos jellemző ilyen rögzítése esetén, amikor ugyanaz az érték kétszer fordul elő (egy intervallum felső határaként és egy másik intervallum alsó határaként), akkor ez az érték abba a csoportba tartozik, ahol ez az érték a felső határként működik.

oszlopdiagram

Az abszcissza mentén történő hisztogram felépítéséhez jelölje meg az intervallumok határainak értékeit, és ezek alapján készítsen téglalapokat, amelyek magassága arányos a frekvenciákkal (vagy frekvenciákkal).

ábrán. 6.2. Oroszország lakosságának 1997-es korcsoportok szerinti megoszlásának hisztogramja látható.

Rizs. 6.2. Oroszország lakosságának megoszlása ​​korcsoportok szerint

Állapot: A cég 30 fős munkavállalóinak megoszlása ​​a havi bér nagysága szerint adott

Egy feladat: Az intervallumváltozat-sorozat grafikus megjelenítése hisztogramként, és kumulálható.
Megoldás:

  1. A nyitott (első) intervallum ismeretlen határát a második intervallum értéke határozza meg: 7000 - 5000 = 2000 rubel. Ugyanezzel az értékkel találjuk meg az első intervallum alsó határát: 5000 - 2000 = 3000 rubel.
  2. Egy téglalap alakú koordinátarendszerben, az abszcissza tengely mentén történő hisztogram felépítéséhez félreteszünk olyan szegmenseket, amelyek értéke megfelel a variáns sor intervallumainak.
    Ezek a szegmensek az alsó alapként szolgálnak, a megfelelő frekvencia (frekvencia) pedig a kialakított téglalapok magasságaként szolgál.
  3. Készítsünk hisztogramot:

A kumulátum összeállításához ki kell számítani a felhalmozott frekvenciákat (frekvenciákat). Ezeket az előző intervallumok gyakoriságának (frekvenciáinak) egymás utáni összegzésével határozzák meg, és S-vel jelölik. A halmozott gyakoriságok azt mutatják meg, hogy a sokaság hány egysége rendelkezik olyan jellemző értékkel, amely nem nagyobb a vizsgáltnál.

Összesített

Egy tulajdonság eloszlását egy variációs sorozatban a felhalmozott gyakoriságok (gyakoriságok) szerint a kumulátum segítségével ábrázoljuk.

Összesített vagy a kumulatív görbe a sokszöggel ellentétben a felhalmozott frekvenciákra vagy frekvenciákra épül. Ugyanakkor a jellemző értékei az abszcissza tengelyre, a felhalmozott frekvenciák vagy frekvenciák pedig az ordináta tengelyre kerülnek (6.3. ábra).

Rizs. 6.3. A háztartások kumulatív megoszlása ​​méret szerint

4. Számítsa ki a felhalmozott frekvenciákat:
Az első intervallum térdfrekvenciáját a következőképpen számítjuk ki: 0 + 4 = 4, a másodiknál: 4 + 12 = 16; a harmadiknál: 4 + 12 + 8 = 24 stb.

A kumulátum összeállításakor a megfelelő intervallum felhalmozott frekvenciáját (frekvenciáját) a felső korlátjához rendeljük:

Ogiva

Ogiva a kumulátumhoz hasonlóan épül fel azzal a különbséggel, hogy a felhalmozott frekvenciák az abszcissza tengelyre, a jellemzőértékek pedig az ordináta tengelyre kerülnek.

A kumulátum egy változata a koncentrációs görbe vagy a Lorenz-görbe. A koncentrációgörbe ábrázolásához a derékszögű koordináta-rendszer mindkét tengelyét százalékosan 0-tól 100-ig skálázzuk. Ebben az esetben az abszcissza tengelyek a halmozott frekvenciákat, az ordináta tengelyek pedig a részesedés halmozott értékeit mutatják. százalék) a jellemző mennyiségével.

Az előjel egyenletes eloszlása ​​megfelel a grafikonon lévő négyzet átlójának (6.4. ábra). Egyenetlen eloszlás esetén a grafikon egy homorú görbe, amely a tulajdonság koncentrációjának szintjétől függ.

6.4. koncentráció görbe

A diszkrét jellemzőkhöz diszkrét variációs sorozatot készítenek.

Egy diszkrét variációs sorozat felépítéséhez a következőket kell tennie: 1) a megfigyelési egységeket a vizsgált attribútumérték növekvő sorrendjében rendezni,

2) határozza meg az x i attribútum összes lehetséges értékét, rendezze őket növekvő sorrendbe,

előjel érték, én .

jellemző érték gyakorisága és jelöljük f én . A sorozat összes gyakoriságának összege megegyezik a vizsgált sokaság elemeinek számával.

1. példa .

A tanulók által vizsgákon szerzett osztályzatok listája: 3; négy; 3; 5; négy; 2; 2; négy; négy; 3; 5; 2; négy; 5; négy; 3; négy; 3; 3; négy; négy; 2; 2; 5; 5; négy; 5; 2; 3; négy; négy; 3; négy; 5; 2; 5; 5; négy; 3; 3; négy; 2; négy; négy; 5; négy; 3; 5; 3; 5; négy; négy; 5; négy; négy; 5; négy; 5; 5; 5.

Itt a szám x - fokozatdiszkrét valószínűségi változó, és az ebből származó becslések listája -statisztikai (megfigyelt) adatok .

    rendezd a megfigyelési egységeket a jellemző vizsgált értékének növekvő sorrendjében:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) határozza meg az x i attribútum összes lehetséges értékét, és rendezze őket növekvő sorrendbe:

Ebben a példában az összes pontszám négy csoportra osztható a következő értékekkel: 2; 3; négy; 5.

A megfigyelt adatok külön csoportjának megfelelő valószínűségi változó értékét ún előjel érték, változat (opció) és jelölje ki az x-et én .

Azt a számot hívjuk meg, amely megmutatja, hogy a megfelelő jellemzőérték hányszor fordul elő egy megfigyeléssorozatban jellemző érték gyakorisága és jelöljük f én .

A mi példánkra

a 2. pont - 8 alkalommal fordul elő,

a 3. pont - 12 alkalommal fordul elő,

a 4-es pontszám 23 alkalommal fordul elő,

pont 5 fordul elő - 17 alkalommal.

Összesen 60 értékelés van.

4) írja be a kapott adatokat egy kétsoros (oszlopos) táblázatba - x i és f i .

Ezen adatok alapján lehet diszkrét variációs sorozatot szerkeszteni

Diszkrét variációs sorozat - ez egy táblázat, amelyben a vizsgált tulajdonság előfordulási értékei különálló értékekként vannak feltüntetve növekvő sorrendben és azok gyakorisága

  1. Intervallum variációs sorozat felépítése

A diszkrét variációs sorozatok mellett gyakran létezik olyan adatcsoportosítási mód is, mint az intervallumvariációs sorozat.

Intervallum-sorozat akkor épül fel, ha:

    a jel folyamatos változási természetű;

    sok diszkrét érték van (több mint 10)

    a diszkrét értékek gyakorisága nagyon kicsi (viszonylag nagy számú megfigyelési egység esetén ne haladja meg az 1-3-at);

    egy jellemző számos diszkrét értéke azonos frekvenciájú.

Az intervallumvariációs sorozat az adatok csoportosításának módja egy táblázat formájában, amely két oszlopot tartalmaz (a jellemzőértékek értékintervallum formájában és az egyes intervallumok gyakorisága).

A diszkrét sorozatoktól eltérően az intervallumsorozat jellemzőinek értékeit nem egyedi értékek, hanem értékintervallum képviselik ("-tól"-ig).

Az a szám, amely megmutatja, hogy az egyes kiválasztott intervallumokba hány megfigyelési egység esett, hívják jellemző érték gyakorisága és jelöljük f én . A sorozat összes gyakoriságának összege megegyezik a vizsgált sokaság elemeinek (megfigyelési egységeinek) számával.

Ha egy egységnek egy jellemző értéke megegyezik az intervallum felső határának értékével, akkor azt a következő intervallumra kell hivatkozni.

Például egy 100 cm magas gyermek a 2. intervallumba esik, és nem az elsőbe; és egy 130 cm magas gyermek az utolsó intervallumba esik, és nem a harmadikba.

Ezen adatok alapján lehetséges egy intervallumvariációs sorozat felépítése.

Minden intervallumnak van alsó határa (x n), felső határa (x in) és intervallumszélessége ( én).

Az intervallumhatár olyan jellemzőérték, amely két intervallum határán fekszik.

gyerek magasság (cm)

gyerek magasság (cm)

gyerekek mennyisége

130 felett

Ha egy intervallumnak van felső és alsó korlátja, akkor ún zárt intervallum. Ha az intervallumnak csak alsó vagy csak felső határa van, akkor ez - nyitott intervallum. Csak a legelső vagy a legutolsó intervallum lehet nyitva. A fenti példában az utolsó intervallum nyitott.

Intervallum szélesség (én) a különbség a felső és az alsó határ között.

én = x n - x in

Feltételezzük, hogy egy nyitott intervallum szélessége megegyezik egy szomszédos zárt intervallum szélességével.

gyerek magasság (cm)

gyerekek mennyisége

Intervallum szélesség (i)

számításokhoz 130+20=150

20 (mivel a szomszédos zárt intervallum szélessége 20)

Minden intervallum sorozat egyenlő intervallumú intervallumsorozatra és egyenlőtlen intervallumú intervallum sorozatra van felosztva. . Az egyenlő intervallumú intervallumsorokban az összes intervallum szélessége azonos. Az egyenlőtlen intervallumú intervallumsorokban az intervallumok szélessége eltérő.

Ebben a példában egy intervallumsorozat nem egyenlő intervallumokkal.

A társadalmi-gazdasági jelenségek és folyamatok vizsgálatának legfontosabb állomása a primer adatok rendszerezése, és ennek alapján a teljes objektumra jellemző összesítő jellemző megszerzése általánosító mutatók segítségével, amely a primer statisztikai anyagok összegzésével és csoportosításával érhető el.

Statisztikai összefoglaló - ez szekvenciális műveletek komplexuma, amelyek egy halmazt alkotó egyedi tények általánosítására, a vizsgált jelenség egészében rejlő tipikus jellemzők és minták azonosítására szolgálnak. A statisztikai összesítés elkészítése a következő lépéseket tartalmazza :

  • a csoportosítási jellemző kiválasztása;
  • a csoportok kialakításának sorrendjének meghatározása;
  • a csoportok és az objektum egészének jellemzésére szolgáló statisztikai mutatók rendszerének kidolgozása;
  • statisztikai táblázatok elrendezésének kidolgozása az összesített eredmények bemutatásához.

Statisztikai csoportosítás a vizsgált sokaság egységeinek homogén csoportokra való felosztását nevezzük bizonyos, számukra lényeges jellemzők szerint. A csoportosítás a statisztikai adatok összesítésének legfontosabb statisztikai módszere, a statisztikai mutatók helyes számításának alapja.

A következő típusú csoportosítások léteznek: tipológiai, szerkezeti, elemző. Mindezeket a csoportosításokat az egyesíti, hogy az objektum egységeit valamilyen attribútum szerint csoportokra osztják.

csoportosító jel az a jel, amellyel a sokaság egységeit külön csoportokra osztják. Tól től jó választás csoportosítási jellemzője a statisztikai vizsgálat következtetéseitől függ. A csoportosítás alapjaként szignifikáns, elméletileg alátámasztott (mennyiségi vagy minőségi) jellemzők alkalmazása szükséges.

A csoportosulás mennyiségi jelei számszerű kifejezéssel kell rendelkeznie (kereskedési volumen, személy életkora, családi jövedelme stb.), és a csoportosítás minőségi jellemzői tükrözi a népességi egység állapotát (nem, családi állapot, a vállalkozás iparági hovatartozása, tulajdonosi formája stb.).

A csoportosítás alapjainak meghatározása után el kell dönteni, hogy a vizsgált populációt hány csoportra kell felosztani. A csoportok száma függ a vizsgálat céljaitól és a csoportosítás alapjául szolgáló indikátor típusától, a populáció mennyiségétől, a tulajdonság variációs fokától.

Például a vállalkozások tulajdonosi formák szerinti csoportosítása figyelembe veszi az önkormányzati, szövetségi és a szövetség alanyai vagyonát. Ha a csoportosítást mennyiségi attribútum szerint végezzük, akkor különös figyelmet kell fordítani a vizsgált objektum egységeinek számára és a csoportosítási attribútum ingadozásának mértékére.

A csoportok számának meghatározásakor meg kell határozni a csoportosítási intervallumokat. Intervallum - ezek egy változó jellemző értékei, amelyek bizonyos határokon belül vannak. Minden intervallumnak megvan a maga értéke, felső és alsó határa, vagy legalább az egyik.

Az intervallum alsó határa az attribútum legkisebb értékének nevezzük az intervallumban, és felső határ - az attribútum legnagyobb értéke az intervallumban. Az intervallum értéke a felső és alsó határ közötti különbség.

A csoportosítási intervallumok méretüktől függően a következők: egyenlő és egyenlőtlen. Ha a tulajdonság variációja viszonylag szűk határokban nyilvánul meg, és az eloszlás egyenletes, akkor egyenlő intervallumokkal csoportosítást építünk. Az egyenlő intervallum értékét a következő képlet határozza meg :

ahol Xmax, Xmin - az attribútum maximális és minimális értéke az aggregátumban; n a csoportok száma.

A legegyszerűbb csoportosítás, amelyben minden kiválasztott csoportot egy mutató jellemez, egy eloszlási sorozat.

Statisztikai eloszlási sorozat - ez a népességi egységek rendezett elosztása csoportokba egy bizonyos tulajdonság szerint. Attól függően, hogy az eloszlási sorozatok kialakulásának hátterében milyen tulajdonság áll, megkülönböztetünk attribúciós és variációs eloszlási sorozatokat.

jelző minőségi jellemzők szerint felépített disztribúciós sorozatoknak nevezzük, vagyis olyan jellemzőknek, amelyek nem rendelkeznek numerikus kifejezés(munkatípusok, nemek, szakmák stb. szerinti megoszlás). Az attribútum-eloszlási sorozatok a sokaság összetételét jellemzik egyik vagy másik lényeges jellemző szerint. Ezek az adatok több időszakot átvéve lehetővé teszik a szerkezet változásának tanulmányozását.

Változatos sorok mennyiségi alapon felépített disztribúciós sorozatnak nevezzük. Bármely variációs sorozat két elemből áll: változatokból és frekvenciákból. Lehetőségek az attribútum egyedi értékeit, amelyeket a variációs sorozatban vesz fel, nevezzük, vagyis a változó attribútumának konkrét értékét.

Frekvenciák az egyes változatok számának vagy a variációsorozat egyes csoportjainak nevezzük, vagyis ezek olyan számok, amelyek azt mutatják meg, hogy bizonyos változatok milyen gyakran fordulnak elő az eloszlási sorozatban. Az összes gyakoriság összege határozza meg a teljes populáció méretét, mennyiségét. Frekvenciák frekvenciákat hívnak, egy egység töredékében vagy az összérték százalékában kifejezve. Ennek megfelelően a frekvenciák összege 1 vagy 100%.

A tulajdonság variációjának természetétől függően a variációs sorozat három formáját különböztetjük meg: rangsorolt ​​sorozat, diszkrét sorozatés intervallum sorozat.

Rangsorolt ​​variációs sorozat - ez a populáció egyes egységeinek megoszlása ​​a vizsgált tulajdonság növekvő vagy csökkenő sorrendjében. A rangsorolás megkönnyíti a mennyiségi adatok csoportokra bontását, azonnali észlelését a legkisebb ill legnagyobb érték funkció, jelölje ki a leggyakrabban ismétlődő értékeket.

Diszkrét variációs sorozat a populációs egységek eloszlását egy diszkrét attribútum szerint jellemzi, amely csak egész értékeket vesz fel. Például a tarifakategória, a családban lévő gyermekek száma, a vállalkozásban foglalkoztatottak száma stb.

Ha egy tábla folyamatos változást mutat, amely bizonyos határokon belül bármilyen értéket felvehet ("-tól -ig"), akkor ehhez a táblához meg kell építeni intervallum variációs sorozat . Például a jövedelem összege, a munkatapasztalat, a vállalkozás tárgyi eszközeinek költsége stb.

Példák a "Statisztikai összefoglalás és csoportosítás" témakörben a problémák megoldására

1. feladat . A hallgatók által előfizetéssel beérkezett könyvek számáról van információ az elmúlt tanévben.

Hozzon létre egy tartományos és diszkrét variációs eloszlás sorozatot, amely a sorozat elemeit jelöli.

Megoldás

Ez a készlet a tanulók által megkapott könyvek számának beállítására szolgál. Számoljuk meg az ilyen változatok számát, és rendezzük őket variációs rangsorolt ​​és variációs diszkrét eloszlási sorozatokba.

2. feladat . 50 vállalkozás tárgyi eszközeinek értékéről van adat, ezer rubel.

Készítsen elosztási sorozatot, kiemelve 5 vállalkozáscsoportot (egyenlő időközönként).

Megoldás

A megoldáshoz a legnagyobb és legkisebb érték vállalkozások állóeszközeinek értéke. Ezek 30,0 és 10,2 ezer rubel.

Keresse meg az intervallum méretét: h \u003d (30,0-10,2): 5 \u003d 3,96 ezer rubel.

Ezután az első csoportba a vállalkozások tartoznak, amelyek befektetett eszközeinek összege 10,2 ezer rubel. legfeljebb 10,2 + 3,96 = 14,16 ezer rubel. 9 ilyen vállalkozás lesz. A második csoportba azok a vállalkozások tartoznak, amelyek befektetett eszközeinek összege 14,16 ezer rubeltől lesz. legfeljebb 14,16 + 3,96 = 18,12 ezer rubel. 16 ilyen vállalkozás lesz, hasonlóan a harmadik, negyedik és ötödik csoportba tartozó vállalkozások számát.

A kapott eloszlási sorozat a táblázatba kerül.

3. feladat . Számos könnyűipari vállalkozás esetében a következő adatokat kaptuk:

Készítse el a vállalkozások csoportosítását a dolgozók száma szerint, egyenlő időközönként 6 csoportot alkotva! Számolj minden csoporthoz:

1. vállalkozások száma
2. dolgozók száma
3. a gyártott termékek mennyisége évente
4. átlagos tényleges kibocsátás munkavállalónként
5. befektetett eszközök összege
6. az átlagos méret egy vállalkozás befektetett eszközei
7. egy vállalkozás által gyártott termékek átlagos értéke

A számítások eredményét rögzítse táblázatokba! Vonja le saját következtetéseit.

Megoldás

A megoldáshoz a vállalkozás átlagos dolgozóinak legnagyobb és legkisebb értékét választjuk. Ez a 43 és a 256.

Határozza meg az intervallum méretét: h = (256-43): 6 = 35,5

Ekkor az első csoportba azok a vállalkozások tartoznak, amelyek átlagos létszáma 43-43 + 35,5 = 78,5 fő. 5 ilyen vállalkozás lesz, a második csoportba azok a vállalkozások tartoznak, amelyekben az átlagos dolgozói létszám 78,5-78,5 + 35,5 = 114 fő lesz. 12 ilyen vállalkozás lesz, hasonlóan a harmadik, negyedik, ötödik és hatodik csoportba tartozó vállalkozások számát.

A kapott eloszlási sorozatot táblázatba foglaljuk, és kiszámítjuk szükséges mutatók minden csoportnál:

Következtetés : A táblázatból látható, hogy a vállalkozások második csoportja a legtöbb. 12 vállalkozást foglal magában. A legkisebb az ötödik és hatodik csoport (két-két vállalkozás). Ezek a legnagyobb vállalkozások (a dolgozók számát tekintve).

Mivel a második csoport a legtöbb, az ebbe a csoportba tartozó vállalkozások éves kibocsátásának volumene és a tárgyi eszközök volumene jóval magasabb, mint másoké. Ugyanakkor az egy dolgozó átlagos tényleges kibocsátása e csoport vállalkozásainál nem a legmagasabb. Itt a negyedik csoport vállalkozásai állnak az élen. Ez a csoport is meglehetősen nagy mennyiségű befektetett eszközt tesz ki.

Összegzésként megjegyezzük, hogy a tárgyi eszközök átlagos nagysága ill átlagos érték egy vállalkozás gyártott termékei egyenesen arányosak a vállalkozás méretével (a dolgozók számát tekintve).

A statisztika által vizsgált jellemzők a sokaság különböző egységeire ugyanabban az időszakban vagy időpontban változnak (eltérnek egymástól). Például a külkereskedelmi forgalom értéke az FCS felosztása szerint változik; az export (import) értéke exportirányonként (különböző külkereskedelmi partnerországonként), árufajtánként stb.

Ok variációk különböző feltételek a populáció különböző egységeinek létezéséhez. Például, hatalmas szám okok befolyásolják a világ különböző országainak külkereskedelmét.

A variáció statisztikával történő ellenőrzésére és tanulmányozására speciális módszereket dolgoztak ki a variáció vizsgálatára, egy olyan mutatórendszert, amellyel a változást mérik, tulajdonságait jellemzik.

A variáció statisztikai vizsgálatának első lépése a konstrukció terjesztési sorozat(vagy variációs sorozat) - a sokaság egységeinek rendezett eloszlása ​​az attribútum növekvő (gyakrabban) vagy csökkenő (ritkábban) értékei szerint, és az egységek számának számlálása az attribútum egyik vagy másik értékével.

3 van kedves elosztási tartomány:

1) rangsorolt ​​sor- ez a populáció egyes egységeinek listája a vizsgált tulajdonság szerint növekvő sorrendben (például 11. táblázat); ha a populációs egységek száma elég nagy, akkor a rangsorolás nehézkessé válik, és ilyen esetekben az eloszlási sorozat a populációs egységek csoportosításával készül a vizsgált attribútum értékei szerint (ha az attribútum nem nagy számértékeket, akkor diszkrét sorozatot szerkesztünk, ellenkező esetben intervallum sorozatot);

2) diszkrét sorozat- ez egy két oszlopból (sorból) álló táblázat - egy változó attribútum specifikus értékei Xiés a jellemző adott értékével rendelkező populációs egységek száma fi– frekvenciák; a csoportok számát egy diszkrét sorozatban a változó attribútum ténylegesen meglévő értékeinek száma határozza meg;

3) intervallum sorozat- ez egy táblázat két oszlopból (sorból) - változó előjelű intervallumokból Xiés az adott intervallumba (gyakoriságok) eső populációs egységek száma, illetve ennek a számnak a részesedése teljes erő aggregátumok (frekvenciák).

Építsük fel a külkereskedelmi forgalom (TO) elosztási sorozatát oroszországi vámhivatalok szerint, amelyhez statisztikai megfigyelés, azaz elsődleges statisztikai anyag gyűjtése szükséges, amely a VO értéke vámpostai egységenként.

A régió 35 vámpontján a VO megfigyelésének eredményeit a jelentési időszakra vonatkozóan a VO értékének növekvő sorrendje szerinti eloszlási sorozat formájában mutatjuk be (11. táblázat).

11. táblázat Külkereskedelmi forgalom (VO) 35 vámhivatalra, millió.

postaszám

postaszám

postaszám

Határozzuk meg a VO átlagos méretét a (10) képlet alapján, felvéve x a VO értéke, és for N- hozzászólások száma:

= = 2100/35 = 60 (millió dollár)

A szórást (kicsit később lesz szó - ebben a témakörben a variációelemzés 4. szakaszában) a (28) képlet határozza meg:

= = 445,778 (millió dollár2)

Építsük fel a VO vámposztonkénti eloszlás intervallumsorozatát, amelyhez ki kell választani a csoportok (karakterintervallumok) optimális számát és be kell állítani az intervallum hosszát (tartományát). Mivel egy eloszlási sorozat elemzésekor a gyakoriságokat különböző intervallumokban hasonlítják össze, szükséges, hogy az intervallumok hossza állandó legyen. A csoportok optimális számát úgy választjuk meg, hogy az aggregátumban a tulajdonságértékek sokfélesége kellően tükröződjön, és egyben az eloszlás szabályossága, alakja ne torzuljon a véletlenszerű frekvencia-ingadozások miatt. Ha túl kevés a csoport, akkor nem lesz variációs minta; ha túl sok a csoport, a véletlenszerű frekvenciaugrások torzítják az eloszlás alakját.

Leggyakrabban a csoportok számát az eloszlási sorozatban a (19) vagy (20) Sturgess-képlet határozza meg:

(19) vagy ,(20)

ahol k– csoportok száma (a legközelebbi egész számra kerekítve); N- a lakosság nagysága.

A Sturgess-képletből látható, hogy a csoportok száma az adatmennyiség függvénye ( N).

A csoportok számának ismeretében számítsa ki az intervallum hosszát (tartományát) a (21) képlet segítségével:

,(21)

ahol x max és x min - a maximális és minimális értékek az aggregátumban.

A VO-ra vonatkozó példánkban a (19) Sturgess-képlet segítségével meghatározzuk a csoportok számát:

k = 1 + 3,322lg 35 = 1+ 3,322*1,544 = 6,129 ≈ 6.

Számítsa ki az intervallum hosszát (tartományát) a (21) képlet segítségével:

h= (111,16 - 24,16)/6 = 87/6 = 14,5 (millió dollár).

Most építsünk fel egy intervallum sorozatot 6 csoporttal 14,5 millió dollár intervallumban. (lásd a 12. táblázat első 3 oszlopát).

12. táblázat A VO-eloszlás intervallumsorai vámhivatalok szerint, millió.

Hozzászólások csoportjai a VO mérete szerint

Hozzászólások száma

Intervallum felezőpont

xén' fi

Accum. frekvencia

| Xi- |fi

(xén- )2 fi

(xén- )3 fi

(xén- )4 fi

96,66 – 111,16

A grafikus ábrázolás alapvető segítséget nyújt egy disztribúciós sorozat és tulajdonságainak elemzéséhez. Az intervallumsort egy oszlopdiagram ábrázolja, amelyben az abszcissza tengely mentén elhelyezkedő oszlopok alapjai a változó attribútum értékeinek intervallumai, az oszlopok magasságai pedig a skálának megfelelő frekvenciák. az ordináta tengely. ábrán látható a mintában szereplő vámhivatalok VO érték szerinti megoszlásának grafikus ábrázolása. 4. Az ilyen típusú diagramokat ún hisztogram .

Rizs. 4. Eloszlási hisztogram 5. Eloszlási sokszög

Táblázat adatai. 12. és 3. ábra. A 4. ábra számos tulajdonságra jellemző eloszlási formát mutatja: a tulajdonság átlagos intervallumainak értékei gyakoribbak, a tulajdonság szélső (kis és nagy) értékei kevésbé gyakoriak. Ennek az eloszlásnak a formája közel áll a normál eloszlási törvényhez, amely akkor jön létre, ha egy változóváltozót nagyszámú tényező befolyásol, amelyek közül egyiknek sincs domináns értéke.

Ha van diszkrét eloszlási sorozat, vagy az intervallumok felezőpontjait használjuk (mint a VO-ra vonatkozó példánkban - a 12. táblázat 4. oszlopában az intervallumok felezőpontjait a az intervallum eleje és vége), akkor egy ilyen sorozat grafikus ábrázolását nevezzük poligon(lásd 5. ábra) , amelyet az egyenes pontok koordinátákkal való összekapcsolásával kapunk Xiés fi.

Statisztikai eloszlási sorozat- ez a populációs egységek rendezett felosztása csoportokba egy bizonyos változó tulajdonság szerint.
Az eloszlási sorozat kialakulásának hátterében álló tulajdonságtól függően vannak attribútum és variáció eloszlási sorozat.

A közös jellemző jelenléte az alapja a statisztikai sokaság kialakításának, amely leírás vagy mérés eredménye közös vonásai kutatási objektumok.

A statisztikai vizsgálat tárgya a változó (változó) jellemzők vagy statisztikai jellemzők.

A statisztikai jellemzők típusai.

Az eloszlási sorozatokat attribútumsorozatoknak nevezzük. minőségi alapon épült. Jelző- ez egy olyan tábla, amelynek neve van (például szakma: varrónő, tanár stb.).
Az elosztási sorozatokat táblázatokba szokás rendezni. táblázatban. A 2.8 az eloszlás attribútumsorozatát mutatja.
2.8. táblázat – Az ügyvédek által az Orosz Föderáció egyik régiójának állampolgárai számára nyújtott jogi segítségnyújtás típusainak megoszlása.

Variációs sorozat jellemzőértékek (vagy értéktartományok) és azok gyakorisága.
A variációs sorozatok terjesztési sorozatok mennyiségi alapon épül fel. Bármely variációs sorozat két elemből áll: változatokból és frekvenciákból.
A változatok egy jellemző egyedi értékei, amelyeket egy variációsorozatban vesz fel.
A gyakoriságok az egyes változatok száma vagy a variációs sorozat egyes csoportjai, azaz. ezek a számok azt mutatják, hogy bizonyos opciók milyen gyakran fordulnak elő egy elosztási sorozatban. Az összes gyakoriság összege határozza meg a teljes populáció méretét, mennyiségét.
A frekvenciákat frekvenciáknak nevezzük, amelyeket egy egység törtrészében vagy a teljes érték százalékában fejeznek ki. Ennek megfelelően a frekvenciák összege 1 vagy 100%. A variációs sorozat lehetővé teszi, hogy a tényleges adatok alapján értékeljük az eloszlási törvény formáját.

A tulajdonság variációjának természetétől függően vannak diszkrét és intervallum variációs sorozatok.
A táblázatban található egy példa egy diszkrét variációs sorozatra. 2.9.
2.9. táblázat – A családok megoszlása ​​az egyes apartmanokban elfoglalt szobák száma szerint 1989-ben az Orosz Föderációban.

A táblázat első oszlopa egy diszkrét variációs sorozat változatait mutatja be, a második oszlop a variációs sorozatok gyakoriságait, a harmadik oszlop pedig a gyakorisági mutatókat tartalmazza.

Variációs sorozat

Az általános populációban egy bizonyos mennyiségi jellemzőt vizsgálnak. Véletlenszerűen egy térfogatmintát veszünk ki belőle n, vagyis a minta elemeinek száma az n. A statisztikai feldolgozás első szakaszában körű minták, azaz számsorrend x 1 , x 2 , …, x n Emelkedő. Minden megfigyelt érték x i hívott választási lehetőség. Frekvencia m i az érték megfigyelésének száma x i a mintában. Relatív gyakoriság (gyakoriság) w i a frekvencia arány m i a minta méretéhez n: .
A variációs sorozatok tanulmányozásakor a kumulatív gyakoriság és a kumulatív gyakoriság fogalmát is alkalmazzák. Hadd x valami szám. Aztán a lehetőségek száma , akiknek az értékei kisebbek x, halmozott frekvenciának nevezzük: x i esetén n felhalmozott frekvenciának nevezzük w i max .
Egy attribútumot diszkrét változónak nevezünk, ha az egyedi értékei (változatai) valamilyen véges mennyiségben (általában egész számban) különböznek egymástól. Egy ilyen jellemző variációs sorozatát diszkrét variációs sorozatnak nevezzük.

1. táblázat: A frekvenciák diszkrét variációs sorozatának általános képe

Funkcióértékekx i x 1 x2 x n
Frekvenciákm i m 1 m2 m n

Folyamatosan változónak nevezünk egy attribútumot, ha értékei tetszőlegesen kis mértékben eltérnek egymástól, pl. az előjel egy adott intervallumban tetszőleges értéket vehet fel. Egy ilyen tulajdonság folytonos variációs sorozatát intervallumsorozatnak nevezzük.

2. táblázat: A frekvenciák intervallumvariációs sorozatának általános képe

3. táblázat: A variációs sorozat grafikus képei

SorSokszög vagy hisztogramEmpirikus eloszlásfüggvény
Diszkrét
intervallum
A megfigyelések eredményeit tekintve meghatározható, hogy a változatok hány értéke esett az egyes intervallumokba. Feltételezzük, hogy minden intervallum az egyik végéhez tartozik: vagy minden esetben a balhoz (gyakrabban), vagy minden esetben a jobbhoz, és a frekvenciák vagy frekvenciák a jelzett határokon belüli opciók számát mutatják. Különbségek a i – a i +1 parciális intervallumoknak nevezzük. A későbbi számítások leegyszerűsítése érdekében az intervallumvariáció-sorok helyettesíthetők egy feltételesen diszkrét sorozattal. Ebben az esetben az átlagérték én-edik intervallum választható x i, és a megfelelő intervallumfrekvencia m i- ennek az intervallumnak a gyakoriságára.
A variációs sorozatok grafikus ábrázolására leggyakrabban a sokszöget, a hisztogramot, a kumulatív görbét és az empirikus eloszlásfüggvényt használják.

táblázatban. 2.3 (Oroszország lakosságának csoportosítása az egy főre jutó átlagos jövedelem nagysága szerint 1994 áprilisában) intervallum variációs sorozat.
Kényelmes az eloszlássorozat elemzése grafikus ábrázolással, amely lehetővé teszi az eloszlás alakjának megítélését is. A variációs sorozatok frekvenciájában bekövetkezett változás természetének vizuális ábrázolását a sokszög és hisztogram.
A sokszög diszkrét variációs sorozatok megjelenítésekor használatos.
Ábrázoljuk például grafikusan a lakásállomány lakástípusok szerinti megoszlását (2.10. táblázat).
2.10. táblázat - A városi terület lakásállományának megoszlása ​​lakástípusok szerint (feltételes adatok).


Rizs. Lakáselosztási sokszög


Az y tengelyen nemcsak a frekvenciák értékei, hanem a variációs sorozatok frekvenciái is ábrázolhatók.
A hisztogramot a rendszer az intervallumvariáció-sorozat megjelenítéséhez. A hisztogram készítésekor az intervallumok értékeit az abszcissza tengelyen ábrázoljuk, a frekvenciákat pedig a megfelelő intervallumokra épített téglalapok ábrázolják. Az oszlopok magassága egyenlő időközök esetén legyen arányos a gyakorisággal. A hisztogram egy grafikon, amelyen egy sorozat egymás melletti oszlopokként jelenik meg.
Ábrázoljuk grafikusan a táblázatban megadott intervallumeloszlási sorozatokat. 2.11.
2.11. táblázat – A családok megoszlása ​​az egy főre jutó élettér nagysága szerint (feltételes számok).
N p / p Családok csoportjai az egy főre jutó élettér nagysága szerint Adott nagyságú lakótérrel rendelkező családok száma Felhalmozott családok száma
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TELJES 115 ----


Rizs. 2.2. A családok megoszlásának hisztogramja az egy főre jutó élettér nagysága szerint


A felhalmozott sorozatok adatait felhasználva (2.11. táblázat) megszerkesztjük eloszlás kumulatív.


Rizs. 2.3. A családok kumulatív megoszlása ​​az egy főre jutó élettér nagysága szerint


A variációs sorozatok kumulátum formájában történő ábrázolása különösen hatékony olyan variációs sorozatok esetében, amelyek gyakoriságát a sorozat gyakoriságainak összegének törtrészeként vagy százalékaként fejezzük ki.
Ha a variációs sorozat grafikus ábrázolásában a tengelyeket kumulátum formájában megváltoztatjuk, akkor azt kapjuk, ogivu. ábrán. A 2.4. táblázatban szereplő adatok alapján felépített ágat mutat be. 2.11.
A hisztogramot úgy alakíthatjuk át eloszlási sokszöggé, hogy megkeressük a téglalapok oldalainak felezőpontját, majd ezeket a pontokat egyenesekkel összekötjük. Az így kapott eloszlási sokszög a 2. ábrán látható. 2,2 pontozott vonal.
Egy nem egyenlő intervallumú variációs sorozat eloszlásának hisztogramjának elkészítésekor az ordináta tengely mentén nem frekvenciákat alkalmazunk, hanem a jellemző eloszlási sűrűségét a megfelelő intervallumokban.
Az eloszlási sűrűség az egységnyi intervallumszélességre számított gyakoriság, azaz. hány egység az egyes csoportokban egységnyi intervallumértékenként. Az eloszlási sűrűség kiszámítására példa a táblázatban látható. 2.12.
2.12. táblázat – Vállalkozások megoszlása ​​a foglalkoztatottak száma szerint (az adatok feltételesek)
N p / p Vállalkozáscsoportok létszám szerint, fő. Vállalkozások száma Intervallum mérete, fő Eloszlási sűrűség
DE 1 2 3=1/2
1 legfeljebb 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TELJES 147 ---- ----

A variációs sorozatok grafikus ábrázolásához szintén használhatók kumulatív görbe. A kumulátum (az összegek görbéje) segítségével felhalmozott frekvenciák sorozata jelenik meg. A felhalmozott gyakoriságokat úgy határozzuk meg, hogy a gyakoriságokat csoportonként egymás után összegezzük, és megmutatjuk, hogy a sokaság hány egységének jellemzői értéke nem nagyobb, mint a figyelembe vett érték.


Rizs. 2.4. Ogiva családok megoszlása ​​az egy főre jutó élettér nagysága szerint

Egy intervallumvariáció-sor kumulátumának megalkotásakor a sorozat változatait az abszcissza tengely mentén, a halmozott frekvenciákat pedig az ordináta tengely mentén ábrázoljuk.

Tetszett a cikk? Oszd meg