Kapcsolatok

Elosztási rangok. Statisztikai összesítés és csoportosítás

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Jó munka webhelyre">

Diákok, végzős hallgatók, fiatal tudósok, akik a tudásbázist tanulmányaikban és munkájukban használják, nagyon hálásak lesznek Önnek.

közzétett http://www.allbest.ru/

EGY FELADAT1

Az alábbi információk érhetők el erről bérek a vállalkozás alkalmazottai:

1.1. táblázat

A bérek összege konv. den. egységek

Fel kell építeni egy intervallum sorozatot az eloszlásból, amely alapján megtaláljuk;

1) átlagos fizetés;

2) átlagos lineáris eltérés;

4) átlagos szórás;

5) variációs tartomány;

6) oszcillációs együttható;

7) lineáris variációs együttható;

8) egyszerű variációs együttható;

10) medián;

11) aszimmetria együtthatója;

12) Pearson aszimmetria index;

13) kurtózis együttható.

Megoldás

Mint tudod, az opciók (felismert értékek) növekvő sorrendben vannak elrendezve diszkrét variációs sorozat. Nagy számmal változat (több mint 10), még diszkrét variáció esetén is intervallumsorok épülnek fel.

Ha egy intervallumsorozatot páros intervallumokkal állítunk össze, akkor a változási tartományt elosztjuk a megadott számú intervallummal. Ebben az esetben, ha a kapott érték egész szám és egyértelmű (ami ritka), akkor az intervallum hosszát ezzel a számmal egyenlőnek vesszük. Más esetekben előállított kerekítés szükségszerűen ban ben oldal nagyítás, Így nak nek az utolsó megmaradt számjegy páros volt. Nyilvánvalóan az intervallum hosszának növekedésével a eltérés tartománya az intervallumok számának szorzatával egyenlő értékkel: az intervallum számított és kezdeti hossza közötti különbséggel

a) Ha a változási tartomány bővülésének értéke jelentéktelen, akkor vagy hozzáadjuk a legnagyobbhoz, vagy kivonjuk a jellemző legkisebb értékéből;

b) Ha a változási tartomány bővülésének nagysága tapintható, akkor, hogy ne keveredjen a tartomány középpontja, nagyjából felezzük, egyszerre hozzáadva a legnagyobbhoz, és kivonva belőle. a legkisebb értékeket jel.

Ha egy intervallumsorozatot egyenlőtlen intervallumokkal állítunk össze, akkor a folyamat leegyszerűsödik, de a korábbiakhoz hasonlóan az intervallumok hosszát számként kell kifejezni az utolsó páros számjegygel, ami nagyban leegyszerűsíti a későbbi számításokat. numerikus jellemzők.

30 - mintanagyság.

Készítsünk intervallum eloszlás sorozatot a Sturges-képlet segítségével:

K \u003d 1 + 3,32 * lg n,

K - csoportok száma;

K = 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Az előjel tartományát - a vállalkozásnál dolgozók bére - (x) a képlet alapján találjuk meg

R \u003d xmax - xmin és oszd el 6-tal; R=195-112=83

Ekkor az intervallum hossza lesz l sáv=83:6=13,83

Az első intervallum eleje 112 lesz. Hozzáadás a 112-hez l ras=13,83, a végső értékét 125,83 kapjuk, ami egyben a második intervallum kezdete, és így tovább. az ötödik intervallum vége 195.

A frekvenciák megtalálásakor a következő szabályt kell követni: "ha egy jellemző értéke egybeesik a belső intervallum határával, akkor az előző intervallumra kell hivatkozni."

Megkapjuk a frekvenciák és a kumulatív frekvenciák intervallumsorozatát.

1.2. táblázat

Ezért 3 alkalmazottnak van fizetése. fizetés 112-ről 125,83 hagyományos egységre. A legmagasabb fizetés fizetés 181,15-ről 195 hagyományos egységre. csak 6 munkás.

A numerikus jellemzők kiszámításához az intervallum sorozatot diszkrétre alakítjuk, változatnak tekintve az intervallumok közepét:

1.3. táblázat

14131,83

A súlyozott számtani átlag képlet szerint

cond.mon.un.

Átlagos lineáris eltérés:

ahol xi a vizsgált jellemző értéke a sokaság i-edik egységében,

A vizsgált tulajdonság átlagértéke.

közzétett http://www.allbest.ru/

LP közzétéve http://www.allbest.ru/

Monetáris egység

Szórás:

Diszperzió:

Relatív változási tartomány (rezgési együttható): c=R:,

Relatív lineáris eltérés: q = L:

A variációs együttható: V = y:

Az oszcillációs együttható a tulajdonság szélsőértékeinek relatív ingadozását mutatja a számtani átlag körül, a variációs együttható pedig a populáció mértékét és homogenitását jellemzi.

c = R: \u003d 83 / 159,485 * 100% \u003d 52,043%

Így a szélsőértékek közötti különbség 5,16%-kal (=94,84%-100%) kisebb, mint a vállalkozásban dolgozók átlagkeresete.

q \u003d L: \u003d 17,765 / 159,485 * 100% \u003d 11,139%

V \u003d y: \u003d 21,704 / 159,485 * 100% \u003d 13,609%

A variációs együttható 33% alatti, ami a vállalkozásban dolgozók bérének gyenge ingadozását jelzi, pl. hogy az átlag a dolgozók bérének tipikus jellemzője (homogén aggregátum).

Az intervallum eloszlás sorozatban divat képlet határozza meg -

A modális intervallum gyakorisága, azaz az azt tartalmazó intervallum legnagyobb számban választási lehetőség;

A modált megelőző intervallum gyakorisága;

A modált követő intervallum gyakorisága;

A modális intervallum hossza;

A modális intervallum alsó határa.

Meghatározására mediánok az intervallum sorozatban a képletet használjuk

ahol a mediánt megelőző intervallum kumulatív (halmozott) gyakorisága;

A medián intervallum alsó határa;

A medián intervallum gyakorisága;

A medián intervallum hossza.

Medián intervallum- intervallum, amelynek halmozott gyakorisága (=3+3+5+7) meghaladja a frekvenciák összegének felét - (153,49; 167,32).

Számítsuk ki a ferdeséget és a gördülést, amelyhez új munkalapot állítunk össze:

1.4. táblázat

Tényszerű adatok

Becsült adatok

Számítsa ki a harmadik sorrend pillanatát!

Ezért az aszimmetria az

Mivel 0,3553 0,25, az aszimmetriát szignifikánsnak ismerjük el.

Számítsa ki a negyedik sorrend pillanatát!

Ezért a kurtosis az

Mert< 0, то эксцесс является плосковершинным.

A ferdeség mértéke a Pearson-féle ferdeségi együttható (As) segítségével határozható meg: oszcillációs minta költségforgalom

ahol az eloszlási sorozat számtani átlaga; -- divat; -- szórás.

Szimmetrikus (normál) eloszlásnál = Mo, tehát az aszimmetria együttható nulla. Ha Аs > 0, akkor több módus van, ezért jobboldali aszimmetria van.

Ha As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Az eloszlás nem szimmetrikus, hanem bal oldali aszimmetriával rendelkezik.

EGY FELADAT 2

Mekkora legyen a minta mérete, hogy 0,954 legyen annak a valószínűsége, hogy a mintavételi hiba ne haladja meg a 0,04-et, ha a korábbi felmérésekből ismert, hogy a szórás 0,24?

Megoldás

A nem ismétlődő mintavétel mintanagyságát a következő képlettel kell kiszámítani:

t - megbízhatósági együttható (0,954 valószínűséggel egyenlő 2,0-val; a valószínűségi integrálok táblázataiból határozzuk meg),

y2=0,24 - szórás;

10000 ember - minta nagysága;

Dx =0,04 - a mintaátlag határhibája.

95,4%-os valószínűséggel kijelenthető, hogy a mintanagyság, amely legfeljebb 0,04 relatív hibát biztosít, legalább 566 család legyen.

EGY FELADAT3

A következő adatok állnak rendelkezésre a vállalkozás fő tevékenységéből származó bevételről, millió rubel.

Egy sor dinamika elemzéséhez határozza meg a következő mutatókat:

1) lánc és alap:

Abszolút nyereség;

Növekedési ütemek;

Növekedési ráták;

2) közepes

Dinamikus tartomány szintje;

Abszolút növekedés;

Növekedési üteme;

A növekedés mértéke;

3) az 1%-os növekedés abszolút értéke.

Megoldás

1. abszolút növekedés (Dy)- ez a különbség a sorozat következő szintje és az előző (vagy alap) között:

lánc: Du \u003d yi - yi-1,

alap: Du \u003d yi - y0,

yi - sorszint,

i - sorszint száma,

y0 - bázisév szint.

2. Növekedési ütem (Tu) a sorozat következő szintjének és az előző szintnek (vagy a 2001-es bázisévnek) az aránya:

lánc: Tu = ;

alap: Tu =

3. Növekedési ütem (TD) - ez az abszolút növekedés aránya az előző szinthez képest, százalékban kifejezve.

lánc: Tu = ;

alap: Tu =

4. 1%-os növekedés abszolút értéke (A)- a lánc abszolút növekedésének aránya a növekedési ütemhez, százalékban kifejezve.

DE =

Középső sor szintje a számtani átlag képletével számítjuk ki.

Az alaptevékenységekből származó bevételek átlagos szintje 4 évre:

Átlagos abszolút növekedés képlettel számolva:

ahol n a sorozat szintjének száma.

Átlagosan az év során az alaptevékenységekből származó bevétel 3,333 millió rubelrel nőtt.

Átlagos éves növekedési ütem a geometriai átlag képlettel számítva:

уn - a sorozat végső szintje,

y0 - Első szint sor.

T = 100% \u003d 102,174%

Átlagos éves növekedési ütem képlettel számolva:

T? \u003d Tu - 100% \u003d 102,74% - 100% \u003d 2,74%.

Így az év átlagában 2,74%-kal nőtt a vállalkozás főtevékenységéből származó bevétel.

FELADATOKDE4

Kiszámítja:

1. Egyedi árindexek;

2. Általános forgalmi index;

3. Összesített árindex;

4. Az árueladás fizikai mennyiségének összesített indexe;

5. A forgalom abszolút értéknövekedése és a tényezők szerinti lebontás (az árak és az eladott áruk számának változása miatt);

6. Készítsen rövid következtetéseket az összes kapott mutatóról.

Megoldás

1. Feltétel szerint az A, B, C termékek egyedi árindexei -

ipA=1,20; ipB=1,15; iрВ=1,00.

2. A teljes forgalmi index kiszámítása a következő képlettel történik:

I w \u003d \u003d 1470/1045 * 100% \u003d 140,67%

A kereskedelmi forgalom 40,67%-kal (140,67% -100%) nőtt.

A nyersanyagárak átlagosan 10,24%-kal emelkedtek.

Az áremelésekből adódó többletköltségek összege a vásárlóknak:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333,478 \u003d 136,522 millió rubel.

Az emelkedő árak következtében a vásárlóknak további 136,522 millió rubelt kellett költeniük.

4. A fizikai forgalom általános mutatója:

A fizikai forgalom 27,61%-kal nőtt.

5. Határozzuk meg a második periódus teljes forgalomváltozását az első időszakhoz képest!

w \u003d 1470-1045 \u003d 425 millió rubel.

árváltozás miatt:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 millió rubel.

a fizikai hangerő megváltoztatásával:

w(q) \u003d 1333,478 - 1045 \u003d 288,478 millió rubel.

Az áruforgalom 40,67%-kal nőtt. Átlagosan 3 áru ára 10,24%-kal emelkedett. A fizikai forgalom 27,61%-kal nőtt.

Általánosságban elmondható, hogy az értékesítés volumene 425 millió rubellel nőtt, beleértve az emelkedő árak miatt 136,522 millió rubel, az értékesítési volumen növekedése miatt pedig 288,478 millió rubel növekedést.

EGY FELADAT5

Egy iparág 10 üzemére vonatkozóan a következő adatok állnak rendelkezésre.

Gyári sz.

Kimenet, ezer darab (X)

A megadott adatok alapján:

I) a faktorjel (termelési teljesítmény) és az eredő előjel (villamosenergia-fogyasztás) közötti lineáris korreláció meglétére vonatkozó logikai elemzésben foglaltak megerősítése, a kiindulási adatok ábrázolása a korrelációs mező grafikonján, és következtetések levonása a kapcsolat formáját, adja meg képletét;

2) határozza meg a kapcsolódási egyenlet paramétereit, és ábrázolja a kapott elméleti egyenest a korrelációs mező grafikonján;

3) kiszámítja a lineáris korrelációs együtthatót,

4) ismertesse a (2) és (3) bekezdésben kapott mutatók értékeit;

5) a kapott modell segítségével készítsen előrejelzést egy 4,5 ezer egység termelési volumenű üzem lehetséges villamosenergia-fogyasztásáról.

Megoldás

Karakteradatok - a kimenet mennyisége (tényező), хi-vel jelölve; jel - áramfogyasztás (eredmény) ui-n keresztül; az (x, y) koordinátákkal rendelkező pontokat az OXY korrelációs mezőn ábrázoljuk.

A korrelációs mező pontjai valamilyen egyenes mentén helyezkednek el. Ezért az összefüggés lineáris, a regressziós egyenletet Yx=ax+b egyenes alakban fogjuk keresni. Ennek megtalálásához a normál egyenletrendszert használjuk:

Hozzunk létre egy táblázatot.

A kapott átlagok alapján összeállítjuk a rendszert és megoldjuk az a és b paraméterek figyelembevételével:

Tehát megkapjuk az y regressziós egyenletét x-en: \u003d 3,57692 x + 3,19231

A korrelációs mezőre regressziós egyenest építünk.

Ha a 2. oszlop x értékeit behelyettesítjük a regressziós egyenletbe, megkapjuk a számítottakat (7. oszlop), és összehasonlítjuk az y adatokkal, amit a 8. oszlop is tükröz. Egyébként a számítások helyességét is megerősítjük. az y és az átlagértékek egybeesésével.

Együtthatólineáris korreláció kiértékeli az x és y jellemzők közötti kapcsolat szorosságát, és a képlettel számítja ki

A közvetlen regresszió a (x-nél) szögegyütthatója az azonosított irányát jellemzifüggőségekjelek: a>0-nál megegyeznek, a-nál<0- противоположны. Az abszolútja érték - az eredő előjel változásának mértéke, amikor a faktorelőjel mértékegységenként változik.

A közvetlen regresszió szabad tagja felfedi az irányt, és annak abszolút értékét - az összes többi tényező effektív jelére gyakorolt ​​hatás mennyiségi mérőszáma.

Ha egy< 0, akkor az egyedi objektum faktor attribútumának erőforrása kevesebbel és mikor kerül felhasználásra>0 Val velnagyobb teljesítmény, mint a teljes objektumkészlet átlaga.

Végezzünk utóregressziós elemzést.

A közvetlen regresszió x-nél az együtthatója 3,57692 > 0, ezért a kibocsátás növekedésével (csökkenésével) nő (csökken) a villamosenergia-fogyasztás. Kibocsátás növekedés 1 ezer darabbal. átlagosan 3,57692 ezer kWh-val növeli a villamosenergia-fogyasztást.

2. A közvetlen regresszió szabad tagsága 3,19231, ezért más tényezők hatása növeli a kibocsátás villamosenergia-fogyasztásra gyakorolt ​​hatásának erősségét. abszolút mérés 3,19231 ezer kWh-val.

3. A 0,8235-ös korrelációs együttható azt mutatja, hogy a villamosenergia-fogyasztás nagyon szorosan függ a teljesítménytől.

A regressziós modellegyenlet segítségével könnyű előrejelzéseket készíteni. Ehhez a regressziós egyenletbe behelyettesítik az x értékeket, amelyek a kibocsátott mennyiséget jelentik, és megjósolják a villamosenergia-fogyasztást. Ebben az esetben az x értékeit nem csak egy adott tartományon belül, hanem azon kívül is fel lehet venni.

Készítsünk előrejelzést egy 4,5 ezer darabos termelési volumenű üzem lehetséges villamosenergia-fogyasztásáról.

3,57692*4,5 + 3,19231= 19,288 45 ezer kWh.

HASZNÁLT FORRÁSOK LISTÁJA

1. Zakharenkov S.N. Társadalmi-gazdasági statisztika: Tanulmányi útmutató. - Minszk: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Általános elmélet statisztika. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statisztika. - M.: Prospekt, 2002.

4. A statisztika általános elmélete / Szerk. szerk. O.E. Bashina, A.A. Spirin. - M.: Pénzügy és statisztika, 2000.

5. Társadalmi-gazdasági statisztika: Tankönyv.-gyakorlat. juttatás / Zakharenkov S.N. stb. - Minszk: YSU, 2004.

6. Társadalmi-gazdasági statisztika: Proc. juttatás. / Szerk. Nesterovich S.R. - Minszk: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statisztika. - Minszk, 2000.

8. Kharchenko L.P. Statisztika. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statisztika. - M.: INFRA - M, 1999.

10. Gazdasági statisztika / Szerk. Yu.N. Ivanova - M., 2000.

Az Allbest.ru oldalon található

...

Hasonló dokumentumok

    Az intervallum eloszlási sorozat számtani átlagának kiszámítása. A fizikai forgalom általános mutatójának meghatározása. A teljes termelési költség abszolút változásának elemzése a fizikai mennyiség változásai miatt. Variációs együttható számítása.

    teszt, hozzáadva: 2010.07.19

    A nagy-, kis- és nyilvános kereskedelem lényege. Képletek egyéni, összesített forgalmi indexek kiszámításához. Az intervallum eloszlási sorozat jellemzőinek számítása - számtani átlag, módus és medián, variációs együttható.

    szakdolgozat, hozzáadva 2013.10.05

    Az értékesítés tervezett és tényleges volumenének számítása, a terv százalékos aránya, a forgalom abszolút változása. Az abszolút növekedés, az átlagos növekedési ráták és a készpénzbevétel növekedésének meghatározása. Strukturális átlagok számítása: módusok, mediánok, kvartilisek.

    teszt, hozzáadva 2012.02.24

    A bankok nyereségvolumen szerinti megoszlásának intervallumsorozata. A kapott intervallum eloszlás sorozat módusának és mediánjának megkeresése grafikus módszerrel és számítással. Az intervallum eloszlási sorozat jellemzőinek számítása. A számtani átlag kiszámítása.

    teszt, hozzáadva 2010.12.15

    Képletek az intervallumsorozat átlagértékeinek meghatározására - módok, mediánok, eltérések. Idősorok analitikai mutatóinak számítása lánc- és alapsémák szerint, növekedési ütemek és növekedés. A költségek, árak, költségek és forgalom összetett indexének fogalma.

    szakdolgozat, hozzáadva 2011.02.27

    A variációs sorozat felépítésének fogalma és célja, rendje és szabályai. Az adatok homogenitásának elemzése csoportokban. Egy tulajdonság variációjának (fluktuációjának) mutatói. Az átlagos lineáris és négyzetes eltérés, lengési együttható és variáció meghatározása.

    teszt, hozzáadva: 2010.04.26

    A módusz és medián fogalma, mint tipikus jellemzők, meghatározásuk sorrendje, kritériumai. Módus és medián megkeresése diszkrét és intervallum variációs sorozatban. Kvartilisek és decilisek, mint a variáció további jellemzői statisztikai sorozat.

    teszt, hozzáadva: 2010.11.09

    Eloszlás intervallumsorozatának felépítése csoportosítási alapon. A gyakorisági eloszlás szimmetrikus formától való eltérésének jellemzése, körtózis és aszimmetria mutatók számítása. A mérleg vagy eredménykimutatás mutatóinak elemzése.

    ellenőrzési munka, hozzáadva 2014.10.19

    Az empirikus sorozat átalakítása diszkrétre és intervallumra. Meghatározás közepes méretű tulajdonságait felhasználva diszkrét sorozatban. Módusok, mediánok, variációs mutatók (szórás, eltérés, oszcillációs együttható) diszkrét sorozatának számítása.

    teszt, hozzáadva: 2011.04.17

    Szervezetek megoszlásának statisztikai sorozatának felépítése. Az üzemmód értékének és mediánjának grafikus meghatározása. Az összefüggés szorossága a determinációs együttható használatával. A mintavételi hiba definíciója átlagos létszám dolgozók.

Ha a vizsgált valószínűségi változó folytonos, akkor a megfigyelt értékek rangsorolása és csoportosítása gyakran nem teszi lehetővé jellemvonásokértékeinek változtatásával. Ennek oka az egyéni értékek valószínűségi változó tetszőlegesen eltérhetnek egymástól, ezért a megfigyelt adatok összességében ritkán fordulhatnak elő azonos mennyiségi értékek, és a változatok gyakorisága is alig tér el egymástól.

Szintén nem praktikus diszkrét sorozatot építeni egy diszkrét valószínűségi változóhoz, amelynek lehetséges értékeinek száma nagy. Ilyen esetekben építkezni kell intervallum variációs sorozat terjesztés.

Egy ilyen sorozat felépítéséhez egy valószínűségi változó megfigyelt értékeinek teljes variációs intervallumát sorozatra osztjuk. részleges intervallumok és megszámoljuk a magnitúdóértékek előfordulási gyakoriságát az egyes részintervallumokban.

intervallum variációs sorozat egy valószínűségi változó értékeinek variációs intervallumainak rendezett halmazának nevezzük az érték minden egyes értékében a megfelelő gyakorisággal vagy relatív találati gyakorisággal.

Intervallumsorozat felépítéséhez a következőkre lesz szüksége:

  1. meghatározni érték részleges intervallumok;
  2. meghatározni szélesség intervallumok;
  3. állítsa be minden intervallumhoz azt tetejére és alsó határ ;
  4. csoportosítsa a megfigyelés eredményeit.

1 . A csoportosítási intervallumok számának és szélességének megválasztásának kérdését minden esetben ennek alapján kell eldönteni célokat kutatás, hangerő mintavétel és variáció mértéke jellemzője a mintában.

Az intervallumok hozzávetőleges száma k csak a minta nagyságából lehet megbecsülni n az alábbi módok egyikén:

  • képlet szerint Sturges : k = 1 + 3,32 log n ;
  • az 1. táblázat segítségével.

Asztal 1

2 . Általában előnyben részesítik az azonos szélességű intervallumokat. Az intervallumok szélességének meghatározása h kiszámítja:

  • variációs tartomány R - mintaértékek: R = x max - x min ,

ahol xmax és xmin - maximális és minimális minta lehetőségek;

  • az egyes intervallumok szélessége h a következő képlettel határozzuk meg: h = R/k .

3 . A lényeg első intervallum x h1 úgy van kiválasztva, hogy a minimális mintaváltozat xmin körülbelül ennek az intervallumnak a közepére esett: x h1 = x min - 0,5 óra .

Intervallumokúgy kapjuk, hogy az előző intervallum végéhez hozzáadjuk a részintervallum hosszát h :

xhi = xhi-1 +h.

Az intervallum skála felépítése az intervallumok határainak kiszámítása alapján az értékig folytatódik. x szia kielégíti a kapcsolatot:

x szia< x max + 0,5·h .

4 . Az intervallumskálának megfelelően az attribútum értékei csoportosítva vannak - minden részintervallumra a gyakoriságok összegét számítják ki n i bekapott változat én -edik intervallum. Ebben az esetben az intervallum egy valószínűségi változó értékeit tartalmazza, amelyek nagyobbak vagy egyenlőek az intervallum alsó határánál és kisebbek, mint az intervallum felső határa.

Sokszög és hisztogram

Az érthetőség kedvéért a statisztikai eloszlás különböző grafikonjait készítjük.

A diszkrét variációs sorozat adatai alapján megszerkesztjük poligon frekvenciák vagy relatív frekvenciák.

Frekvencia sokszög x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Frekvenciapoligon felépítéséhez az abszcissza tengelyen az opciók félre vannak állítva x i , és az y tengelyen - a megfelelő frekvenciák n i . Pontok ( x i ; n i ) egyenes vonalak szegmensei kötik össze, és frekvencia sokszöget kapunk (1. ábra).

Relatív gyakoriságú sokszög vonalláncnak nevezzük, amelynek szakaszai összekötik a pontokat ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; W k ). Ha relatív frekvenciák sokszögét szeretné felépíteni az abszcisszán, engedje el az opciókat x i , az y tengelyen pedig a hozzájuk tartozó relatív gyakoriságok Wi . Pontok ( x i ; Wi ) egyenesek szakaszai kötik össze, és relatív gyakoriságú sokszöget kapunk.

Mikor folyamatos funkció célszerű építeni hisztogram .

frekvencia hisztogram lépcsőzetes alakzatnak nevezzük, amely olyan téglalapokból áll, amelyek alapjai részleges hosszúságú intervallumok h , és a magasságok megegyeznek az aránnyal NIH, Nemzeti Egészségügyi Intézet (frekvencia sűrűség).

A frekvenciák hisztogramjának felépítéséhez részintervallumokat ábrázolunk az abszcissza tengelyen, és föléjük az abszcissza tengellyel párhuzamos szegmenseket húzunk bizonyos távolságban. NIH, Nemzeti Egészségügyi Intézet .

2. Az elosztási sorozat fogalma. Diszkrét és intervallum eloszlási sorozatok

elosztási sorok speciális típusú csoportosításokat hívunk, amelyekben minden attribútumra, attribútumcsoportra vagy attribútumosztályra vonatkozóan ismert a csoportban lévő egységek száma vagy ennek a számnak a részaránya az összességben. Azok. terjesztési sorozat– attribútumértékek rendezett halmaza növekvő vagy csökkenő sorrendben a megfelelő súlyokkal együtt. A disztribúciós sorozatok mennyiségi vagy attribútum alapján is felépíthetők.

A mennyiségi alapon felépített eloszlási sorozatokat variációs sorozatoknak nevezzük. Ők diszkrét és intervallum. Egy eloszlási sorozat épülhet folyamatosan változó jellemzőre (amikor egy adott intervallumon belül tetszőleges értéket vehet fel) és diszkréten változó jellemzőre (szigorúan meghatározott egész értékeket vesz fel).

diszkrét a variációs eloszlás sorozat változatok tartományok halmaza a hozzájuk tartozó gyakoriságokkal vagy részletekkel. Egy diszkrét sorozat változatai egy előjel diszkréten, szakaszosan változó értékei, általában ez egy számlálás eredménye.

Diszkrét

variációs sorozatokat általában akkor építenek, ha a vizsgált tulajdonság értékei legalább valamilyen véges értékkel eltérhetnek egymástól. A diszkrét sorozatokban egy jellemző pontértékei vannak megadva. Példa : Az üzletek által havonta eladott férfi öltönyök méret szerinti megoszlása.

intervallum

a variációs sorozat egy valószínűségi változó értékeinek változási intervallumainak rendezett halmaza, amelyek mindegyikébe esnek a megfelelő frekvenciák vagy gyakoriságok értékei. Az intervallumsorok egy folyamatosan változó jellemző eloszlásának elemzésére szolgálnak, amelynek értékét leggyakrabban méréssel vagy súlyozással rögzítik. Egy ilyen sor változatai egy csoportosítás.

Példa : Az élelmiszerboltban történő vásárlások megoszlása ​​összeg szerint.

Ha diszkrét variációs sorozatokban a frekvenciamenet közvetlenül a sorozat variánsára vonatkozik, akkor az intervallumokban a változatok csoportjára.

A disztribúciós sorozatokat célszerű grafikus ábrázolásukkal elemezni, ami lehetővé teszi mind az eloszlás formájának, mind a mintáknak a megítélését. Diszkrét sorozat a grafikonon szaggatott vonalként jelenik meg - elosztási terület. A téglalap alakú koordinátarendszerben való felépítéséhez a változó attribútum rangsorolt ​​(rendezett) értékeit ugyanazon a skálán ábrázolják az abszcisszán, és a frekvenciák kifejezésére szolgáló skálát az ordináta mentén ábrázolják.

Az intervallum sorozatok a következőképpen jelennek meg eloszlási hisztogramok(azaz oszlopdiagramok).

A hisztogram készítésekor az intervallumok értékeit az abszcissza tengelyen ábrázoljuk, a frekvenciákat pedig a megfelelő intervallumokra épített téglalapok ábrázolják. Az oszlopok magassága egyenlő időközök esetén legyen arányos a gyakorisággal.

Bármely hisztogram átalakítható eloszlások sokszögévé, ehhez téglalapjainak csúcsait egyenes szegmensekkel kell összekötni.

2. Index módszer az átlagos kibocsátás és az átlagos létszám kibocsátás változására gyakorolt ​​hatásának elemzésére

Index módszer Az általános mutatók dinamikájának elemzésére és összehasonlítására, valamint ezen mutatók szintjének változását befolyásoló tényezőkre szolgál. Az indexek segítségével feltárható, hogy az átlagos kibocsátás és az átlagos létszám milyen hatással van a termelés volumenének alakulására. Ezt a problémát analitikus indexek rendszerének felépítésével oldjuk meg.

A termelési volumen indexe az átlagos foglalkoztatotti létszám indexével és az átlagos kibocsátás indexével ugyanúgy összefügg, mint a termelés volumene (Q) a kibocsátással ( w)és szám ( r) .

Megállapíthatjuk, hogy a termelés volumene megegyezik az átlagos termelés és az átlagos létszám szorzatával:

Q = w r, ahol Q a termelés mennyisége,

w - átlagos teljesítmény,

r az átlagos létszám.

Mint látható, beszélgetünk a statikai jelenségek kapcsolatáról: két tényező szorzata adja a létrejövő jelenség össztérfogatát. Az is nyilvánvaló, hogy ez a kapcsolat funkcionális, ezért ennek a kapcsolatnak a dinamikáját indexek segítségével vizsgáljuk. A megadott példában ez a következő rendszer:

J w × J r = J wr .

Például a Jwr termelési volumen indexe, mint egy eredő jelenség indexe, két indextényezőre bontható: az átlagos kibocsátás indexére (Jw) és az átlagos létszám indexére (Jr):

Index Index Index

az átlag térfogata

termelés kimeneti erőssége

ahol J w- a Laspeyres-képlettel számított munkatermelékenységi index;

J r- az alkalmazottak számának mutatója, a Paasche-képlet szerint számítva.

Az indexrendszerek arra szolgálnak, hogy meghatározzák az egyes tényezők hatását az effektív mutató szintjének kialakulására, lehetővé teszik az ismeretlen értékének meghatározását 2 ismert indexértékkel.

A fenti indexrendszer alapján a termelés volumenének abszolút növekedése is megtalálható, tényezők hatására lebontva.

1. Teljes termelési volumennövekedés:

∆wr = ∑w 1 r 1 - ∑w 0 r 0.

2. Növekedés az átlagos kibocsátási mutató hatására:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Növekedés az átlagos létszám mutatójának hatására:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Példa. A következő információk ismertek

Megállapíthatjuk, hogyan változott a termelés volumene relatív és abszolút értékben, és az egyes tényezők hogyan befolyásolták ezt a változást.

A termelés mennyisége a következő volt:

a bázisidőszakban

w 0 * r 0 = 2000 * 90 \u003d 180000,

és a jelentésben

w 1 * r 1 = 2100 * 100 \u003d 210 000.

Ennek következtében a termelés volumene 30 ezerrel, 1,16%-kal nőtt.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

vagy (210000:180000)*100%=1,16%.

A termelés volumenében bekövetkezett változás a következők miatt következett be:

1) az átlagos létszám 10 fővel vagy 111,1%-kal nő

r 1 / r 0 \u003d 100 / 90 \u003d 1,11 vagy 111,1%.

Abszolút értékben ennek a tényezőnek köszönhetően a termelés volumene 20 000-rel nőtt:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

2) az átlagos teljesítmény növekedése 105%-kal vagy 10 000-rel:

w 1 r 1 / w 0 r 1 = 2100 * 100 / 2000 * 100 \u003d 1,05 vagy 105%.

Abszolút értékben a növekedés:

w 1 r 1 - w 0 r 1 \u003d (w 1 - w 0) r 1 \u003d (2100-2000) * 100 \u003d 10000.

Tehát a tényezők együttes hatása a következő volt:

1. Abszolút értékben

10000 + 20000 = 30000

2. Relatív értelemben

1,11 * 1,05 = 1,16 (116%)

A növekedés tehát 1,16%-os. Mindkét eredmény született már korábban.

Az "index" szó fordításban mutatót, indikátort jelent. A statisztikában az indexet relatív mutatóként értelmezik, amely egy jelenség időben, térben vagy a tervhez viszonyított változását jellemzi. Mivel az index relatív érték, az indexek nevei összhangban vannak a relatív értékek nevével.

Azokban az esetekben, amikor egy összehasonlított termék időbeli változását elemezzük, feltehetjük a kérdést, hogy hogyan különféle feltételek(különböző területeken) változnak az index összetevői (ár, fizikai mennyiség, termelés vagy értékesítés szerkezete). bizonyos fajták Termékek). Ebben a tekintetben állandó összetételű, változó összetételű és szerkezeti eltolódású indexek épülnek fel.

Állandó (rögzített) összetételi index - ez egy olyan index, amely az átlagérték dinamikáját jellemzi a sokaság azonos fix szerkezetével.

Az állandó összetételű index felépítésének elve az, hogy kiküszöböljük a súlyok szerkezetében bekövetkezett változások hatását az indexált értékre, az indexált mutató súlyozott átlagának azonos súlyokkal történő kiszámításával.

Az állandó összetétel indexe formailag megegyezik az aggregált indexszel. Az összesített forma a leggyakoribb.

A konstans összetételi indexet bármely időszak egyik szintjén rögzített súlyokkal számítják ki, és csak az indexált érték változását mutatja. Az állandó összetételi index kiküszöböli a súlyok szerkezetében bekövetkezett változások hatását az indexált értékre azáltal, hogy az indexált mutató súlyozott átlagos szintjét azonos súlyokkal számítja ki. Az állandó összetételű indexekben a jelenségek állandó szerkezete alapján számított mutatókat hasonlítják össze.

A nagy mennyiségű információ feldolgozásakor, ami különösen fontos a modern tudományos fejlesztések során, a kutató komoly feladat előtt áll a kiindulási adatok helyes csoportosítása. Ha az adatok diszkrétek, akkor, mint láttuk, nincs probléma - csak ki kell számítani az egyes funkciók gyakoriságát. Ha a vizsgált tulajdonság rendelkezik folyamatos karaktert (ami a gyakorlatban elterjedtebb), akkor egy jellemző csoportosításához az optimális intervallumszám kiválasztása korántsem triviális feladat.

A folytonos valószínűségi változók csoportosításához a jellemző teljes variációs tartományát meghatározott számú intervallumra osztjuk nak nek.

Csoportos intervallum (folyamatos) variációs sorozat nevezett intervallumok a jellemző értéke szerint rangsorolva (), ahol a megfelelő gyakoriságokkal () együtt jelzik az r "-edik intervallumba eső megfigyelések számát vagy a relatív gyakoriságokat ():

Jellemző értékintervallumok

mi frekvencia

oszlopdiagramés kumulálódik (ogiva),általunk már részletesen tárgyalt, kiváló adatvizualizációs eszköz, amely lehetővé teszi az adatstruktúra elsődleges megértését. Az ilyen grafikonok (1.15. ábra) a folytonos adatokra ugyanúgy épülnek fel, mint a diszkrét adatokra, csak azt a tényt figyelembe véve, hogy a folytonos adat tetszőleges értéket véve teljesen kitölti a lehetséges értékeinek területét.

Rizs. 1.15.

Ezért a hisztogram és a kumulátum oszlopainak érintkezniük kell egymással, nem lehetnek olyan területek, ahol az attribútumértékek nem esnek az összes lehetséges közé(azaz a hisztogramon és a kumulátumon nem lehetnek "lyukak" az abszcissza tengely mentén, amelyekbe a vizsgált változó értékei nem esnek, mint az 1.16. ábrán. A sáv magassága megfelel a gyakoriságnak - az adott intervallumba eső megfigyelések számának, vagy a relatív gyakoriságnak - a megfigyelések arányának. Intervallumok nem szabad keresztezniés általában azonos szélességűek.

Rizs. 1.16.

A hisztogram és a sokszög a valószínűségi sűrűséggörbe (differenciálfüggvény) közelítései. f(x) a valószínűségszámítás során figyelembe vett elméleti eloszlás. Ezért konstrukciójuk a kvantitatív folytonos adatok elsődleges statisztikai feldolgozásában olyan nagy jelentőséggel bír - formájuk alapján megítélhető a hipotetikus eloszlási törvény.

Kumuláció - az intervallumvariációs sorozat felhalmozott frekvenciáinak (frekvenciáinak) görbéje. Az integráleloszlásfüggvény grafikonját összehasonlítjuk a kumulátummal F(x), amelyet a valószínűségszámítás során is figyelembe vettek.

Alapvetően a hisztogram és a kumulátum fogalma pontosan a folytonos adatokhoz és azok intervallumvariációs sorozataihoz kapcsolódik, mivel grafikonjaik a valószínűségi sűrűségfüggvény, illetve az eloszlásfüggvény empirikus becslései.

Az intervallumvariációs sorozat felépítése az intervallumok számának meghatározásával kezdődik k. Ez a feladat pedig talán a legnehezebb, legfontosabb és legvitatottabb a vizsgált kérdésben.

Az intervallumok száma ne legyen túl kicsi, mert a hisztogram túl sima lesz ( túlsimítva), elveszíti a kiindulási adatok változékonyságának minden jellemzőjét - az ábrán. 1.17 láthatja, hogy ugyanazok az adatok, amelyeken a grafikonok az 1.1. Az 1.15-öt kisebb számú intervallumú hisztogram készítésére használják (bal oldali grafikon).

Ugyanakkor az intervallumok száma ne legyen túl nagy - különben nem tudjuk megbecsülni a vizsgált adatok eloszlási sűrűségét a numerikus tengely mentén: a hisztogram alulsimítottnak bizonyul. (alulsimított) kitöltetlen intervallumokkal, egyenetlen (lásd 1.17. ábra, jobb oldali grafikon).

Rizs. 1.17.

Hogyan határozzuk meg az intervallumok legelőnyösebb számát?

1926-ban Herbert Sturges egy képletet javasolt az intervallumok számának kiszámítására, amelyekre fel kell osztani a vizsgált attribútum kezdeti értékkészletét. Ez a képlet valóban rendkívül népszerűvé vált - a legtöbb statisztikai tankönyv kínálja, és sok statisztikai csomag alapértelmezés szerint használja. Hogy ez indokolt-e és minden esetben, az nagyon komoly kérdés.

Mire épül tehát a Sturges-képlet?

Tekintsük a binomiális eloszlást )

Tetszett a cikk? Oszd meg