Контакты

Группировка данных и построение ряда распределения. Студентам и школьникам - помощь в учебе

При построении интервального ряда распределения решаются три вопроса:

  • 1. Сколько надо взять интервалов?
  • 2. Какова длина интервалов?
  • 3. Каков порядок включения единиц совокупности в границы интервалов?
  • 1. Количество интервалов можно определить по формуле Стер- джесса :

2. Длина интервала, или шаг интервала , обычно определяется по формуле

где R - размах вариации.

3. Порядок включения единиц совокупности в границы интервала

может быть разным, но при построении интервального ряда распределения обязательно строго определен.

Например, такой: [), при котором единицы совокупности в нижние границы включаются, а в верхние - не включаются, а переносятся в следующий интервал. Исключение в этом правиле составляет последний интервал , верхняя граница которого включает последнее число ранжированного ряда.

Границы интервалов бывают:

  • закрытые - с двумя крайними значениями признака;
  • открытые - с одним крайним значением признака (до такого-то числа или свыше такого-то числа).

С целью усвоения теоретического материала введем исходную информацию для решения сквозной задачи.

Имеются условные данные по среднесписочной численности менеджеров по продажам, количеству проданного ими однокачественного товара, индивидуальной рыночной цене на этот товар, а также объему продаж 30 фирм в одном из регионов РФ в I квартале отчетного года (табл. 2.1).

Таблица 2.1

Исходная информация для сквозной задачи

Численность

менеджеров,

Цена, тыс. руб.

Объем продаж, млн руб.

Численность

менеджеров,

Количество проданного товара, шт.

Цена, тыс. руб.

Объем продаж, млн руб.

На базе исходной информации, а также дополнительной сделаем постановку отдельных заданий. Затем представим методику их решения и сами решения.

Сквозная задача. Задание 2.1

Используя исходные данные табл. 2.1, требуется построить дискретный ряд распределения фирм по количеству проданного товара (табл. 2.2).

Решение:

Таблица 2.2

Дискретный ряд распределения фирм по количеству проданного товара в одном из регионов РФ в I квартале отчетного года

Сквозная задача. Задание 2.2

требуется построить ранжированный ряд 30 фирм по среднесписочной численности менеджеров.

Решение:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Сквозная задача. Задание 2.3

Используя исходные данные табл. 2.1, требуется:

  • 1. Построить интервальный ряд распределения фирм по численности менеджеров.
  • 2. Рассчитать частости ряда распределения фирм.
  • 3. Сделать выводы.

Решение:

Рассчитаем по формуле Стерджесса (2.5) количество интервалов :

Таким образом, берем 6 интервалов (групп).

Длину интервала , или шаг интервала , рассчитаем по формуле

Примечание. Порядок включения единиц совокупности в границы интервала такой: I), при котором единицы совокупности в нижние границы включаются, а в верхние - не включаются, а переносятся в следующий интервал. Исключение в этом правиле составляет последний интервал I ], верхняя граница которого включает последнее число ранжированного ряда.

Строим интервальный ряд (табл. 2.3).

Интервальный ряд распределения фирм но среднесписочной численности менеджеров в одном из регионов РФ в I квартале отчетного года

Вывод. Наиболее многочисленной группой фирм является группа со среднесписочной численностью менеджеров 25- 30 человек, которая включает 8 фирм (27%); в самую малочисленную группу со среднесписочной численностью менеджеров 40-45 человек входит всего одна фирма (3%).

Используя исходные данные табл. 2.1, а также интервальный ряд распределения фирм по численности менеджеров (табл. 2.3), требуется построить аналитическую группировку зависимости между численностью менеджеров и объемом продаж фирм и на основании ее сделать вывод о наличии (или отсутствии) связи между указанными признаками.

Решение:

Аналитическая группировка строится по факторному признаку. В нашей задаче факторным признаком (х) является численность менеджеров, а результативным признаком (у) - объем продаж (табл. 2.4).

Построим теперь аналитическую группировку (табл. 2.5).

Вывод. На основании данных построенной аналитической группировки можно сказать, что с увеличением численности менеджеров по продажам средний в группе объем продаж фирмы также увеличивается, что свидетельствует о наличии прямой связи между указанными признаками.

Таблица 2.4

Вспомогательная таблица для построения аналитической группировки

Численность менеджеров, чел.,

Номер фирмы

Объем продаж, млн руб., у

» = 59 f = 9,97

Я-™ 4 - Ю.22

74 ’25 1ПЙ1

У4 = 7 = 10,61

у = ’ =10,31 30

Таблица 2.5

Зависимость объемов продаж от численности менеджеров фирм в одном из регионов РФ в I квартале отчетного года

КОНТРОЛЬНЫЕ ВОПРОСЫ
  • 1. В чем суть статистического наблюдения?
  • 2. Назовите этапы статистического наблюдения.
  • 3. Каковы организационные формы статистического наблюдения?
  • 4. Назовите виды статистического наблюдения.
  • 5. Что такое статистическая сводка?
  • 6. Назовите виды статистических сводок.
  • 7. Что такое статистическая группировка?
  • 8. Назовите виды статистических группировок.
  • 9. Что такое ряд распределения?
  • 10. Назовите конструктивные элементы ряда распределения.
  • 11. Каков порядок построения ряда распределения?

Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений зачастую не позволяют выделить характерные черты варьирования ее значений. Это объясняется тем, что отдельные значения случайной величины могут как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины могут встречаться редко, а частоты вариантов мало отличаются друг от друга.

Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В подобных случаях следует строить интервальный вариационный ряд распределения.

Для построения такого ряда весь интервал варьирования наблюдаемых значений случайной величины разбивают на ряд частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал.

Интервальным вариационным рядом называют упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины.

Для построения интервального ряда необходимо:

  1. определить величину частичных интервалов;
  2. определить ширину интервалов;
  3. установить для каждого интервала его верхнюю и нижнюю границы ;
  4. сгруппировать результаты наблюдении.

1 . Вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке.

Приблизительно число интервалов k можно оценить исходя только из объема выборки n одним из следующих способов:

  • по формуле Стержеса : k = 1 + 3,32·lg n ;
  • с помощью таблицы 1.

Таблица 1

2 . Обычно предпочтительны интервалы одинаковой ширины. Для определения ширины интервалов h вычисляют:

  • размах варьирования R - значений выборки: R = x max - x min ,

где x max и x min - максимальная и минимальная варианты выборки;

  • ширину каждого из интервалов h определяют по следующей формуле: h = R/k .

3 . Нижняя граница первого интервала x h1 выбирается так, чтобы минимальная варианта выборки x min попадала примерно в середину этого интервала: x h1 = x min - 0,5·h .

Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала h :

x hi = x hi-1 +h .

Построение шкалы интервалов на основе вычисления границ интервалов продолжается до тех пор, пока величина x hi удовлетворяет соотношению:

x hi < x max + 0,5·h .

4 . В соответствии со шкалой интервалов производится группирование значений признака - для каждого частичного интервала вычисляется сумма частот n i вариант, попавших в i -й интервал. При этом в интервал включают значения случайной величины, большие или равные нижней границе и меньшие верхней границы интервала.

Полигон и гистограмма

Для наглядности строят различные графики статистического распределения.

По данным дискретного вариационного ряда строят полигон частот или относительных частот.

Полигоном частот x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат - соответствующие им частоты n i . Точки (x i ; n i ) соединяют отрезками прямых и получают полигон частот (Рис. 1).

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; W k ). Для построения полигона относительных частот на оси абсцисс откладывают варианты x i , а на оси ординат - соответствующие им относительные частоты W i . Точки (x i ; W i ) соединяют отрезками прямых и получают полигон относительных частот.

В случае непрерывного признака целесообразно строить гистограмму .

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h , а высоты равны отношению n i / h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии n i / h .

Располагая данные статистического наблюдения, характеризующих то или иное явление, прежде всего необходимо их упорядочить, т.е. придать характер системности

Английский статистик. УДжРейхман по поводу неупорядоченных совокупностей образно сказал, что столкнуться с массой необобщенных данных равнозначно ситуации, когда человека бросают в лесной чаще без компаса. Что же собой представляет систематизация статистических данных в виде рядов распределениялу?

Статистический ряд распределения - это упорядоченные статистические совокупности (табл. 17). Простейшим видом статистического ряда распределения ранжированном ряд, т.е. ряд чисел, находящейся в порядке возрастания ч или падения варьируя признаки. Такой ряд не позволяет судить о закономерности, заложенные в распределенных данных: у какой величины группируется большинство показателей, какие есть отклонения от этой величины; как а общая картина распределения. С этой целью группируют данные, показывая, как часто встречаются отдельные наблюдения в общем их числе (Схема 1а 1).

. Таблица 17

. Общий вид статистических рядов распределения

. Схема 1. Схемастатистичних рядов распределения

Распределение единиц совокупности по признакам, не имеют количественного выражения, называется атрибутивным рядом (например, распределение предприятий по их производственным направлением)

Ряды распределения единиц совокупности по признакам, имеют количественное выражение, называются вариационными рядами . В таких рядах значение признака (варианты) находятся в порядке возрастания или убывания

В вариационном ряде распределения различают два элемента: варианта и частота. Варианта - это отдельное значение группировочного признаки частота - число, которое показывает, сколько раз встречается каждый варианта

В математической статистике исчисляется еще один элемент вариационного ряда - частисть . Последняя определяется как отношение частоты случаев данного интервала к общей сумме частот частисть определяется в долях единицы, процентах (%) в промилле (% о)

Таким образом, вариационный ряд распределения - это такой ряд, в котором варианты расположены в порядке возрастания или убывания, указаны их частоты или частости. Вариационные ряды бывают дискретные (переривни) и др. нтервальни (непрерывного).

. Дискретные вариационные ряды - это такие ряды распределения, в которых варианта как величина количественного признака может принимать только определенное значение. Варианты различаются между собой на одну или несколько единиц

Так, количество произведенных деталей за смену конкретным рабочим может выражаться только одним определенным числом (6, 10, 12 и тд). Примером дискретного вариационного ряда может быть распределение работников по к количеством произведенных деталей (табл 18 18).

. Таблица 18

. Дискретный ряд распределения _

. Интервальные (непрерывного) вариационные ряды - такие ряды распределения, в которых значение варианты даны в виде интервалов, т.е. значения признаков могут отличаться друг от друга на сколь угодно малую величину. При построении вариационного ряда нэп переривнои признаки невозможно указать каждое значение варианты, поэтому совокупность распределяется по интервалам. Последние могут быть равны и неравны. Для каждого из них указываются частоты или частости (табл. 1 9 19).

В интервальных рядах распределения с неравными интервалами вычисляют такие математические характеристики, как плотность распределения и относительная плотность распределения на данном интервале. Первая характеристика определи ся отношением частоты до величины того же интервала, вторая - отношением частости к величине того же интервала. Для приведенного выше примера плотность распределения на первом интервале составит 3: 5 = 0,6, а относительная плотность на этом интервале - 7,5:5 = 1,55%.

. Таблица 19

. Интервальный ряд распределения _

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Наиболее простым способом обобщения статистического материала является построение рядов. Результатом сводки статистического исследования могут быть ряды распределения.

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.

Ряд распределния является одним из видов группировок.

Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.

  1. Виды рядов распределения

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

    атрибутивными называют ряды распределения, построенные по качественными признакам;

    вариационными называют ряды распределения, построенные в порядке возрастания или убывания значений количественного признака.

Вариационный ряд распределения состоит из двух столбцов. В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются. Дискретная варианта - выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд. Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

    частоты - это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака; сумма всех частот должна быть равна численности единиц всей совокупности;

    частости - это частоты выраженные в процентах к итогу; сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Вариационный ряд характеризуется двумя элементами: вариантой (Х) и частотой (f). Варианта – это отдельное значение признака отдельной единицы или группы совокупности. Число, показывающее, сколько раз встречается то или иное значение признака, называется частотой. Если частота выражена относительным числом, то она называется частостью.

Вариационный ряд может быть:

    интервальным, когда определены границы «от» и «до», интервальные ряды распределения можно представить графически в виде гистограммы;

    дискретным, когда изучаемый признак характеризуется определенным числом.

  1. Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:

    полигона;

    гистограммы;

    кумуляты;

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) - частоты или частости.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат - накопленные частоты или частости.

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака - на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат - накопленные значения доли (в процентах) по объему признака.

Понравилась статья? Поделитесь ей