Построение полигона, гистограммы, кумуляты, огивы. Графическое изображение вариационных рядов Построить полигон распределения частот

Жаропонижающие средства для детей назначаются педиатром. Но бывают ситуации неотложной помощи при лихорадке, когда ребенку нужно дать лекарство немедленно. Тогда родители берут на себя ответственность и применяют жаропонижающие препараты. Что разрешено давать детям грудного возраста? Чем можно сбить температуру у детей постарше? Какие лекарства самые безопасные?

Решение.

Строим точки основываясь на данных из таблицы. Полученные точки соединяем отрезками прямой. Обратите внимание на точки (0; 0) и (13; 0), расположенные на оси абсцисс и имеющие своими абсциссами числа, на 1 меньшее и большее, чем соответственно абсциссы самой левой и самой правой точек. Полигон частот изображен на рисунке.

Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов. Крайние левую и правую точки соединяют с точками оси абсцисс - серединами ближайших интервалов, частоты которых равны нулю. Конечно, в этом случае полигон лишь приближенно отображает зависимость частот от значений аргумента.

Кумулята служит для графического изображения кумулятивного вариационного ряда. Для ее построения на оси абсцисс откладывают значения аргумента, а на оси ординат - накопленные частоты или накопленные относительные частоты. Масштаб на каждой оси выбирают произвольно. Далее строят точки, абсциссы которых равны вариантам (в случае дискретных рядов) или верхним границам интервалов (в случае интервальных рядов), а ординаты - соответствующим частотам (накопленным частотам). Эти точки соединяют отрезками прямой. Полученная ломаная и является кумулятой.

Пример построения кумуляты

По данным таблицы составить кумулятивный вариационный ряд, для которого построить кумуляту.

Решение.

Cоставим кумулятивный вариационный ряд (см. таблицу ниже), для которого построим кумуляту.

Гистограмму используют для изображения интервальных рядов. Для построения гистограммы по данным вариационного ряда с равными интервалами, как и для построения полигона, на оси абсцисс откладывают значения аргумента, а на оси ординат - значения частот или относительных частот. Далее строят прямоугольники, основаниями которых служат отрезки оси абсцисс, длины которых равны длинам интервалов, а высотами - отрезки, длины которых пропорциональны частотам или относительным частотам соответствующих интервалов.

В результате получают ступенчатую фигуру в виде сдвинутых друг к другу прямоугольников, площади которых пропорциональны частотам (или относительным частотам).

Если интервалы неравные, то на оси ординат следует откладывать в произвольно выбранном масштабе значения плотности распределения (абсолютной или относительной). Таким образом, высоты прямоугольников, которые мы строим, должны равняться плотностям соответствующих интервалов.



При графическом изображении вариационного ряда с помощью гистограммы плотность изображается так, как если бы она оставалась постоянной внутри каждого интервала. На самом деле, как правило, это не так. Если построить распределение по частям интервалов, то можно убедиться в том, что плотность распределения на различных участках интервала не остается постоянной. Плотность, полученная ранее, представляла лишь некоторую среднюю плотность. Итак, гистограмма изображает не фактическое изменение плотности распределения, а лишь средние плотности распределения на каждом интервале.

Если построена гистограмма интервального распределения, то полигон того же распределения можно получить, если соединить прямолинейными отрезками середины верхних оснований прямоугольников.

Пример построения гистограммы

По результатам тестирования по математике учащихся 7-го класса получены данные о доступности заданий теста (отношение числа учащихся, правильно выполнивших задания, к числу тестировавшихся учащихся), предствленные ниже, в таблице.
Тест содержал 25 заданий. Построить гистограмму.

Решение.

Откладываем на оси абсцисс 7 отрезков длиной 10. На них, как на основаниях, строим прямоугольники, высоты которых соответственно равны 1, 1, 5, 7, 7, 3, 1. Полученная ступенчатая фигура и является искомой гистограммой.

Пример построения гистограммы

Данные, приведенные в предыдущем примере представим более подробно (см. таблицу ниже.). Построить гистограмму.

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации

В результате обработки и систематизации первичных статистических материалов получаются ряды цифровых статистических показателей, которые характеризуют отдельные стороны изучаемых явлений. Эти ряды называются статистическими.

Статистические ряды бывают двух видов: ряды распределения и ряды динамики (рис. 1).

Статистические ряды

Ряды распределения Ряды динамики

Атрибутивные Вариационные

Дискретные Непрерывные

(Интервальные)

Рисунок 1 – Виды рядов распределения

Ряды распределения – это ряды, которые характеризуют распределение единиц совокупности по какому-либо признаку (например, распределение производственного оборудования по видам и срокам службы). Ряд распределения состоит из двух элементов: вариант – значений группировочного признака и частот – число повторений отдельных вариантов значений признака.

Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака, применяется только один показатель - численность групп.

Частоты, представленные в относительном выражении, называют частостями и обозначают .

Например, вместо абсолютного числа рабочих, имеющих определённый разряд, можно установить долю рабочих этого разряда. Частости могут быть выражены в долях единицы или в процентах. Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.

По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, то есть даны в виде прерывных чисел. Например, тарифный разряд рабочих, количество детей в семье, число рабочих на предприятии. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определённых границах принимать любые значения. Например, заработная плата рабочих, стоимость основных фондов предприятия.



Атрибутивный ряд распределения образуется по качественному признаку (распределение рабочих по профессиям, машин – по маркам). Вариационный ряд распределения образуется по количественному признаку. Он состоит из вариант и частот. В дискретном ряде распределения отдельные варианты имеют определённые значения (распределение рабочих по разрядам). В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения этого признака у отдельных единиц могут вообще не повторяться, строятся интервальные ряды распределения. Интервал указывает определённые пределы значений варьирующего признака и обозначается верхней и нижней границей интервала.

Различают ряды распределения с абсолютными, относительными и накопленными частотами. Накопленные частоты называют кумулятивными.

Если приведён вариационный ряд с неравными интервалами, то для правильного представления о характере распределения необходимо рассчитать плотность распределения. Плотность распределения – это количество единиц совокупности, приходящихся на единицу величины интервала группировочного признака. Различают абсолютную () и относительную () плотность:

где – частота;

– удельный вес;

– размер интервала.

По форме ряды распределения бывают одно- двух- и многовершинными. Среди одновершинных распределений есть симметричные и асимметричные (скошенные), остро- и плосковершинные.

Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения.

Для графического изображения дискретного ряда применяют полигон распределения. Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (xi,mi) , где xi – варианты выборки и mi – соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов.

Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абс­цисс откладывают значения аргумента (вари­анты), а на оси ординат – значения час­тот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами (xi,mi) и последовательно соединяют их отрезками прямой.

Рисунок 2 – Полигон распределения

Для графического изображения интервальных вариационных рядов применяются гистограммы. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частностям) интервала.

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс на середины интервалов, в которых частоты (частности) равны нулю. При построении гистограммы для вариационного ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения.

Рисунок 3 – Гистограмма

При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что приводит к уменьшению величины интервала. При этом ломанная линия имеет тенденцию превращения в плавную кривую, которую называют кривой распределения. Кривая распределения характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри однокачественной совокупности.

Кумулята или кривая накопленных частот в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат – накопленные частоты или частости (рисунок 4).

Накопленной частоты, т. е. число значений, которые попали в этот интервал и все предшествующие.

Рисунок 4 – Кумулята (кривая накопленных частот)

Следует отметить, что кривая накопленных частот не убывает ни на одном участке.

Пример построения группировки рассмотрим в примерах 1 и 2.


Пример 1

Оборот и издержки обращения тридцати торговых предприятий за отчетный период составили (тыс. руб.):

Магазины, № п/п Оборот Издержки обращения

Для выявления зависимости между размером оборота и издержками обращения произведите группировку магазинов по размеру оборота, образовав пять групп магазинов с равными интервалами. В каждой группе и в целом подсчитайте:

1) число магазинов;

2) размер оборота – всего и в среднем на один магазин;

3) издержки обращения – всего и в среднем на один магазин;

4) структуру товарооборота по группам и структуру издержек обращения;

5) уровень издержек обращения

У ИО = Издержки обращения ×100%.
Товарооборот

6) Решение оформите в разработочной и групповой таблицах. Сделайте выводы, укажите вид группировки. Постройте гистограмму и преобразуйте её в полигон. Постройте кумуляту (кривую накопленных частот).

Решение:

Составим вариационный ряд распределения, упорядочив магазины по товарообороту от большего к меньшему.

Магазины, № п/п Оборот Издержки обращения Магазины, № п/п Оборот Издержки обращения
7 341 160
11 456 242 19 1199 635
5 1326 623

Определим величину интервала:

, где

i – величина интервала;

Xmax, Xmin – максимальное и минимальное значение признака (1700 и 341 соответственно).

Величина интервала составит:

Определим границы интервалов:

Разнесем по выделенным интервалам предприятия (разработочная таблица):

Определим в каждой группе и в целом объем оборота – всего и в среднем на один магазин и издержки – всего и в среднем на один магазин, для чего составим группировочную таблицу:

Группы предприятий по величине оборота Число предприятий в группе Суммарный товарооборот в группе Средний товарооборот по группе Суммарные издержки обращения по группе Средние издержки обращения по группе Уровень издержек обращения по группе, %
А (1) (2) (3)=(2)/(1) (4) (5)=(4)/(1) (6)=(4)/(2)*100
341-612,8 398,5 50,44
612,8-884,6 744,5 345,5 46,41
884,6-1156,4 998,75 482,625 48,32
1156,4-1428,2 1262,5 49,82
1428,2-1700 687,417 43,65
Итого 34679/30= 1155,97 15843/30= 528,1 528,1/1155,97*100 = 45,68

На основании проведенных расчетов построим гистограмму и полигон.

При построении гистограммы по оси Х откладывают значения признака (границы интервалов), а по оси Y – частоты. Для соответствующего интервала строиться прямоугольник, высота которого соответствует частоте признака (рисунок 5).

Рисунок 5 – Гистограмма

Гистограмма может быть преобразована в полигон, если середины верхних граней прямоугольника соединить прямой линией (рисунок 6).

Рисунок 6 – Полигон распределения

Также построим кумуляту или кривую накопленных частот. В этом случае по оси Х откладываем интервалы признака, а по оси Y – накопленные частоты (это количество единиц совокупности, имеющие значения признака меньше указанного) . Накопленные частоты рассчитаны в таблице.

Кривая накопленных частот представлена на рисунке 7.

Рисунок 7 – Кривая накопленных частот

Вывод: Суммарный товарооборот в первой группе 797 тыс. руб., во второй – 4467 тыс. руб., в третьей – 7990 тыс. руб., в четвертой – 2525 тыс. руб., в пятой – 18900 тыс. руб. Средний товарооборот на один магазин в первой группе 398,5 тыс. руб., во второй – 744,5 тыс. руб., в третьей – 998,75 тыс. руб., в четвертой – 1262,5 тыс. руб., в пятой – 1575 тыс. руб.

Суммарные издержки обращения в первой группе 402 тыс. руб., во второй – 2073 тыс. руб., в третьей – 3861 тыс. руб., в четвертой – 1258 тыс. руб., в пятой – 8249 тыс. руб. Средний издержки обращения в первой группе 201 тыс. руб., во второй – 345,5 тыс. руб., в третьей – 482,625 тыс. руб., в четвертой – 629 тыс. руб., в пятой – 687,417 тыс. руб.

На основании полученных значений можно сделать вывод о прямой зависимости между размером оборота и средними издержек обращения: при росте размера оборота средние издержки обращения увеличиваются. На основании анализа уровня издержек обращения можно сделать вывод, что наиболее конкурентны предприятия пятой группы, поскольку у них уровень издержек ниже среднего.

Пример 2

По данным таблицы постройте ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:

а) по числу совместно проживающих человек (1,2,3,4 и более)

б) по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами)

в) по статусу занятости главы семьи.

№ п/п Число членов в семье Статус главы семьи по месту в занятости
1. Самозанятость
2. По найму
3. По найму
4. По найму
5. По найму
6. Нет работы
7. Нет работы
8. Самозанятость
9. Нет работы
10. По найму
11. По найму
12. По найму
13. Самозанятость
14. По найму
15. По найму
16. По найму
17. По найму
18. Нет работы
19. Нет работы
20. Самозанятость
21. Нет работы
22. По найму
23. По найму
24. По найму
25. По найму
26. По найму
27. Самозанятость
28. Нет работы
29. По найму
30. По найму
Итого - -

Решение:

Построим ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:

Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.

Общее число глав семей, имеющих разный статус по месту в занятости (са Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.

Группировка по числу совместно проживающих человек (1,2,3,4 и более), представлено в таблице. В этом случае группировка строиться по количественному дискретному признаку.

Таким образом, 33% всех обследованных семей состоят из трех человек. 13% семей состоят из 4 и более человек. Доли семей, состоящих из 1 человека – 17%, из 2 человек – 37%.

Построим группировку по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами);

На начальном этапе проранжируем ряд от меньшего к большему:

Номер домохозяйства Среднемесячный доход на душу, руб. Номер домохозяйства Среднемесячный доход на душу, руб.

Определим величину интервала по формуле:

, где

i – величина интервала;

n – число групп (в данной задаче 5 группы);

Xmax, Xmin – максимальное и минимальное значение признака.

Величина интервала составит:

Разнесем по выделенным интервалам домашние хозяйства:

Это и будет интервальный ряд распределения.

Рисунок 8 – Гистограмма распределения

Таким образом, в 50% всех обследуемых домашних хозяйствах среднедушевой доход составляет от 4800 рублей до 7460 рублей на человека. Доход от 2140 до 4800 рублей на человека наблюдается в 16% всех семей. Доход от 7460 до 10120 рублей на человека наблюдается в 20% всех обследованных семей. Доля семей, где среднедушевой доход составляет от 10120 до 12780, а также от 12780 до 15440 рублей, равна 7%.


Вопросы для самопроверки

Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.

Определение . Полигоном частот называют ломаную, отрезки которой соединяют точки (x 1 , n 1), (x 2 , n 2), …, (x k , n k).

Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат – соответствующие им частоты n i . Точки (x i , n i) соединяют отрезками прямых и получают полигон частот.

Определение. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1), (x 2 , w 2), …, (x k , w k).

Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат w i . Точки (x i , w i) соединяют отрезками прямых и получают полигон относительных частот.

На рисунке изображен полигон относительных частот следующего распределения:

Рис. 6. Полигон относительных частот.

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длинной h и находят для каждого частичного интервала n i – сумму частот вариант, попавших в i-ый интервал.

Определение . Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению (плотность частоты).

Рис. 7. Гистограмма частот.

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс, на расстоянии .

Площадь i-го частичного прямоугольника равна =─ сумме частот вариантi-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, то есть объему выборки n.

На рисунке 2 изображена гистограмма частот распределения объема n=100, приведенного в таблице 1.

Частичный интервал,

длиною h=5

Плотность частоты

Определение . Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны отношению (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии . Площадьi-го частичного прямоугольника равна =─ относительной частоте вариант, попавших вi-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице.

    В результате выборки получена следующая таблица распределения частот.

Построить полигоны частот и относительных частот распределения.

Для начала построим полигон частот.

Рис. 8. Полигон частот.

Чтобы построить полигон относительных частот найдем относительные частоты, для чего разделим частоты на объем выборки n.

n = 3 + 10 + 7 = 20.

Получаем

Построим полигон относительных частот.

Рис. 9. Полигон относительных частот.

2. Построить гистограммы частот и относительных частот распределения.

Найдем плотность частоты :

Частичный интервал,

длиною h = 3

Сумма частот вариант частичного интервала

Плотность частоты

Полигон распределения вероятностей  


Аналогично все указанные приемы обработки и построения могут быть распространены и на другие показатели, например на объемы поставок, интервалы между поставками, объемы суточных отпусков и суточных объемов поставок. Эти полигоны распределения описывают, как в течение отчетного года на предприятии изменялись объемы поставок, интервалы поставок и объемы суточных отпусков и т.д.  

Любой полигон описывается набором средних значений интервалов (диапазонов) вариаций какого-либо одного признака и частостью появления этого среднего значения . Каждый из полигонов распределения можно выразить аналитически, например, для ряда распределения объемов поставок (Q, W), формула будет выглядеть следующим образом  

Аналогично аналитически можно выразить полигоны распределения интервалов между поставками (Т, У) и объемов суточных отпусков (R, СО  

Полигон распределения - ломаная линия, построенная на графике и характеризующая изменение вероятностей различных исходов событий при повторных испытаниях.  

Следующей задачей является оценка возможных сочетаний значений нормообразующих факторов, которые могут иметь место в интервалах отгрузки в плановом году. Возможность получения результата вытекает из анализа данных, приведенных на рис. 5.8 и 5.9. На каждом из этих 12 графиков построены два полигона распределений вариаций значений нормообразующих факторов в целом за три года и за один год из этого же периода. Они построены по четырем предприятиям - горно-обогатительному и лесообрабатывающему комбинатам и двум машиностроительным заводам. На графиках по осям абсцисс отложены диапазоны вариаций значений нормообразующих факторов на каждом из этих предприятий, а по осям ординат - частости появления значений признаков в соответствующих периодах. Штриховые линии полигонов, проведенные на графиках, построены по результатам обработки фактических данных за один отчетный год (1), сплошные - в целом за трехлетний период (Z).  

Поскольку, как уже говорилось выше, из полигона распределения легко можно получить гистограмму и наоборот, использование данного метода рассмотрим в предположении, что исходным графиком является гистограмма. В случае, если известен только полигон распределения, мы можем восстановить по нему гистограмму, тщательно его измерив и определив опорные точки (середины интервалов) этого полигона, и затем применить изложенный метод непосредственно к гистограмме. Относительно способа ее построения примем следующие допущения.  

В табл. 6.3.1 показаны все необходимые исходные данные, позволяющие рассчитать эмпирическую функцию распределения , гистограмму и полигон распределения.  

Ниже на рис. 6.3.10 и 6.3.11 приведены гистограмма и полигон распределения относительных частот.  

II. Диаграммы 1. Диаграммы рас- а) ДГ распределения по одному полигон распределения гистограмма  

Вариационные ряды могут быть изображены графически в виде полигона распределения и гистограммы.  

Полигоны распределения чаще всего применяются для изображения дискретных вариационных рядов.  

Полигон распределения и гистограмма есть реализация распределения выборочной совокупности при ограниченном числе наблюдений (N), а предельная кривая при N - > °° является распределением генеральной совокупности . Распределение генеральной совокупности является теоретическим распределением. Отдельные распределения изучены и поддаются точному аналитическому опи-  

Если уменьшить интервалы и одновременно увеличивать число наблюдений при конечной численности группы, то полигон распределения и гистограмма станут приближаться  

Для изображения вариационных рядов применяются линейные и плоскостные диаграммы , построенные в прямоугольной системе координат . При дискретной вариации признака графиком вариационного ряда служит полигон распределения. Рассмотрим пример его построения по следующим данным.  

Полигон распределения представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующегося признака, а ординатами - соответствующие им частоты (рис. 3.8).  

Наглядно ряды распределения можно представить при помощи их графического изображения, позволяющего судить о форме распределения. Наиболее часто для этой цели используют полигон и гистограмму.  

На графике (рис. 4.1) представлены полигон (ломаная прямая) и гистограмма (совокупность прямоугольников) вышеуказанного распределения.  

Полигон степени влияния отобранных факторов на изучаемый показатель - распределение суммы рангов влияния факторов на изучаемый показатель. Если соединить его начало и конец прямой линией, то можно видеть, насколько далека полученная ранжировка от ранжировки, соответствующей полной согласованности мнений опрашиваемых экспертов. При этом возможны три случая ранжировки  

Полигон - это графическое изображение дискретного вариационного ряда в прямоугольной системе координат , при котором величины признака X откладываются на оси абсцисс, а соответствующие им частости W - на оси ординат. Эти точки соединяются отрезками прямой, полученная фигура представляет распределение совокупности по признаку X.  

Для расчета специфицированных норм производственных запасов требуется перейти от аналитической записи каждого полигона к вероятностным характеристикам - плотностям распределения вариаций объемов поставок (или соответственно интервалов поставок, объемов суточных отпусков и т.п.). Построенная же по полигону плотность распределения вариаций этого признака - Р(Х X показывает, как будут изменяться вариации признака X в плановом году. Далее будет более подробно пояснено, что эти плотности распределения обладают свойством устойчивости, по ним можно рассчитать специфицированные нормы производственных запасов для планового года. Причем будет показано, что чем больше неравномерность (размах вариаций фактора), тем выше должно быть установлено значение определяемой нормы производственного запаса при прочих одинаковых или примерно одинаковых условиях (например, при одном и том же годовом объеме поступления, одинаковых частотах поставок и годовом объеме расхода и т.д.).  

Разберем, как от аналитического выражения полигона вариаций признака (например, для объемов поставок - Q, W) перейти к плотности распределения вариаций этого же признака - Q, P(Q). Здесь для двух указанных выше случаев применяются разные обозначения величины вариаций объемов поставок и разные обозначения изменений частости объемов поставок и их вероятностей. В первом случае данные но отчетному  

Графически вариационные ряды изображаются в форме кривой распределения или полигона частоты. Приведем пример.  

Из цифрового и графического изображения рядов видно, что во втором году произошло значительное улучшение распределения долблений по уровням механических скоростей . Так, во втором году первый интервал оказался совершенно не заполненным, ряд стал короче и вершина полигона сдвинулась вправо к большим показателям скоростей.  

Рис. 13. Гистограмма, полигон и плотность распределения вероятности отсчета у аналогового измерительного прибора /info/5256">плотности распределения вероятности отсчета р (х), показанную на рис. 13, б.  

Вариация данных анализируется с помощью полигона распределения, кумуляты (кривой меньше, чем) и огивы (кривой больше, чем). Все эти виды графиков рассматриваются в главе 5. Линейные графики используются в решении задач классификации данных (см. гл. 6). Применение линейных графиков в анализе динамики рассмотрено в главе 9, а использование их для анализа связей -в главе 8. В этих же главах рассмотрено использование точечных диаграмм (см., например, поле корреляции в гл. 8).  

Полигон распределения представляет собой многоугольник, который строится на прямоугольной) оооординатной сетке следующим образом. В выбранных масштабахша оси абсцисс наносится шкала для фактических значений случайной величины X, на оси ординат-  

Построим полигон, гистограмму, кумуляту и огиву (рис. 4.1) на основании следующих данных о распределении сельского населения в России на 1 января 1998 г. по возрастным группам (млн человек).  

В первую очередь, для соблюдения условий сопоставимости показателей сравниваемых видов транспорта должны использоваться не просто отчетные данные, а расчетные показатели капиталовложений, эксплуатационных расходов и приведенных затрат. Это требование объясняется некоторой несопоставимостью фактических отчетных данных по трубопроводному и железнодорожному транспорту . В частности, если взять перекачку нефти по трубопроводу с промысла на завод, то в затратах по этому виду транспорта найдут отражение все расходы по интервалу перевозочного процесса от приемного резервуара головной перекачивающей станции нефтепровода до сдаточного резервуара конечного пункта нефтепровода на заводе. В случае доставки этой же нефти по железной дороге в ведомственной отчетности не будут отражены затраты на налив и слив нефти. Естественно, что в связи с этим фактические отчетные данные железной дороги должны быть скорректированы и приведены в сопоставимый вид с показателями магистрального трубопровода. Нельзя также пользоваться при решении задачи распределения перевозок нефтегрузов между рассматриваемыми видами транспорта среднесетевыми показателями для оценки железнодорожного варианта. Показатели последнего должны быть вполне конкретными, т. е. отражающими истинные-затраты именно по рассматриваемому направлению при догрузке его дополнительным потоком нефти или нефтепродуктов. В целях более точной оценки железнодорожного варианта затраты могут1 рассчитываться не только по рассматриваемой железной дороге , но и по полигону сети, в пределах которого сказывается влияние- дополнительного потока нефтегрузов. При отсутствии такого влияния можно ограничиться определением затрат лишь по рассматриваемой железной дороге.  

Для наглядности определения закономерностей изменения признака ряд распределения целесообразно представлять вчвиде полигонов (так как все изучаемые в настоящей работе признаки характеризуются дискретными величинами). Для изображения ряда распределения графически необходимо определение размера интервала группировок исходных данных.  

Для графического изображения рядов распределения кроме гистограммы и полигона могут применяться также кумулятивная кривая и огива1.  

Физический смысл полигонов вариаций значений нормообразующих факторов, приведенных на рис. 5.8 и 5.9, состоит в следующем они показывают, как изменялись условия производства и отгрузки готовой продукции на предприятиях в отчетных периодах . Из графика, приведенного на рис. 5.8г, следует, что объемы суточного производства пиломатериалов на лесодеревообрабатывающем комбинате ЛДК-4 изменялись в диапазоне от 100 до 900 куб. м (т.е. размах вариаций их будет от Rmia = 100 до -Rmax = 900 куб. м/сутки). Объемы производства пиломатериалов 430 куб. м/сутки составляли основную долю 44% (Р(Ю - 0,44), 580 куб. м/сутки - 28%, 690 куб. м/сутки - 4% и т.д. На рис. 5.8д и 5.8е построены распределения вариаций суточных объемов отгрузок пиломатериалов и интервалов между отгрузками, которые были в отчетном периоде . Объемы суточных отгрузок менялись в диапазоне от 50 до 780 куб. м/сутки (рис. 5.8д). В основном они составляли по 200-500 куб. м/ сутки - 45% (Р(О) = 0,45 при О = 200-580 куб. м/сутки), 580 куб. м/ сутки - 13%, 640 куб. м/сутки - 4% и т.д.  

Поддержите проект — поделитесь ссылкой, спасибо!
Читайте также
Как перераспределить размер локальных дисков Как перераспределить размер локальных дисков SymMover Переместить программу SymMover Переместить программу Скачать бесплатно программу для создания документов Word Скачать бесплатно программу для создания документов Word