Министерство Образования РФ

Государственный университет управления

Инситут управления в Энергетике

Кафедра: менеджмент в Международном Топливно-Энергетическом Бизнесе

Дисциплина:

«Статистика»

Семестровое задание

Выполнил студент
Очной формы обучения
Специальности менеджмент организации
Специализации МТЭБ
2 курса группы МТЭБ

Ромашин А.Е.

(подпись)

Руководитель

Токарева И.С.

(подпись) (инициалы и фамилия)

Москва 2004

1. Пользуясь таблицей случайных чисел, выписать данные для 30 предприятий по факторному и результативному признаку согласно варианту. Выполнить проверку на однородность и нормальность распределения по факторному признаку. Исключить резко выделяющиеся предприятия из массы первичной информации.

Данные по 30 предприятиям:
|№ |Уровень |Процент выполнения норм |
|предпр|механизации |выработки, % (y) |
|иятия |труда, % (x) | |
|1 |77,4 |103,3 |
|2 |76,0 |102,1 |
|3 |78,9 |102,2 |
|4 |79,4 |102,9 |
|5 |80,0 |102,7 |
|6 |82,0 |101,7 |
|7 |85,0 |101,6 |
|9 |84,0 |101,4 |
|10 |84,6 |101,5 |
|11 |77,8 |101,9 |
|12 |73,0 |103,8 |
|14 |75,5 |101,6 |
|15 |76,7 |102,5 |
|16 |77,8 |102,6 |
|19 |74,4 |104,5 |
|20 |74,3 |104,9 |
|21 |74,5 |104,8 |
|22 |76,0 |104,7 |
|25 |85,0 |102,0 |
|26 |72,9 |102,1 |
|27 |70,0 |105,0 |
|28 |73,2 |105,2 |
|29 |70,3 |106,4 |
|33 |76,0 |104,0 |
|34 |75,0 |106,0 |
|35 |75,6 |105,0 |
|37 |73,0 |106,2 |
|38 |76,4 |106,3 |
|39 |78,2 |106,4 |
|46 |72,0 |105,0 |

Уровень механизации труда, % (x)–факторный признак,
Процент выполнения норм выработки, % – результативный признак

Проверка первичной информации на однородность производится с помощью коэффициента вариации. На практике считается, что если этот коэффициент менее 40%, то совокупность однородная.

[pic]

Составим таблицу для вычисления средней арифметической и среднего квадратического отклонения:

|№ |x |[pic] |
|предприятия| | |
|27 |70,0 |46,65 |
|29 |70,3 |42,64 |
|46 |72,0 |23,33 |
|26 |72,9 |15,44 |
|12 |73,0 |14,67 |
|37 |73,0 |14,67 |
|28 |73,2 |13,18 |
|20 |74,3 |6,40 |
|19 |74,4 |5,90 |
|21 |74,5 |5,43 |
|34 |75,0 |3,35 |
|14 |75,5 |1,77 |
|35 |75,6 |1,51 |
|2 |76,0 |0,69 |
|22 |76,0 |0,69 |
|33 |76,0 |0,69 |
|38 |76,4 |0,18 |
|15 |76,7 |0,02 |
|1 |77,4 |0,32 |
|11 |77,8 |0,94 |
|16 |77,8 |0,94 |
|39 |78,2 |1,88 |
|3 |78,9 |4,28 |
|4 |79,4 |6,60 |
|5 |80,0 |10,05 |
|6 |82,0 |26,73 |
|9 |84,0 |51,41 |
|10 |84,6 |60,37 |
|7 |85,0 |66,75 |
|25 |85,0 |66,75 |
|Сумма |2304,|494,24 |
| |9 | |

Рассчитаем коэффициент вариации:

[pic][pic]- средняя арифметическая,

[pic]

[pic]- среднее квадратическое отклонение,

[pic]

(=4,06/76,83*100%=5,28 %. < 40%, исходный массив данных по факторному признаку можно считать однородным.

Исключение из массива первичной информации всех резко выделяющихся единиц по уровню факторного признака производится по правилу "трех сигм": исключаются все единицы, у которых уровень признака-фактора не попадает в интервал:

[pic], где

Интервал для значения факторного признака (Уровень механизации труда):

76,83-3*4,06( xi ( 76,83+3*4,06 или 64,65 ( xi ( 89,00

Для первичных данных этот интервал: 64,65 – 89,00. В интервал попадают значения факторного признака всех предприятий, т.е. исключать предприятия не требуется.

2. Получив однородный массив, выполнить группировку, характеризующую зависимость результативного признака от факторного.
Построить ряд распределения с равными интервалами по х, рассчитав величину интервала и число групп по формуле Стерджесса. Определить показатели центра распределения, показатели вариации, асимметрии и эксцесса. Сформулировать выводы.

При построении интервального вариационного ряда число групп определяется по формуле Стерджесса: m = 1+3,322*lgn n - общее число единиц совокупности, в n=30 (по условию задания) m= 1+ 3,322*lg30= 5

Величина интервала i определяется по формуле:

[pic]

[pic]- размах колебания (варьирования) признака.

[pic]

[pic]
|Уровень |Число |Накоплен|Середина |[pic]%|
|механизации |предприяти|ные |интервала, | |
|труда, % (x)|й, частота|частоты |[pic]% | |
| |интервала,| | | |
| |f | | | |
|70-73 |6 |6 |71,5 |429 |
|73-76 |10 |16 |74,5 |745 |
|76-79 |7 |23 |77,5 |542,5 |
|79-82 |3 |26 |80,5 |241,5 |
|82-85 |4 |30 |83,5 |334 |
|Итого |30 | | |2292 |

Для характеристики среднего значения признака в вариационном ряду применяются: средняя арифметическая, медиана, мода.

Средняя арифметическая для интервального ряда распределения средняя арифметическая определяется по формуле:

[pic] где [pic]- середина соответствующего интервала значения признака.

[pic]

Мода - наиболее часто встречающееся значение признака. В интервальном ряду определяется модальный интервал (имеет наибольшую частоту). Значение моды определяется по формуле:

[pic]

[pic] - нижняя граница модального интервала,
[pic] - частота модального интервала,
[pic] - частота интервала, предшествующего модальному,
[pic] - частота интервала, следующего за модальным.

Модальный интервал – второй (73-76), т.к. он имеет наибольшую частоту (10).

[pic]

Mo=74.714%

Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером:

[pic] n - число единиц совокупности.

Медианным является первый интервал, в котором сумма накопленных частостей превысит половину общего числа наблюдений, т.е. 15. Численное значение медианы определяется по формуле:

[pic]

[pic] - нижняя граница медианного интервала,

[pic] - накопленная частота интервала, предшествующего медианному,

[pic] - величина интервала,

[pic] - частота медианного интервала.

Медианный интервал – второй (73-76), т.к. это первый интервал, в котором величина накопленных частот больше 15.

[pic]

Для характеристики размера вариаций признака используются а) абсолютные показатели:

1) размах колебаний [pic]- максимальное и минимальное значение признака.

R = 85-70=15 %.

2) среднее линейное отклонение:

[pic]
1) среднее квадратическое отклонение и дисперсия:
[pic] и [pic]

Составим таблицу для расчета этих показателей:
|Уровень |Число |Середина|[pic] |[pic] |[pic] |
|механизации|предприя|интервал| | | |
|труда, % |тий, |а, | | | |
| |[pic] |[pic]% | | | |
|70-73 |6 |71,5 |31,98 |5,33 |28,4 |
|73-76 |10 |74,5 |23,30 |2,33 |5,43 |
|76-79 |7 |77,5 |4,69 |0,67 |0,45 |
|79-82 |3 |80,5 |11,01 |3,67 |13,47 |
|82-85 |4 |83,5 |26,68 |6,67 |44,49 |
|Итого |30 | |97,66 | |92,24 |

[pic] d=3.255%

( 2( [pic]= 3,195 % б) относительные показатели, наиболее часто из которых используется коэффициент вариации: если он не превышает 40%, то совокупность считается однородной.

[pic]%

Симметричным является распределение, в котором частоты двух любых вариантов, равноотстоящих по обе стороны от центра распределения, равны между собой.

Рассчитаем относительный показатель асимметрии:

[pic]

Он принимает положительное значение, это говорит о правосторонней асимметрии. Т.е. на графике распределения правая ветвь относительно максимальной ординаты вытянута больше, чем левая.

Средняя квадратическая ошибка показателя As:

[pic]

Асимметрия несущественна, т.к. выполняется неравенство:

[pic]3, следовательно эксцессу свойствен распределению признака в генеральной совокупности.

Вывод: произведя группировку 30-и предприятий по признаку удельному весу технико-обоснованных норм, мы получили 5 групп предприятий. Среднее значение уровня механизации труда по этим предприятиям составляет 76,83 %, а индивидуальные значения изменяются от 70 до 85,0. Наиболее часто встречающееся значение уровня механизации труда (мода) – 74,714 %.
Варианту, стоящему в середине ранжированного ряда соответствует значение
75,85 % (медиана). Размах вариации составляет 15,0. В среднем каждое значение признака отклоняется от среднего значения по группе на 3,25 (по среднему линейному отклонению), на 3,195 по среднему квадратическому отклонению.

Совокупность данных можно считать однородной, т.к. коэффициент вариации принимает значение меньше 5%. Распределение предприятий по факторному признаку имеет правостороннюю асимметрию, и она существенна.

Распределение предприятий по удельному весу технико-обоснованных норм является островершинным, т.к. показатель эксцесса принимает положительное значение.

3. Используя ранее выполненную группировку, проверить правило сложения дисперсий и сделать выводы о степени влияния факторного признака на величину результативного.

Общая дисперсия характеризует вариацию результативного признака
(процента выполнения норм выработки) под влиянием всех факторов, формирующих уровень признака у единиц совокупности данных. Она определяется по формуле:

[pic]
|№ |x |y |[pic] |
|предпр| | | |
|иятия | | | |
|9 |84,0 |101,4 |5,18 |
|10 |84,6 |101,5 |4,74 |
|14 |75,5 |101,6 |4,31 |
|7 |85,0 |101,6 |4,31 |
|6 |82,0 |101,7 |3,91 |
|11 |77,8 |101,9 |3,16 |
|25 |85,0 |102,0 |2,81 |
|26 |72,9 |102,1 |2,49 |
|2 |76,0 |102,1 |2,49 |
|3 |78,9 |102,2 |2,18 |
|15 |76,7 |102,5 |1,39 |
|16 |77,8 |102,6 |1,16 |
|5 |80,0 |102,7 |0,95 |
|4 |79,4 |102,9 |0,60 |
|1 |77,4 |103,3 |0,14 |
|12 |73,0 |103,8 |0,02 |
|33 |76,0 |104,0 |0,10 |
|19 |74,4 |104,5 |0,68 |
|22 |76,0 |104,7 |1,05 |
|21 |74,5 |104,8 |1,26 |
|20 |74,3 |104,9 |1,50 |
|27 |70,0 |105,0 |1,75 |
|46 |72,0 |105,0 |1,75 |
|35 |75,6 |105,0 |1,75 |
|28 |73,2 |105,2 |2,32 |
|34 |75,0 |106,0 |5,40 |
|37 |73,0 |106,2 |6,37 |
|38 |76,4 |106,3 |6,88 |
|29 |70,3 |106,4 |7,41 |
|39 |78,2 |106,4 |7,41 |
|Итого |2304,9|3110,3|85,47 |

[pic] [pic]

Вариация величины процента выполнения норм выработки под влиянием всех факторов, ее формирующих составляет 2,849.

Межгрупповая дисперсия отражает систематическую вариацию результативного признака (процента выполнения норм выработки), т.е. те различия, которые возникают под влиянием фактора, положенного в основу группировки (Уровень механизации труда). Она определяется по формуле:

[pic]

Сгруппируем предприятия по величине уровня механизации труда
(группировка произведена в пункте 2):
|Уровень |Число|Значения |[pic]|Процент |[pic] |
|механизации |предп|процента |% |выполнения норм | |
|труда, % |рияти|выполнения норм | |выработки, [pic]%| |
| |й,[pi|выработки, % | | | |
| |c] | | | | |
|70-73 |6 |105,0 106,4 |628,5|104,75 |6,91 |
| | |105,0 | | | |
| | |102,1 103,8 | | | |
| | |106,2 | | | |
|73-76 |10 |105,2 104,9 |1042,|104,28 |3,64 |
| | |104,5 |8 | | |
| | |104,8 106,0 | | | |
| | |101,6 | | | |
| | |105,0 102,1 | | | |
| | |104,7 | | | |
| | |104,0 | | | |
|76-79 |7 |106,3 102,5 |725,2|103,6 |0,04 |
| | |103,3 | | | |
| | |101,9 102,6 | | | |
| | |106,4 | | | |
| | |102,2 | | | |
|79-82 |3 |102,9 102,7 |307,3|102,4 |4,89 |
| | |101,7 | | | |
|82-85 |4 |101,4 101,5 |406,5|101,6 |17,26 |
| | |101,6 | | | |
| | |102,0 | | | |
|Итого |30 |- |3110,| |32,73 |
| | | |3 | | |

[pic]

Вариация величины процента выполнения норма выработки под влиянием уровня механизации труда рабочих на этих предприятиях составляет 1,091.

Средняя внутригрупповая дисперсия характеризует случайную вариацию результативного признака, возникающих под влиянием других, неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Она определяется по формуле:

[pic]
|Уровень |Значения |Процент |Внутригрупп|
|механизац|процента |выполнения |овая |
|ии труда,|выполнения норм|норм |дисперсия, |
|% |выработки, % |выработки, |[pic] |
| | |[pic]% | |
|70-73 |105,0 106,4 |104,75 |2,1458 |
| |105,0 | | |
| |102,1 103,8 | | |
| |106,2 | | |
|73-76 |105,2 104,9 |104,28 |1,7216 |
| |104,5 | | |
| |104,8 106,0 | | |
| |101,6 | | |
| |105,0 102,1 | | |
| |104,7 | | |
| |104,0 | | |
|76-79 |106,3 102,5 |103,6 |3,1829 |
| |103,3 | | |
| |101,9 102,6 | | |
| |106,4 | | |
| |102,2 | | |
|79-82 |102,9 102,7 |102,4 |0,2756 |
| |101,7 | | |
|82-85 |101,4 101,5 |101,6 |0,0519 |
| |101,6 | | |
| |102,0 | | |
|Итого |30 |- |- |

[pic]
Правило сложения дисперсий:
[pic]
2,85=1,091+0,036 - выполняется
Рассчитаем показатель:
[pic]*100% =1,091/2,85 *100%=38,3%

Вывод:
Правило сложения дисперсий выполняется.
Изменение уровня механизации труда на 38,3% объясняет изменение значения процента выполнения норм выработки на предприятиях, а другие 61,7% вариации объясняются неучтенными факторами.

4. Выявить факт наличия связи между x и y. Определить степень тесноты связи с помощью линейного коэффициента корреляции. Анализ выполнить в следующей последовательности:
. установить факт наличия корреляционной зависимости с помощью групповой таблицы и ее направление; дать графическое изображение связи;
На основании рабочей таблицы из пункта 3 составим групповую таблицу:
Зависимость процента выполнения норм выработки предприятия от уровня механизации труда работников:
|Уровень |Среднее значение |Процент |
|механизации |уровня |выполнения норм |
|труда, %. |механизации |выработки, [pic]%|
| |труда, % | |
|70-73 |71,5 |104,75 |
|73-76 |74,5 |104,28 |
|76-79 |77,5 |103,6 |
|79-82 |80,5 |102,4 |
|82-85 |83,5 |101,6 |

По данным групповой таблицы видим, что с ростом среднего значения уровня механизации труда в группе, значение процента выполнения норм выработки по группе в целом возрастает.

График связи.

[pic]


. измерить степень тесноты связи с помощью линейного коэффициента корреляции и корреляционного отношения; проверить возможность использования линейной функции в качестве формы уравнения;

Измерим степень тесноты связи между удельным весом технико- обоснованных норм и средней выработкой предприятия с помощью линейного коэффициента корреляции.

Формула для расчета линейного коэффициента корреляции:

[pic]

x – уровень механизации труда; y – процент выполнения норм выработки; n =30 – число единиц совокупности;

Линейный коэффициент корреляции принимает значения от -1 до +1, чем ближе он по модулю к 1, тем теснее считается связь.
Таблица для расчета линейного коэффициента корреляции:
|№ |[pic] |[pic] |[pic] |[pic] |[pic] |
|предпри| | | | | |
|ятия | | | | | |
|27 |70,0 |105,0 |4900,00|11025,0|7350,00|
| | | | |0 | |
|29 |70,3 |106,4 |4942,09|11320,9|7479,92|
| | | | |6 | |
|46 |72,0 |105,0 |5184,00|11025,0|7560,00|
| | | | |0 | |
|26 |72,9 |102,1 |5314,41|10424,4|7443,09|
| | | | |1 | |
|12 |73,0 |103,8 |5329,00|10774,4|7577,40|
| | | | |4 | |
|37 |73,0 |106,2 |5329,00|11278,4|7752,60|
| | | | |4 | |
|28 |73,2 |105,2 |5358,24|11067,0|7700,64|
| | | | |4 | |
|20 |74,3 |104,9 |5520,49|11004,0|7794,07|
| | | | |1 | |
|19 |74,4 |104,5 |5535,36|10920,2|7774,80|
| | | | |5 | |
|21 |74,5 |104,8 |5550,25|10983,0|7807,60|
| | | | |4 | |
|34 |75,0 |106,0 |5625,00|11236,0|7950,00|
| | | | |0 | |
|14 |75,5 |101,6 |5700,25|10322,5|7670,80|
| | | | |6 | |
|35 |75,6 |105,0 |5715,36|11025,0|7938,00|
| | | | |0 | |
|2 |76,0 |102,1 |5776,00|10424,4|7759,60|
| | | | |1 | |
|33 |76,0 |104,0 |5776,00|10816,0|7904,00|
| | | | |0 | |
|22 |76,0 |104,7 |5776,00|10962,0|7957,20|
| | | | |9 | |
|38 |76,4 |106,3 |5836,96|11299,6|8121,32|
| | | | |9 | |
|15 |76,7 |102,5 |5882,89|10506,2|7861,75|
| | | | |5 | |
|1 |77,4 |103,3 |5990,76|10670,8|7995,42|
| | | | |9 | |
|11 |77,8 |101,9 |6052,84|10383,6|7927,82|
| | | | |1 | |
|16 |77,8 |102,6 |6052,84|10526,7|7982,28|
| | | | |6 | |
|39 |78,2 |106,4 |6115,24|11320,9|8320,48|
| | | | |6 | |
|3 |78,9 |102,2 |6225,21|10444,8|8063,58|
| | | | |4 | |
|4 |79,4 |102,9 |6304,36|10588,4|8170,26|
| | | | |1 | |
|5 |80,0 |102,7 |6400,00|10547,2|8216,00|
| | | | |9 | |
|6 |82,0 |101,7 |6724,00|10342,8|8339,40|
| | | | |9 | |
|9 |84,0 |101,4 |7056,00|10281,9|8517,60|
| | | | |6 | |
|10 |84,6 |101,5 |7157,16|10302,2|8586,90|
| | | | |5 | |
|7 |85,0 |101,6 |7225,00|10322,5|8636,00|
| | | | |6 | |
|25 |85,0 |102,0 |7225,00|10404,0|8670,00|
| | | | |0 | |
|Итог |2304,9 |3110,3 |177579,|322551,|238828,|
| | | |71 |01 |53 |

[pic]
Т.к. r0,5, то эта связь достаточно тесная.

[pic] Такое значение корреляционного отношения говорит о том, что изменение результативного признака во многом объясняется вариацией факторного признака.

О возможности применения линейной модели для описания зависимости процента выполнения норм выработки от уровня механизации труда можно говорить, если выполняется следующее неравенство

[pic]

|0,383 – 0,437|= 0,054