Экономические дисциплины - Статистика

Тема №4: Средние величины и изучение вариации

 

  1. Однородность и вариация в массовых явлениях
  2. Средние величины
  3. Структурные характеристики вариационного ряда
  4. Показатели вариации

1. Однородность и вариация в массовых явлениях

Массовые явления обладают как общими для всей совокупности, так и индивидуальными свойствами. Различия между индивидуальными явлениями называется вариацией. Взаимодействие элементов совокупности ведет к ограничению вариации, хотя бы части их свойств. Эта тенденция обуславливает применением средних величин в теории и на практики. Замена множества индивидуальных значений признака средней величиной, характеризующей всю совокупность является обобщающая функция средней. При этом варианту можно представить следующим образом: Δxi, где xi-  варианта, с - общность, которая характеризуется средними величинами, Δxi - индивидуальность, которая характеризуется показателями вариации.

Широкое применение средних объясняется тем, что они имеют ряд положительных свойств, делающих их незаменимыми в анализе явлений и процессов общественной жизни.

2. Средние величины

Средняя, являясь обобщенной характеристикой всей статистической совокупности, должна ориентироваться на определенную величину, связанную со всеми единицами  этой совокупности.

Эту величину можно представить в виде функции:   F(x1,x2,x3,...,xn)

Так как данная величина в большинстве случаев отражает реальную экономическую категорию, ее называют  определяющим показателем.

Если в F(x1,x2,x3,...,xn) все величины  x1,x2,...,xn  заменить их средней величиной  *, то значение функции должно остаться прежним:

Раскрытие функции:   F(x1,x2,x3,...,xn) приводит к построению разных средних, наиболее широко используются степенные средние вида: .

Придавая z различные значения получим различные виды средних:

Z = -1  - средняя гармоническая;

Z=0 - средняя геометрическая;

Z=1  - средняя арифметическая;

Z=2- средняя квадратическая.

Все средние связаны правилом,  которое  называется правилом мажорантности средних:

Xh<=Xg<=Xa<=Xq

Рассмотренные средние называются простыми и применяются при изучении вариации признака от объекта к объекту и связи признаков. Если средняя величина служит для характеристики обобщенных показателей системы, то используются не простые, а взвешенные средние.

Обобщающая формула для взвешенных средних следующая - , где f -  веса вариант, частоты или частности.

;  ;   ;   .

Наиболее часто в качестве средних используется средняя арифметическая (при вычислении которой общий объем признаков совокупности остается неизменным).

Свойства арифметической средней величины.

1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю.

2. Если каждое индивидуальному значение признака умножить или разделить на постоянное число, то и средняя увеличится или уменьшится во столько же раз, где а - постоянное число.

3. Если к каждому индивидуальному значению признака прибавить или из каждого значения вычесть постоянное число, то и средняя величина возрастет или уменьшится на столько же .

4. Если веса средней взвешенной умножить или разделить на постоянное число, средняя величина не изменится .

Следствия

-         Вместо абсолютных значений весов можно использовать доли или проценты.

-         Если все веса равны, то средняя арифметическая равна средней арифметической взвешенной.

5.Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа.

Правила выбора средней.

  1. Средняя арифметическая используется, если известны численные значения знаменателя формулы, а значение числителя могут быть получены произведением.
  2. Средняя гармоническая используется, если известны числовые значения числителя, а значения знаменателя могут быть получены как частные от деления показателя.
  3. Средняя геометрическая применяется, если необходимо найти значение признака, качественно равноудаленного от максимального и минимального значения.
  4. Средняя квадратическая применяется для измерения вариации признаков совокупности, что обусловлено 5 свойством средней арифметической.
  5. Средняя хронологическая используется, если данные представлены не за какой либо период, и по состоянию на дату.

 

3. Структурные характеристики вариационного ряда

Мода(Мо)  представляет собой  значение изучаемого признака, повторяющейся с наибольшей частотой.

Медиана(Ме) - значение признака ,приходящееся на середину ранжированной совокупности. Главное свойство медианы: сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.

 

Определение моды  по  сгруппированным  данным: сначала  находят  номер  модального интервала, а затем ,

где X  - нижняя граница модального интервала

I   - величина модального интервала

- частота модального интервала

- частота предшествующего модальному интервала

- частота следующего за модальным интервала.

Квантиль - это значение хq случайной величины, удовлетворяющей условию:  F(xq) = q,  где F(xq) - вероятность того, что Х<x.

Различают:

медиану при q=0,5,

квартели при q=0,25

квинтели при q=0,2

децили при q=0,1

процентили при q=0,01

Для дискретного ряда – это значение признака в той группе где накопленная частность превышает , где  - номер квантилей. Аналогично определяется квантильный интервал для интервального ряда. Значение квантилей внутри интервального ряда . Подставляя различные  значения,  получаем разные квантили.

Квантили используется для расчета показателей, концентрации и дифференциации доходов населения. По данным выборочных опросов получают интервальный ряд распределения населения по среднедушевому доходу.

Расчет коэффициента концентрации Джини производится на основании данных о распределении населения по уровню среднедушевого совокупного дохода. Вся совокупность получателей доходов делится на 5 равных групп и определяется, какой долей дохода владеет каждая группа населения. Затем по полученным накопленным итогам строится так называемая кривая Лоренца (графическое изображение уровня концентрации явления).

При равномерном распределении доходов каждая двадцатипроцентная группа населения имела бы пятую часть доходов общества. На графике это изображается диагональю квадрата и рассматривается как линия равномерного распределения. При неравномерном распределении "линия концентрации" представляет собой вогнутую вниз кривую. Чем больше отклонение кривой Лоренца от диагонали квадрата, тем выше поляризация доходов общества.

 

 

Рис. 1. Кривая Лоренца

 

Коэффициент Джини можно рассчитывается по формуле , где -  доля населения в интервале, - доля доходов у этой доли населения.

Децильные коэффициенты дифференциации доходов рассчитываются как соотношения уровней верхнего и нижнего децилей вариационных рядов соответствующих показателей.

Коэффициент фондов, рассчитанный по данным ряда распределения населения по уровню среднедушевого дохода, показывает, во сколько раз среднедушевой доход 10 % наиболее высокодоходного населения больше, чем у 10 % населения с наименьшими доходами.

Среднее значение дохода населения в пределах одного квантиля находится как средневзвешенное. Для этого в качестве параметров берется среднее значение в каждом интервале дохода (интервальный ряд распределения с шагом h), а в качестве весов берутся количество или процент населения, имеющего доход, попадающий в соответствующий интервал.

4. Показатели вариации

В статистической практике для изучения и измерения вариации используются различные абсолютные и относительные показатели (меры) вариаций в зависимости от поставленных перед исследователем задач. К абсолютным показателям относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение, квартильное отклонение.

Изучение вариации признаков общественных явлений находится в прямой связи с группировками, в частности, с рядами распределения.

Размах вариации является наиболее простым измерителем вариаций признака. Он представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности:

Средне линейное отклонение представляет собой среднюю величину из отклонений вариантов признака от их средней.

, где  Xi - i-й вариант признака, - вес i-го варианта, n - объем совокупности.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины (s). Дисперсия вычисляется по формулам простой невзвешенной и взвешенной соответственно:

и              .

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:

  1. дисперсия постоянной величины равна нулю;
  2. если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится ;
  3. если все варианты значений признака уменьшить в одно и то же число раз(k раз), то дисперсия уменьшится в k2 раз .

Среднеквадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней.

- не взвешенное,

- взвешенное.

Для характеристики вариации признаков в совокупности можно применить так называемое квартильное отклонение. Этот показатель также можно применить вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

q = (Q3 – Q1) / 2;

Наряду с абсолютными показателями существуют и относительные, которые получают из абсолютных путем деления на .

Коэффициент осцилляции

Относительное линейное отклонение

Коэффициент вариации

Относительное квартильное отклонение

Момент распределения

Порядок

Начальный

Центральный

Условный

1

 

 

 

2

 

 

 

 

 

 

 

  • ·        ·        ·        ·          ·        ·        ·        ·      ·        ·

Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель AS:

.

При нормальном распределении коэффициент асимметрии равен 0. Величина показателя асимметрии  может быть положительной и отрицательной.

Может быть также рассчитан показатель эксцесса (островершинности):

.

Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении  и показатель эксцесса равен 0.

Наряду с изучением вариации признака по всей совокупности в целом бывает часто необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии при использовании аналитической группировкой.

Межгрупповая дисперсия , где номер группы, а число единиц в  группе. Межгрупповая дисперсия характеризует вариации результативного признака  за счет факторного признака .

Внутригрупповая дисперсия  - характеризует вариацию внутри группы.

Между дисперсиями существует связь - правило сложения дисперсий , где - общая дисперсия, а - средняя из внутри групповых:

;    .

Для оценки тесноты связи между результативным (y) и факторным (х)  признаками используется эмпирическое корреляционное отношение , а также коэффициент детерминации , который показывает какая часть вариации , вызвано вариацией . Если данный коэффициент равен нулю, то результативные и факторные признаки не связаны между собой, если же равен единице, то между ними существует функциональная зависимость.

 

Добавить комментарий


Защитный код
Обновить