Экономические дисциплины - Статистика

Тема №5: Выборочный метод в изучении социально-экономических явлений и процессов

 

  1. Причины применения выборочного наблюдения.
  2. Способы отбора и виды выборки.
  3. Ошибки выборки.
  4. Влияние вида выборки на величину ошибки выборки.
  5. Проверка статистических гипотез.

1. Причины применения выборочного наблюдения

Выборочное наблюдение является наиболее  распространенным видом несплошного наблюдения. Оно позволяет распределить данные, полученные по части совокупности на всю совокупность.

Причины применения выборочного наблюдения:

-         уменьшение ошибки регистрации за счет уменьшение объема выборки;

-         экономия материальных, трудовых, финансовых  ресурсов и времени;

-         возможная порча наблюдаемого объекта.

Основные области применения:

-         разработка данных переписи населения о составе и типах семьи;

-         опрос общественного мнения;

-         определение урожайности сельскохозяйственных культур;

-         контроль и анализ качества продукции;

-         нормирование рабочего времени;

-         выборочное обследование предприятий между переписями;

-          выборочные аудиторские проверки.

Трактовка данных, как выборочные, делит статистику на описательную, которая занимается сбором и обработкой данных, и выводную, целью которой является сравнение параметров генеральной и выборочной совокупности и вывод о том, представляет ли выборка генеральную совокупность.

Рассмотрим основные показатели генеральной и выборочной совокупности:

 

 

 

Показатель

Генеральная совокупность

Выборочная совокупность

Объем совокупности

 

 

Среднее значение варьирующего признака

 

 

Доля или альтернативная средняя

 

 

Дисперсия

 

 

Дисперсия альтернативного признака

 

 

2. Способы отбора и виды выборки

Для того чтобы сделать вывод о свойствах генеральной совокупности по выборочной, выборка должна быть репрезентативной, т.е. наиболее полно и адекватно отражать свойства генеральной совокупности. Для обеспечения репрезентативности используются следующие способы отбора:

-         случайный отбор;

-         отбор по определенной схеме;

-         сочетание первого и второго.

Случайный отбор производится по жребию. Различают повторный и бесповторный случайный отбор. При повторном отборе вероятность выбора определенной единицы равна , а при бесповторной от  до . Если объем генеральной совокупности стремится к бесконечности, то повторный отбор практически не отличается от бесповторного. Простейшим способом схемного отбора считается механический отбор. Для этого берется неупорядоченная по изучаемому признаку совокупность и из нее выбираются единицы с шагом .

Квотный отбор - выборка составляется из единиц определенных категорий или квот, представленных в заданных пропорциях. Квотный отбор производится при социальных опросов общественного мнения, отбирая  ограниченное количество опрашиваемых по структуре соответствующей генеральной совокупности.

Виды выборки

  1. Случайная выборка.
  2. Типическая или стратифицированная, если отбор производится из совокупности, предварительно разделенной на типы.
  3. Серийная или гнездовая, если в качестве единицы измерения используется серия.
  4. Многоступенчатая, на каждой ступени используются разные единицы отбора.
  5. Многофазовая - несколько фаз, каждая со своей программой наблюдения.

3. Ошибки выборки

Различают следующие ошибки выборки:

  1. Ошибки регистрации, которые бывают преднамеренными и непреднамеренными.
  2. Ошибки репрезентативности, которые делятся на случайные и систематические. Систематическая ошибка связана с плохой системой отбора или с ее нарушением. Случайные ошибки зависят от трех основных факторов:

-         от объема выборки,

-         от степени вариации изучаемого признака генеральной в совокупности, которая характеризуется генеральной дисперсией,

-         от применяемого способа отбора и единиц отбора.

Простая случайная повторная выборка: согласно теории Ляпунова, при достаточно большом , конечном  и ограниченной  вероятность того, что расхождение , не превзойдет величины  равна функции интеграла Лапласа, т.е. , где

- стандартная ошибка,

- предельная ошибка.

В математике доказано, что  где , т.е. . Таким образом, с заданной вероятностью  можно утверждать, что .

Для альтернативной выборочной стандартная ошибка находится по формуле:

Задача обратная определению ошибки выборки - это определение объема выборки. Объем выборки можно выявить из формулы определения стандартной ошибки: .

Если известны крайние значения , то для симметричной выборки , для асимметричной размах делится на 5. Для доли берется максимальное значение  . , где  изменяется от 0 до 1. При этом

4. Влияние вида выборки на величину ошибки выборки

Для бесповторной выборки производится коррекция стандартной ошибки . Для альтернативной случайной величины . Аналогичная коррекция производится при механическом отборе, т.к. если генеральная совокупность не ранжируется , то это будет разновидность простой случайной бесповторной выборки. Для типической выборки генеральная совокупность разбивается на к групп. , коррекция , - средняя из внутригрупповых дисперсий.

, - внутригрупповая дисперсия.

Аналогично для альтернативной случайной величены:

;.

Для серийной выборки , где - межсерийная дисперсия.

, , .

Особое место занимает малая выборка. Теория малой выборки разработана английским статистиком Стъюдентом. Он построил специальное распределение, соотносящее t и доверительную вероятность F(t). При  таблица распределения Стъюдента дает те же результаты, что и таблицы интеграла вероятности Лапласа. При  различия незначительны и при , необходимо пользоваться распределением Стъюдента.

, где - коэффициент, который зависит от объема выборки.

Распределение  зависит от числа степеней свободы дисперсии . По сравнению с нормальным распределением  при стандартная ошибка увеличивается, следовательно, увеличивается и предельная ошибка, и доверительный интервал при той же доверительной вероятности.

5. Проверка статистических гипотез

Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Гипотеза о распределениях  параметров генеральной совокупности называется параметрической. Гипотеза о законах распределениях называется непараметрической. Гипотеза о том, что две совокупности сравнимые по одному или нескольким параметрам ничем не отличаются называется нулевой.

Правила, устанавливающие условия отклонения или принятия нулевой гипотезы, называется статистическим критерием.

Этапы проверки статистических гипотез:

-         формулировка  гипотезы,

-         выборы статистического критерия,

-         определение области допустимых значений  и критических точек, которые разделяют область допустимых значений и определение критической области по соответствующим таблицам,

-         вычисление фактического значения статистического критерия,

-         проверка гипотезы на основе сравнения фактического и критического значения.

Возможны два ошибочных решения:

  1. Неправильное отклонение нулевой гипотезы (ошибка первого рода), ее вероятность или риск  называется уровень значимости критерия.
  2. Неправильное принятие нулевой гипотезы или ошибки второго рода, ее вероятность или риск .

-называется мощностью критерия.

Проверка соответствия теоретического и эмпирического распределения производится при помощи критериев согласия, наиболее распространены из которых это - критерий Пирсона и Колмогорова. По ряду распределения строится гистограмма, вычисляются различные величины и на их  основе подбирается тот или иной закон.

Критерий Пирсона проверяет гипотезу о том, что случайная выборка извлечена из генеральной совокупности с функцией распределения , вид которой известен, а параметры неизвестны.

Этапы проверки гипотезы по критерию Пирсона.

-         Совокупность преобразуется в интервальный ряд, который имеет к интервалов.

-         На основе сгруппированных данных вычисляются оценки неизвестных параметров теоретического распределения.

-         Определяют вероятность  попадания случайной величины в к-тый интервал.

-         Вычисляется значение критерия Пирсона - чем меньше критерий, тем ближе фактическое распределение к теоретическому.

Критерий Пирсона сравнивается с табличным значением, найденного для уровня значимости и числа степеней свободы , где - число параметров закона распределения. Если полученное значение критерия больше критического, то нулевая гипотеза отвергается.

Критерий Колмогорова проверяет гипотезу о том, что случайная выборка извлеченная из генеральной совокупности с непрерывной функцией распределения , которая полностью определена, т.е. не зависит от неизвестных параметров.

, т.е. максимальный модуль отклонения эмпирической функции распределения от теоретической. Если данный критерий больше критического значения, то нулевая гипотеза отвергается.

Проверка гипотезы о средних:

1. , в качестве критерия используется критерий Стюарта , . Если значение - критерия больше  критического, то нулевая гипотеза отвергается.

2.

Проверка гипотезы о дисперсиях

Проверка проводится с помощью критерия Фишера. . Критическое значение данного критерия зависит от уровня значимости и числа степеней свободы числителя и знаменателя. Если значение критерия Фишера больше критического, то нулевая гипотеза отвергается.

 

 

Добавить комментарий


Защитный код
Обновить