- Способы расчета доверительного интервала
- Способы расчета доверительного интервала
- Этап 1. Выборка данных
- Доверительный интервал
- Классификация доверительных интервалов
- По виду оцениваемого параметра:
- По типу выборки:
- По виду критической области:
- Примеры применения
- Расчет средней ошибки выборки при случайном отборе
- Метод доверительных интервалов
Способы расчета доверительного интервала
Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов. Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал. Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.
Способы расчета доверительного интервала
Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.
Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.
Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:
- через медиану и среднеквадратическое отклонение;
- через критическое значение t-статистики (коэффициент Стьюдента).
Этапы сравнительного анализа разных способов расчета ДИ:
1. формируем выборку данных;
2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;
3. рассчитываем доверительный интервал двумя способами;
4. анализируем очищенные выборки и полученные доверительные интервалы.
Этап 1. Выборка данных
Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».
Таблица 1. Исходная выборка
Источник
Доверительный интервал
Назначение сервиса . С помощью этого сервиса определяются:
- доверительный интервал для генерального среднего, доверительный интервал для дисперсии;
- доверительный интервал для среднего квадратического отклонения, доверительный интервал для генеральной доли;
Полученное решение сохраняется в файле Word . Ниже представлена видеоинструкция, как заполнять исходные данные.
- Решение онлайн
- Видеоинструкция
- Примеры задач
Классификация доверительных интервалов
По виду оцениваемого параметра:
- Доверительный интервал для генерального среднего (математического ожидания);
- Доверительный интервал для дисперсии:
где s 2 — выборочная дисперсия; Χ 2 — квантиль распределения Пирсона. - Доверительный интервал для среднеквадратического отклонения;
- Доверительный интервал для генеральной доли;
По типу выборки:
- Доверительный интервал для бесконечной выборки;
- Доверительный интервал для конечной выборки;
Генеральная совокупность | Бесконечная | Конечная объема N |
Тип отбора | Повторный | Бесповторный |
Средняя ошибка выборки |
Выборка называется повторной, если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной, если отобранный объект в генеральную совокупность не возвращается. На практике обычно имеют дело с бесповторными выборками.
По виду критической области:
Площадь заштрихованной области равна p -уровню ( p — это вероятность отвергнуть нулевую гипотезу при условии, что она верна).
В MS Excel это значение вычисляется:
- двусторонняя область: =2*(1-НОРМСТРАСП(Χнабл))
- левосторонняя область: =НОРМСТРАСП(Χнабл)
- правосторонняя область: =1-НОРМСТРАСП(Χнабл)
Примеры применения
Расчет средней ошибки выборки при случайном отборе
Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называется ошибкой репрезентативности.
Обозначения основных параметров генеральной и выборочной совокупности.
Характеристики | Генеральная совокупность | Выборочная совокупность |
Объем совокупности (численность единиц) | N | n |
Численность единиц, обладающих обследуемым качеством (признаком) | M | m |
Доля единиц, обладающих обследуемым качеством (признаком), выборочная доля | | |
Формулы средней ошибки выборки | |||
повторный отбор | бесповторный отбор | ||
для средней | для доли | для средней | для доли |
| | | |
Соотношение между пределом ошибки выборки (Δ), гарантируемым с некоторой вероятностью Р(t), и средней ошибкой выборки имеет вид: или Δ = t·μ, где t– коэффициент доверия, определяемый в зависимости от уровня вероятности Р(t) по таблице интегральной функции Лапласа.
Формулы расчета численности выборки при собственно-случайном способе отбора
Способ отбора | Формулы определения численности выборки | ||
для средней | для доли | ||
Повторный | | | |
Бесповторный | | |
Найти численность выборки можно, использовав калькулятор.
Метод доверительных интервалов
Пример №1 . При проверке годности партии таблеток (250 шт.) оказалось, что средний вес таблетки 0,3 г, а СКО веса 0,01 г. Найти доверительный интервал, в который с вероятностью 90% попадает норма веса таблетки.
Решение.
Определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = 1 — γ
Ф(tkp) = γ/2 = (1- 0.05)/2 = 0.475
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.475
tkp(γ) = Ф(0.475) = 1.96
(0.3 — 0.206;0.3 + 0.206) = (0.094;0.51)
С вероятностью 0.9 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Пример №2 . На площади в 70 га, занятой пшеницей, определяется с помощью выборочного метода доля посева, пораженная насекомыми вредителями. Сколько проб надо взять в выборку, чтобы при вероятности 0,997 определить искомую величину с точностью до 4%, если пробная выборка показывает, что доля пораженной посевной площади составляет 9%?
Решение ищем по формуле определения численности выборки для повторного отбора.
Ф(tkp) = γ/2 = 0.997/2 = 0,4985 и этому значению по таблице Лапласа соответствует tkp =2.96.
w = 9% = 0,09
Δ = 4% = 0,04
Итого: n = 2.96 2 *0,09(1-0,09)/0,04 2 = 448,4844 ≈ 449
Пример . При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 100 изделий. В результате был установлен средний вес изделия 5000 г при среднем квадратическом отклонении 40 г. С вероятностью 0,950 определить пределы, в которых находится средний вес изделия в генеральной совокупности.
Решение
Поскольку n>30, то определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.95/2 = 0.475
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.475
tkp(γ) = (0.475) = 1.96
(5000 — 78.4;5000 + 78.4) = (4921.6;5078.4)
С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Пример . С надежностью γ=0.954 построить доверительный интервал для генеральной доли
Пример №1
Пример . По результатам выборочного наблюдения (выборка В приложение) вычислите несмещенные оценки среднего значения, дисперсии и среднего квадратического отклонения генеральной совокупности.
Скачать решение
Пример . Найдите доверительные интервалы для оценки среднего значения и среднего квадратического отклонения генеральных совокупностей при доверительной вероятности y, если из генеральных совокупностей сделана выборка В и y.
Скачать решение
1. Используя результаты расчетов, выполненных в задании № 2 и полагая, что эти данные получены при помощи собственно-случайного 10-ти процентного бесповторного отбора, определить:
а) пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;
б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.
2. Используя результаты расчетов, выполненных в задании № 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду с доверительной вероятностью 0,954;
б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 20 %.
Методические указания
Задание. Поточная линия по производству однотипных деталей подвергалась реконструкции Заданы две выборки отображающие процент брака в партиях деталей выпускаемых на данной линии до и после реконструкции Можно ли достоверно утверждать, что после реконструкции процент брака в партиях деталей снизился?
Пример . Ниже приведены данные по затратам на бурение (у.е.) для 49 скважин Западно-Сибирской нефтяной базы России:
129 | 142 | 132 | 61 | 96 | 96 | 142 | 17 | 135 | 32 |
77 | 58 | 37 | 132 | 79 | 15 | 145 | 64 | 83 | 120 |
11 | 54 | 48 | 100 | 43 | 25 | 67 | 25 | 140 | 130 |
48 | 124 | 29 | 107 | 135 | 101 | 93 | 147 | 112 | 121 |
89 | 97 | 60 | 84 | 46 | 139 | 43 | 145 | 29 |
В целях оценки затрат на бурение новой скважины:
- провести выборку собственно случайным способом объемом n=5;
- определить интервальные значения среднего генеральной совокупности (X) по рассчитанным выборочным показателям (X, s 2 ) с помощью функции t-распределения Стьюдента при уровне значимости α=0.05;
- определить точечное значение среднего генеральной совокупности (X) по исходным данным;
- оценить правильность интервальных расчетов, сравнивая точечное значение (X) с интервальным значением, рассчитанным по выборке;
Решение проводим с помощью этого калькулятора:
1. Выбираем 5 значений из таблицы. Пусть это будет 3 столбец: 132, 37, 48, 29, 60.
В разделе «Вид статистического ряда» выбираем Дискретный ряд . В поле Количество строк указываем 5.
2. Вводим исходные данные.
Поле «Доверительный интервал генерального среднего, дисперсия и среднеквадратическое отклонения » указываем значение γ = 0.95 (что соответствует α=0.05).
В поле « Выборка » указываем значение 10 (поскольку из 49 значений выбрали 5, что соответствует 10,2% (5/49×100%)).
В разделе «Выводит в отчет» отмечаем первый пункт «Доверительный интервал для генерального среднего» .
Нажимаем кнопку Далее .
3. Полученное решение сохраняется в формате Word (скачать).
Перед расчетами создается предварительная таблица, в которой подсчитывается количество повторений значений Х.
x | (x — x ср) 2 |
29 | 1036.84 |
37 | 585.64 |
48 | 174.24 |
60 | 1.44 |
132 | 5012.64 |
306 | 6810.8 |
В данном случае все значения X встречаются ровно один раз. Интервальные значения среднего генеральной совокупности рассчитываются в разделе «Интервальное оценивание центра генеральной совокупности».
Примечание: в данном случае в расчетах используется Оценка среднеквадратического отклонения.
Задание №2: В целях изучения затрат времени на изготовление одной детали рабочими завода проведена 10% -ная случайная бесповторная выборка, в результате которой получено распределение деталей по затратам времени, представленное в прил. Б.
На основании этих данных вычислите:
а) средние затраты времени на изготовление одной детали;
б) средний квадрат отклонений (дисперсию) и среднее квадратическое отклонение;
в) коэффициент вариации;
г) с вероятностью 0,954 предельную ошибку выборочной средней и возможные границы, в которых ожидаются средние затраты времени на изготовление одной детали на заводе;
д) с вероятностью 0,954 предельную ошибку выборочной доли и границы удельного веса числа деталей с минимальными затратами времени на их изготовление. Перед тем как производить расчеты, необходимо записать условия задачи и заполнить табл. 2.1
Решение.
Для получения решения указываем следующие параметры:
- Вид статистического ряда: Задан дискретный ряд ;
- Количество групп: не делать группировку ;
- Для построения доверительного интервала генерального среднего, дисперсии и среднеквадратического отклонения: y= 0.954 ;
- Для построения доверительного интервала генеральной доли: y= 0.954 ;
- Выборка: 10 ;
- Выводить в отчет: Доверительный интервал для генерального среднего , Доверительный интервал для генеральной доли ;
Задание №3: Используя результаты расчетов, выполненных в задании №2 и полагая, что эти данные получены при помощи повторного отбора, определить:
а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду с доверительной вероятностью 0.954 ;
б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 20% .
Решение.
Используя результаты расчетов, выполненных в задании № 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду с доверительной вероятностью 0.954 ;
б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 20%.
Задание №4: Из партии электроламп взята 20% -ная случайная бесповторная выборка для определения среднего веса спирали. Результаты выборки следующие. Вес, мг:38-40;40-42;42-44;44-46. Число спиралей:15;30;45;10. Определить с вероятностью 0.95 доверительные пределы, в которых лежит средний вес спирали, для всей партии электроламп.
Решение.
Вводим следующие параметры:
- Вид статистический ряда: Задан интервальный ряд ;
- Для построения доверительного интервала генерального среднего, дисперсии и среднеквадратического отклонения: y = 0.95 ;
- Выборка: 20 ;
- Выводить в отчет: Доверительный интервал для генерального среднего .
Задание №5: На заводе электроламп из партии продукции в количестве 16000 шт. ламп взято на выборку 1600 шт. (случайный, бесповторный отбор), из которых 40 шт. оказались бракованными. Определить с вероятностью 0.997 пределы, в которых будет находиться процент брака для всей партии продукции.
Решение.
Здесь N = 16000 , n = 1600 , w = d / n = 40/1600 = 0.025.
Источник