- Модель парной регрессии
- Регрессионный анализ — определение аналитического выражения связи, в котором изменение одной величины обусловлено влиянием одной или несколько независимых величин. Методы выбора математической модели в парной регрессии. Определение остатка для наблюдения.
- Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
- Парная регрессия и ее применение в экономике
- Общие сведения о парной (простой) регрессии и её роли в экономике
- Готовые работы на аналогичную тему
- Особенности процесса определения эконометрической модели парной регрессии
Модель парной регрессии
Регрессионный анализ — определение аналитического выражения связи, в котором изменение одной величины обусловлено влиянием одной или несколько независимых величин. Методы выбора математической модели в парной регрессии. Определение остатка для наблюдения.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 11.12.2017 |
Размер файла | 162,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Модель парной регрессии
2. Методы выбора математической модели в парной регрессии
3. Линейная модель парной регрессии и корреляции
4. Определение тесноты связи и оценка существенности уравнения регрессии
5. Виды нелинейных регрессионных моделей, расчет их параметров
6. Метод максимального правдоподобия
Список используемой литературы
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины обусловлено влиянием одной или несколько независимых величин, а множество всех факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной) и многофакторной (множественной).
Уравнение регрессии, или статистическая модель связи социально-экономических явлений выражается в общем случае уравнением:
которое адекватно отражает реальное моделируемое явление.
Одной из проблем построения уравнения регрессии является её размерность, т.е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Практика выработала критерий, позволяющий установить количество факторных признаков, включаемых в модель. Число факторных признаков (k) должно быть в 5-6 раз меньше объема изучаемой совокупности.
Парная регрессия представляет собой регрессию между двумя переменными — y и x, т. е. модель вида:
где y — зависимая переменная (результативный признак); x — независимая, или объясняющая, переменная (признак-фактор). Знак «^» означает, что между переменными x и y нет строгой функциональной зависимости, поэтому практически в каждом отдельном случае величина y складывается из двух слагаемых:
где y — фактическое значение результативного признака; — теоретическое значение результативного признака, найденное исходя из уравнения регрессии; е — случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина е называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака , подходят к фактическим данным y . К ошибкам спецификации относятся неправильный выбор той или иной математической функции для и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной.
Наряду с ошибками спецификации могут иметь место ошибки выборки, которые имеют место в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики.
Использование временной информации также представляет собой выборку из всего множества хронологических дат. Изменив временной интервал, можно получить другие результаты регрессии.
Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки — увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками.
Особенно велика роль ошибок измерения при исследовании на макроуровне. Так, в исследованиях спроса и потребления в качестве объясняющей переменной широко используется «доход на душу населения». Вместе с тем, статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например, в результате наличия скрытых доходов.
2. Методы выбора математической модели в парной регрессии
Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели. В парной регрессии выбор вида математической функции может быть осуществлен тремя методами:
2) аналитическим, т.е. исходя из теории изучаемой взаимосвязи;
При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции. Основные типы кривых, используемые при количественной оценке связей, представлены на рис. 1.1:
Рис 1. Основные типы кривых, используемые при количественной оценке связей между двумя переменными.
Значительный интерес представляет аналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых признаков.
При обработке информации на компьютере выбор вида уравнения регрессии обычно осуществляется экспериментальным методом, т. е. путем сравнения величины остаточной дисперсии , рассчитанной при разных моделях.
Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии
то фактические значения результативного признака совпадают с теоретическими , т.е. они полностью обусловлены влиянием фактора x. В этом случае остаточная дисперсия .
В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих, не учитываемых в уравнении регрессии, факторов. Иными словами, имеют место отклонения фактических данных от теоретических . Величина этих отклонений и лежит в основе расчета остаточной дисперсии:
Чем меньше величина остаточной дисперсии, тем меньше влияние не учитываемых в уравнении регрессии факторов и тем лучше уравнение регрессии подходит к исходным данным.
Считается, что число наблюдений должно в 7-8 раз превышать число рассчитываемых параметров при переменной x . Это означает, что искать линейную регрессию, имея менее 7 наблюдений, вообще не имеет смысла. Если вид функции усложняется, то требуется увеличение объема наблюдений, ибо каждый параметр при x должен рассчитываться хотя бы по 7 наблюдениям. Значит, если мы выбираем параболу второй степени
то требуется объем информации уже не менее 14 наблюдений.
3. Линейная модель парной регрессии и корреляции
Рассмотрим простейшую модель парной регрессии — линейную регрессию. Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров.
Построение уравнения регрессии сводится в первую очередь к расчету его параметров — а и b . Они могут быть определены разными методами. Наиболее распространенным методом, является метод наименьших квадратов (МНК).
Допустим, что заданы n наблюдаемых значений результативного признака (у) и признака-фактора (х).
Следует отметить, что рассчитываются не истинные значения a и b, а только оценки, которые могут быть хорошими или плохими.
Возникает вопрос: существует ли способ достаточно точной оценки а и b алгебраическим путем?
Вначале на поле корреляции построим точки соответствующие наблюдаемым значениям х и у и прямую, выражающую линейную регрессию (рис.2). регрессионный математический аналитический
Первым шагом является определение остатка для каждого наблюдения. Разность между фактическим и расчетным значением, соответствующим xi, описывается как остаток в i-м приближении:
Рис.2 Точки рассеивания и прямая, выражающая линейную регрессию
Очевидно, что нужно построить такую линию регрессии, чтобы остатки были минимальными. Необходимо выбрать какой-то критерий подбора, который будет одновременно учитывать величину всех остатков.
Критерий минимизации суммы квадратов отклонений, фактических значений результативного признака (у) от расчетных (теоретических): заложен в основу МНК.
Обозначим через S, тогда
Чтобы найти min, надо вычислить частные производные по каждому из параметров а и b и приравнять их к нулю.
Преобразуя систему (2.1), получаем следующую систему нормальных уравнений для оценки параметров a и b :
Решая систему (2.2), получим
Параметр b называется коэффициентом регрессии. Его величина показывает, насколько единиц изменится результат с изменением фактора на одну единицу.
Параметр a, вообще говоря, не имеет экономической интерпретации. Например, если a 0, то относительное изменение результата происходит медленнее, чем изменение фактора.
4. Определение тесноты связи и оценка существенности уравнения регрессии
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такового показателя выступает линейный коэффициент корреляции r. Одна из формул линейного коэффициента корреляции имеет вид:
Коэффициент корреляции находится в пределах: — 1 0, то 0 Fтабл, то нулевая гипотеза Н 0 об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи.
Источник
Парная регрессия и ее применение в экономике
Вы будете перенаправлены на Автор24
Общие сведения о парной (простой) регрессии и её роли в экономике
Изучение предметов и явлений, которые имеют место быть в экономике, осуществляется во многом благодаря использованию широкого аппарата эконометрической науки. Она базируется на применении методов математического исследования в целях объяснения и прогнозирования экономических событий.
Если объекты экономической действительности выразить количественно, то эконометрика предоставляет возможность установить существование или отсутствие связи между ними, определить направление такой связи и оценить её силу. Для этого необходимо воспользоваться методами корреляционно-регрессионного анализа.
Как правило, в подобных исследованиях изучается то, как на один параметр (зависимую переменную, результат) оказывают влияние другие параметры (независимые переменные, факторы). Если одновременно изучается два или более фактора, то имеют дело с, так называемой, множественной регрессией.
Парная (простая) регрессия представляет собой эконометрическую модель, в которой значение зависимой переменной Y объясняется значением одной независимой переменной X. То есть объясняемая переменная зависит от объясняющей переменной, что можно выразить следующей функцией: Y = f (X).
Использование парной регрессии оправдано в случае наличия доминирующего фактора, который в среднем по совокупности наблюдений объясняет большую часть изменения итогового результата. На основании этой зависимости ученые получают возможность выделить, сформулировать и обосновать некоторую закономерность, существующую в текущей экономической действительности. Наиболее известным примером использования парной регрессии для объяснения экономических явлений является зависимость спроса на товар Y от цены на него X, которая, например, может быть описана уравнением Y = 3000 – 4 ⋅ X. Оно означает, что, если цена возрастет на 1 денежную единицу, то спрос в среднем снизится на 4 условные единицы.
Готовые работы на аналогичную тему
Стоит отметить, что данная математическая функция выражает функциональную связь исследуемых признаков. Однако на них оказывают влияние (пусть и не большое) ряд других факторов. Тогда фактическое значение результативного признака будет складываться из двух слагаемых: Y = Yi + e, где Yi – это теоретическое значение результативного признака, найденное из уравнения парной регрессии, е – это случайная величина, которая характеризует отклонение реального значения результативного признака от теоретического.
Присутствие в регрессионной модели случайной величины е (также называется возмущением) обусловлено:
- влиянием факторов, не учтенных из-за спецификации модели;
- случайными ошибками, вызванными выборочным характером исходных данных;
- особенностями измерения переменных.
Таким образом, в ситуации действия случайных факторов уравнение зависимости спроса от цены следует записать следующим образом: Y = 3000 – 4 ⋅ X + е.
Особенности процесса определения эконометрической модели парной регрессии
В эконометрике существуют три метода выбор метода математической функции парной регрессии Y = f (X):
- графический метод – используется поле корреляции (в виде системы координат), наблюдение за которым позволяет подобрать наиболее подходящий вид уравнения регрессии;
- аналитический метод – в его основе лежит изучение материальной природы связи исследуемых признаков;
- экспериментальный метод – базируется на выборе модели, которая наилучшим образом описывает связь исследуемых признаков.
Использование этих методов линейной регрессии нацелено на нахождение уравнения вида Yi = a + b ⋅ X или Y = a + b ⋅ X + е. Использование первого вида уравнения заключается в подстановке фактических значений фактора Х, которому будет соответствовать теоретическое значение результативного признака Yi.
Популярность именно этой регрессионной модели объясняется тем, что каждый её параметр получает достаточно чёткую экономическую интерпретацию. Так, при изменении фактора Х на одну условную единицу, результативный показатель Y изменится на количество единиц, равное b. А если действий каких-либо факторов не будет, то значение результативного показателя Y будет равно a.
Построение линейной регрессии сводится к оценке ее параметров – a и b. Она традиционно осуществляется посредством использования метода наименьших квадратов. Он заключается в том, чтобы подобрать такие параметры a и b, при которых будет минимальной сумма квадратов отклонений фактических значений результативного признака от теоретических.
В основе метода наименьших квадратов лежит решение следующей системы уравнений:
a ⋅ n + b ⋅ ΣX = ΣY
a ⋅ ΣX + b ⋅ Σ(X^2) = Σ(X ⋅ Y)
где n – это количество пар значений изучаемых переменных.
При использовании регрессионной модели описания экономических явлений зачастую рассчитывается показатель, характеризующий тесноту связи – коэффициент корреляции. Этот статистический показатель описывает зависимость двух случайных величин, рассчитывается как отношение их ковариации к произведению средних квадратичных отклонений, а потому изменятся в пределах от -1 до 1. Значение +1 говорит о наличии прямой зависимости, -1 – обратной зависимости, 0 – отсутствии какой-либо зависимости.
То есть, чем ближе значение модуля этого коэффициента к единице, тем сильнее связь между исследуемыми показателями. Знак же определяет только направление этой связи.
Источник