type
status
date
slug
summary
tags
category
icon
password
文章来源说明
🤔 一个简单的开头
- 问题、目标、人物、背景是什么?
为什么读者会对其有兴趣?
- 阻碍、努力、结果
展示你的主要成果
- 意外、转弯
说说你的故事
📝主旨内容
一、回归分析的介绍和分类
1、回归分析:研究x和y之间相关性的分析,尝试去解释y的形成机制,进而达到通过x去预测y的目的
2、关键词
(1)相关性:相关性≠因果性
(2)y:因变量(被解释变量)
(3)x:自变量(解释变量)
3、回归分析的使命
(1)哪些x变量是同y真的相关,哪些不是
(2)正相关还是负相关
(3)估计权重(确定回归系数)
4、回归分析的分类
类型 | 模型 | y的特点 | 例子 |
线性回归 | OLS、GLS(最小二乘法) | 连续数值型变量 | GDP、产量、收入 |
0-1回归 | logistic回归 | 二值变量(0-1) | 是否违约、是否得病 |
定序回归 | prodit定序回归 | 定序变量 | 等级评定(优良差) |
计数回归 | 泊松回归(泊松分布) | 计数变量 | 每分钟车流量 |
生存回归 | Cox等比例风险回归 | 生存变量(截断数据) | 企业、产品的寿命 |
二、不同数据类型的处理方法
数据类型 | 含义 | 常见建模方法 |
横截面数据 | 在某一时点收集的不同对象的数据 | 多元线性回归 |
时间序列数据 | 对同一对象在不同时间连续观察所得的数据 | AR、MA、ARMA、ARIMA、ARCH、GARCH、VAR |
面板数据 | 横截面数据与时间序列数据的综合 | 固定效应和随机效应、静态面板和动态面板 |
三、一元线性回归
1、对于线性的理解
双对数模型
(1)什么时候取对数:
与市场价值相关的都可以取对数;
比例变量可以取对数;
变量取值必须是非负数,如果包含0,取ln(1+y)
(2)取对数的好处:
减弱数据的异方差性;
如果变量本身不符合正态分布,取了对数后可能渐近服从正态分布;
模型形式的需要,让模型具有经济学意义。
2、回归系数的解释
3、蒙泰卡罗模拟

四、四种模型的解释
1、回归系数的解释
(1)一元线性回归:y=a+bx+u+cx1*x2
x每增加1个单位,y平均变化b个单位。
(2)双对数模型:lny=a+blnx+u
x每增加1%,y平均变化b%。
(3)半对数模型:y=a+blnx+u
x每增加1%,y平均变化b/100个单位。
(4)半对数模型:lny=a+bx
x每增加1个单位,y平均变化(100b)%。
多个自变量时:在控制其他变量不变的情况下
2、虚拟变量的解释
y=δFemale+…
在其他自变量给定的情况下,女性平均工资与男性平均工资的差异
3、多分类虚拟变量
y=βProvicne1
4、交互项:ax1*x2
在其他变量不变的情况下,x1越大,增加1单位x2对y的影响越大
实现(待完善)
stata实现
🤗总结归纳
参考文章
致谢:
有关Notion安装或者使用上的问题,欢迎您在底部评论区留言,一起交流~
- 作者:昕昕丶未来不是梦
- 链接:https://pisce.buzz/article/jianmo00801
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。