泊松回归模型用于对以结果为计数的事件进行建模。计数数据是具有非负整数值的离散数据, 该整数值对事物进行计数, 例如杂货店排队的人数或在给定时间范围内事件发生的次数。
我们还可以将计数数据定义为费率数据。这样就可以将事件在时间范围内发生的次数表示为原始计数或比率。泊松回归使我们能够确定哪个解释变量(x值)影响给定的响应变量(y值, 计数或比率)。
例如, 杂货店可以实施泊松回归以更好地理解并预测连续的人数。
泊松回归具有以下一般数学方程式:
这里,
S.No | Parameter | Description |
---|---|---|
1. | y | 它是响应变量。 |
2. | a和b | 这些是数字系数。 |
3. | x | x是预测变量。 |
泊松回归模型是在熟悉的函数glm()的帮助下创建的。
我们来看一个使用glm()函数创建泊松回归模型的示例。在此示例中, 我们考虑了一个内置数据集” wrapbreaks”, 该数据描述了张力(低, 中或高), 以及羊毛类型(A和B)对每台织机的断头次数的影响。我们将羊毛的”类型”和”张力”作为预测变量, 而”断裂”作为响应变量。
例子
#Creting data for the poisson regression
reg_data<-warpbreaks
print(head(reg_data))
输出
现在, 我们将借助glm()函数创建回归模型, 如下所示:
#Creating Poisson Regression Model using glm() function
output_result <-glm(formula = breaks ~ wool+tension, data = warpbreaks, family = poisson)
output_result
输出
现在, 让我们使用summary()函数查找模型的摘要以进行数据分析。
#Using summary function
print(summary(output_result))
输出
评论前必须登录!
注册