本文概述
在一般数学中, 算术平均数或均值是通过特定公式计算集合的值而获得的值。
例如:
在下面的示例中, 我们需要计算包含5个学生年龄的集合的算术平均值。
Set= {10, 11, 8, 7, 9}
Arithmetic Mean= Sum of all values / 5
Arithmetic Mean= 10 + 11 + 8 + 7 + 9 / 5
Arithmetic Mean= 45 / 5
Arithmetic Mean= 9
在这里我们可以看到, 算术平均值为9。该平均值是通过应用特定公式从上述设置的所有值的总和获得的。
SAS中的算术平均值
在SAS中, 我们可以计算数据集中所有变量或仅所需变量的算术平均值。为了计算算术平均值, SAS提供了一个称为PROC MEANS的过程。 SAS还通过根据特定变量创建组来提供查找组均值的工具。
句法:
PROC MEANS DATA = DATASET; CLASS Variables; VAR Variables;
其中
- 数据集:这是用于查找均值的数据集的名称。
- 变量:这些是用于Mean操作的变量的名称。
现在, 我们将通过使用特定的过程和语句来学习SAS算术平均数的组成部分, 例如整个数据集的均值, 特定变量和一组特定变量。
以下是带有过程和语句的算术平均值组件的列表:
- PROC MEAN的数据集平均值
- VAR语句中特定变量的均值
- 通过类声明将特定变量分组的平均值
PROC MEAN的数据集平均值
我们可以通过仅在PROC MEAN中提供其名称来计算整个数据集的平均值。我们不需要提及任何变量名称, 因为它将仅通过提供数据集名称来计算。
例:
在下面的示例中, 我们将计算SAS数据集中所有数值变量的均值, 该值已在SAS帮助库中提供。我们还将计算这些变量的总和。
PROC MEANS DATA = sashelp.citiday Mean SUM MAXDEC=2;
RUN;
在SAS Studio中执行以上代码:
输出
正如我们在输出中所看到的, citiday的数据集的均值和总和已计算为两位小数。
如何显示不同的小数位?
我们可以使用0和所需的最大小数位显示数据集的均值和总和。在下面的示例中, 我们将显示结果为0或不带小数位。
例:
PROC MEANS DATA = sashelp.citiday Mean SUM MAXDEC=0;
RUN;
在SAS Studio中执行以上代码:
输出
根据以上输出, 结果显示为0或没有小数位。
现在, 在下面的示例中, 我们将小数点后三位。你可以根据需要选择任意小数位数。
PROC MEANS DATA = sashelp.citiday Mean SUM MAXDEC=3;
RUN;
在SAS Studio中执行以上代码:
输出
根据以上输出, Mean和Sum的结果显示为小数点后三位。
VAR语句中特定变量的均值
有时我们需要计算仅特定变量的均值以进行分析。我们可以通过在VAR语句中提供它们的名称来计算特定变量的均值。让我们通过一个例子来理解它:
例:
在下面的示例中, 我们将从数据集cityday计算一些特定变量的均值, 即SNYDJCM SNYSECM DFXWUK90, 该数据集已在SAS帮助库中提供。
PROC MEANS DATA = sashelp.citiday Mean SUM MAXDEC=2;
var SNYDJCM SNYSECM DFXWUK90;
RUN;
在SAS Studio中执行以上代码:
输出
根据以上输出, 已计算出仅选定变量的均值。
通过类声明的一组特定变量的均值
在SAS数据集中, 每个变量在某些方面都不同于其他变量, 例如在数据集汽车中, 保时捷的价格可能与丰田的价格不同。因此, 更适合对每个汽车制造商进行单独的分析。因此, 对于单独的分析, 我们可以使用CLASS语句创建仅包含必需变量的类。让我们通过一个例子来理解它:
例:
在下面的示例中, 我们将计算汽车数据集的变量”马力”的均值, 以便我们可以根据其可持续发展能力对各个公司的汽车进行分类。为了包括汽车, 我们通过使用带有变量Make(包含汽车制造公司的名称)和Type(包含由特定公司推出的汽车模型)的Class语句来创建Class。
注意:SAS帮助库中已提供Cars数据集, 请考虑一下以更加清楚。
PROC MEANS DATA = sashelp.CARS Mean SUM MAXDEC=2;
class make type;
var horsepower;
RUN;
在SAS Studio中执行以上代码:
输出
从输出中可以看到, 数据集的平均值是根据马力, 品牌和类型变量计算的。
评论前必须登录!
注册