-

相关性分析处理变量之间的关系。 相关系数是两个变量之间的线性关联的度量。相关系数的值总是在-1和+1之间。 SAS提供过程PROC CORR以找到数据集中的一对变量之间的相关系数。

语法

在SAS中应用PROC CORR的基本语法是:

PROC CORR DATA = dataset options;
VAR variable;

以下是使用的参数的描述:

  • Dataset是数据集的名称。
  • 选项是附加选项,其中包括绘制矩阵等过程。
  • 变量是用于查找相关性的数据集的变量名称。

数据集中可用的一对变量之间的相关系数可以通过在VAR语句中使用它们的名称来获得。 在下面的例子中,我们使用数据集CARS1并得到显示马力和重量之间的相关系数的结果。

PROC SQL;
create table CARS1 as
SELECT invoice,horsepower,length,weight
 FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

proc corr data=cars1 ;
VAR horsepower weight ;
BY make;
run;

当执行上面的代码中,我们得到以下结果:

所有变量之间的相关性

通过简单地应用具有数据集名称的过程,可以获得数据集中可用的所有变量之间的相关系数。

在下面的例子中,我们使用数据集CARS1并获得显示每对变量之间的相关系数的结果。

proc corr data=cars1 ;
run;

当执行上面的代码中,我们得到以下结果:

相关矩阵

我们可以通过在PROC语句中选择绘制矩阵的选项来获得变量之间的散点图矩阵。

在下面的例子中,我们得到马力和重量之间的矩阵。

proc corr data=cars1 plots=matrix ;
VAR horsepower weight ;
run;

当执行上面的代码中,我们得到以下结果: