本文概述
在此SAS术语教程中, 我们提供了在学习SAS时会遇到的重要SAS术语列表。在开始使用SAS术语之前, 你可以先修改SAS编程语言的概念。
在这里, 我们将讨论SAS术语, 这些术语对数据科学很有用并在SAS编程中使用。 SAS用于高级分析, 预测分析, 数据管理, 商业智能和多元分析。
不同的SAS术语
访问描述符
SAS通过接口视图引擎与IMS数据库进行交互。接口视图引擎使用通过ACCESS过程创建的SAS / ACCESS描述符文件。描述符文件有两种类型:
- 访问描述符
- 查看描述符
访问描述符
访问描述符包含要使用的IMS(信息管理系统)数据库的信息。数据库信息包括IMS字段名称, 数据库格式, 数据库名称, 节名称和长度, 关键字段和默认SAS格式。访问描述符由一个字段的唯一处理概念组成, 它指示一个实体是否在数据库段中多次出现。 SAS / ACCESS文件描述了SAS软件的数据, 并且该数据存在于PC文件中。
访问描述符用作主描述符文件, 因为它包含数据库的完整描述, 而IMS不存储有关数据库的描述性信息。
查看描述符
视图描述符用于定义子集中的数据。它仅定义访问描述符描述数据的子集。 SAS程序中使用了视图描述符, 以直接在IMS数据库中写入或读取数据。通过使用视图描述符, 可以提取IMS数据并将其放置在SAS数据文件中。
数据类型
在表内部, 每一列都有一个属性和数据类型, 该属性指示操作环境, 物理存储容量和该列中存在的数据类型(例如int, Boolean, String等)。
SAS中仅使用两种数据类型:实数和固定长度的字符串。实数用于内部存储日期和时间, 因为数字和字符始终作为宏变量。应引用字符值, 以将其与其他语言元素(如变量)分开。
柱
它是PC文件的垂直组件, 具有唯一的名称和具有某些属性的特定类型数据。列对应于SAS术语中的变量。
列功能
列函数是计算列的每个值的操作。例如, 薪水是列的列函数, 需要计算。
资料值
在SAS软件中, 数据值是在SAS数据集中显示的字符或数字信息的单位。数据值表示观察中的变量。
浏览数据
浏览数据是查看包含观察结果的文件数据的过程。
文件
文件是以良好组织方式相互关联的实体的集合。每条记录被视为一个单元, 并通过SAS软件进行控制。这些SAS文件将被处理并存储在SAS数据库中。
数据库管理系统(DBMS)
DBMS是用于创建和处理数据的集成软件包。数据以数据库内关系表的形式表示。
格式
SAS软件用来写入或显示每个变量的值的指令称为格式。某些格式由SAS软件提供, 而其他格式则由用户使用格式过程在基本SAS软件中编写。
SAS数据库
SAS数据库是组织表形式的相关数据的集合。在关系数据库管理系统中, 数据库包含诸如索引, 视图和表之类的对象, 以便可以系统地访问数据。
发动机
SAS软件包含许多部分, 而引擎就是其中之一。引擎的责任是从文件中读取数据并写入文件。
编号
SAS索引的目的是优化” WHERE子句”处理并促进BY组处理。我们还使用这些索引来优化磨损处理并参与处理。
知情的
INFORMAT语句用于将信息与变量关联。我们可以指定SAS软件提供的标准SAS信息格式或用户定义的信息格式, 但是两者都应事先在PROC FORMAT中定义。单个INFORMAT语句可以将具有多个变量的相同信息链接到具有多个变量的不同信息。如果变量出现在多个INFORMAT语句中, 则SAS使用最后分配的信息。
INFORMAT variable-1 <...variable-n>
;
INFORMAT <variable-1> <... variable-n>
;
INFORMAT variable-1 <...variable-n> informat
;
INFORMAT语句定义了以前未定义的字符变量的长度, 因此, 如果INFORMAT语句出现在SET语句之前, 则可以在DATA步骤中缩短字符变量的值。
Libref
Libref是临时链接到SAS数据库的名称。例如, 在SASUSERS.ACCOUNTS名称中, SASUSER是一个Libref。你为libref分配了LIBNAME语句或操作系统控制语言。
会员
SAS数据库的SAS文件称为成员。
成员名字
SAS数据库的SAS文件的名称称为成员名称。
会员类型
成员类型标识SAS文件的信息类型。成员类型包括DATA, ACCESS, CATALOG, VIEW和PROGRAM。
价值缺失
SAS软件中的值缺失表示当前观测值的变量中没有存储的数据。默认情况下, SAS软件表示单个持续时间的缺失数字值, 而空白表示缺失的字符值。
观察
观察是SAS数据文件的水平组件。观察数据是与单个实体(例如客户)关联的值的集合。每个观察值都包含数据文件中每个变量的数据值。观察结果与PC文件中的行一致。
PROC SQL视图
PROC SQL视图是由PROC SQL创建的SAS数据集。之所以可以看到它, 是因为它是视图的一部分。 PROC SQL视图不包含任何数据。它仅用于存储从其基础文件读取数据值的查询表达式。基础文件包括SAS数据文件, SAS / ACCESS视图, 数据步骤视图或其他PROC-SQL视图。在执行时, PROC SQL视图的输出可以是超集, 也可以是一个或多个基础文件的子集。
记录
记录与SAS观察一致。
关系数据库管理系统(RDBMS)
关系数据库管理系统是一个数据库, 用于根据数据实体之间的关系来组织和访问数据。
SAS行
该行是PC文件的水平组件。每行对应于SAS观察值。
SAS数据文件
SAS数据文件是一种同时具有数据值和描述符信息的SAS数据集。 SAS数据文件与数据链接, 例如变量的属性。
SAS数据文件包括两种类型:本机SAS数据文件和第二个接口SAS数据文件。
本机SAS数据文件
将数据值和描述符信息存储在SAS格式化的文件中。
接口SAS数据文件
接口SAS数据文件用于将数据存储在由SAS软件以外的软件格式化的文件中。 SAS软件引擎从由其他软件(例如DB2, Oracle, Sybase, ODBC, BMDP, OSIRIS和SPSS)格式化的文件中读取和写入数据。
这些格式化的文件被视为接口SAS数据文件, 并且当引擎访问其数据值时, SAS会将其识别为SAS数据集。
- SAS数据文件包含成员类型数据。
- 在SAS软件中, PROC SQL表被视为SAS数据文件。
- 在先前版本的SAS软件中, 所有SAS数据集都是SAS数据文件。
“客户站点许可协议始终确定引擎是否可以访问不同类型的接口数据文件。要查看引擎的可用性, 请咨询系统管理员。”
SAS资料库
SAS数据库是SAS软件识别的一个或多个SAS文件的集合, 可以作为一个单元进行引用和存储。每个文件都是库的重要组成部分, 并被视为成员。
SAS数据库可帮助你组织工作。例如, 如果一个SAS程序使用多个SAS文件, 则可以将所有文件保留在一个库中。在库中组织文件使查找文件和在程序中引用它们变得容易。
在大多数操作环境下, SAS数据库高度匹配该操作环境用于组织文件的组织级别。例如, 在基于目录的操作环境中, SAS数据库是同一目录中的一组SAS文件。该目录可能包含其他文件, 但是只有SAS文件才被视为SAS数据库的一部分。
有关操作环境的信息:
在CMS操作环境下, SAS数据库是相同类型文件的集合。在Z / OS操作环境下, SAS数据库是一种特殊格式的z / OS数据集。这样的数据集只能包含SAS文件。
SAS数据集
SAS数据集是存储在SAS库中的SAS文件。它是由SAS软件创建和处理的。 SAS数据集包含以观察表(行)和变量(列)表的形式排列的数据值, 可以通过SAS软件对其进行处理。 SAS数据集还包含描述性信息, 例如数据类型和变量的长度, 以及用于创建数据的引擎。 SAS数据集可以是SAS数据和SAS视图之一。
SAS数据
SAS数据包含描述符信息和数据。 SAS数据的成员类型是文件。
SAS资料检视
SAS View是一种SAS数据集, 可从其他文件中检索数据值。 SAS视图仅包含描述符信息, 例如数据类型和变量(列)的长度。它还包括从其他SAS数据集或其他软件供应商的文件格式中存储的文件中获取数据值所需的其他信息。 SAS数据视图是VIEW的类型之一。如果SAS视图包含SAS数据文件的属性, 则可以使用该视图。
SAS视图有两种类型:
本机视图
本机视图是使用PROC SQL或DATA步骤创建的SAS视图。
界面视图
接口视图是使用SAS / ACCESS软件制作的SAS视图。接口视图用于从数据库管理系统(DBMS)(例如Oracle或DB2)读取数据或将数据写入其中。接口视图可以称为SAS / ACCESS视图。必须拥有SAS / ACCESS软件许可才能使用它。
结构化查询语言(SQL)
SQL是一种高级查询语言, 用于创建和处理关系数据库管理系统的数据。 SAS软件使用SQL过程在数据库中实现数据对象。
表别名
表别名是FROM部分中指定的表的临时替代名称。当我们加入表时, 我们交替使用表别名来获得列名。
查表
查表是一种处理技术, 其中, 根据主源中变量的值从辅助源中获取信息。
变量
变量是SAS数据集中的一列和一组数据值, 这些数据值描述了所有观测值中给出的属性。在访问过程中, 将从PC文件或字段的列中创建变量。
目标变量
目标变量是在其中分配函数或表达式的结果的变量。
评论前必须登录!
注册