목차
1. PROC MEANS
•
PROC MEANS 프로시저: 숫자형 변수에 대한 기초통계량(평균, 중앙값, 백분위, 분산, 범위 등)을 계산하는데 사용되는 SAS 프로시저.
•
PROC MEANS의 일반적인 문법은 다음과 같다.
•
KEY-WARDS에는 원하는 통계량을 표기
•
PROC MEANS의 주요 옵션
◦
MAXDEX = n : 분석 결과를 인쇄할 때 사용될 최대 소수점의 자리수 n을 지정할 수 있음.
•
CLASS 문에서 설정된 변수의 값에 따라 VAR에 지정된 변수의 통계량이 출력됨.
•
VAR 문은 통계량을 산출할 변수를 표기
•
OUTPUT 문은 기초 통계량 산출 결과를 SAS 데이터 셋으로 저장해줌. new-data-name에는 새로 저장될 데이터 이름을 설정하고 그 뒤에는 저장하고자 하는 기초 통계량의 KEY-WARDS와 원하는 변수의 이름을 각각 설정함.
•
KEY-WARDS에 사용 가능한 기초 통계량 목록
키워드 | 기초 통계량 |
CSS | 수정제곱합 |
CV | 변동계수 |
KURTOSIS | 첨도 |
LCLM | 평균 신뢰구간 하한 |
MAX | 최대 |
MEAN | 평균 |
MIN | 최소 |
N | 표본의 크기 |
MEDIAN or P50 | 중앙값 |
P1 | 1 퍼센타일 |
P5 | 5 퍼센타일 |
P10 | 10 퍼센타일 |
P90 | 90 퍼센타일 |
P95 | 95 퍼센타일 |
P99 | 99 퍼센타일 |
Q1 or P25 | 일사분위수 |
Q3 or P75 | 삼사분위수 |
PROBT | 유의확률 |
RANGE | 범위 |
SKEWNESS | 왜도 |
STD or STDDEV | 표준편차 |
STDERR | 표준오차 |
SUM | 합 |
UCLM | 평균신뢰구간 상한 |
USS | 제곱합 |
VAR | 분산 |
QRANGE | IQR(inter-quantile range) |
T | 검정통계량 |
•
예시
PROC MEANS DATA=class N MEAN STD ;
CLASS gender;
VAR math ;
OUTPUT OUT=class_out N=nn MEAN=math_mean STD=math_std;
RUN;
Plain Text
복사
→ class 데이터에서 gender 별로 math에 대해 데이터의 개수, 평균, 표준편차를 구하고자 한다. 그리고 결과를 class_out이라는 이름으로 저장하고 데이터의 개수는 nn이라는 이름으로, 평균은 math_mean이라는 이름으로 표준편차는 math_std라는 이름으로 저장한다.