Search
Duplicate

PROCEDURE(PROC) Step

태그
목차

1. PROC MEANS

PROC MEANS 프로시저: 숫자형 변수에 대한 기초통계량(평균, 중앙값, 백분위, 분산, 범위 등)을 계산하는데 사용되는 SAS 프로시저.
PROC MEANS의 일반적인 문법은 다음과 같다.
KEY-WARDS에는 원하는 통계량을 표기
PROC MEANS의 주요 옵션
MAXDEX = n : 분석 결과를 인쇄할 때 사용될 최대 소수점의 자리수 n을 지정할 수 있음.
CLASS 문에서 설정된 변수의 값에 따라 VAR에 지정된 변수의 통계량이 출력됨.
VAR 문은 통계량을 산출할 변수를 표기
OUTPUT 문은 기초 통계량 산출 결과를 SAS 데이터 셋으로 저장해줌. new-data-name에는 새로 저장될 데이터 이름을 설정하고 그 뒤에는 저장하고자 하는 기초 통계량의 KEY-WARDS와 원하는 변수의 이름을 각각 설정함.
KEY-WARDS에 사용 가능한 기초 통계량 목록
키워드
기초 통계량
CSS
수정제곱합
CV
변동계수
KURTOSIS
첨도
LCLM
평균 신뢰구간 하한
MAX
최대
MEAN
평균
MIN
최소
N
표본의 크기
MEDIAN or P50
중앙값
P1
1 퍼센타일
P5
5 퍼센타일
P10
10 퍼센타일
P90
90 퍼센타일
P95
95 퍼센타일
P99
99 퍼센타일
Q1 or P25
일사분위수
Q3 or P75
삼사분위수
PROBT
유의확률
RANGE
범위
SKEWNESS
왜도
STD or STDDEV
표준편차
STDERR
표준오차
SUM
UCLM
평균신뢰구간 상한
USS
제곱합
VAR
분산
QRANGE
IQR(inter-quantile range)
T
검정통계량
예시
PROC MEANS DATA=class N MEAN STD ; CLASS gender; VAR math ; OUTPUT OUT=class_out N=nn MEAN=math_mean STD=math_std; RUN;
Plain Text
복사
→ class 데이터에서 gender 별로 math에 대해 데이터의 개수, 평균, 표준편차를 구하고자 한다. 그리고 결과를 class_out이라는 이름으로 저장하고 데이터의 개수는 nn이라는 이름으로, 평균은 math_mean이라는 이름으로 표준편차는 math_std라는 이름으로 저장한다.