-
R 다변량 통계 분석 - 5. 프로파일 분석, 다변량 정규성 검정, Profile Analysis, Multivariate NormalR + Statsitic (통계학) 2020. 7. 1. 17:36
아래 내용은 <R과 함께하는 다변량 자료분석을 위한 추정과 검정, 최용석 지음, 2019>에서 대부분 발췌하였습니다
다변량 통계 분석에서 정규성 검정, 시각화 방법 등에 필요한 라이브러리 입니다
library(MVT)
library(MVN)
library(dplyr)library(profileR)
#### 두 집단(Group 1, Group 2)에 대한 공변량을 제외한 MANOVA의 결과를 요약하라
실습에 사용할 데이터를 불러오겠습니다
stu <- read.table("student.txt", header = TRUE)
stu <- stu %>% data.frame()
stu$Group <- stu$Group %>% factor()
stu %>% head()student 데이터는 공변량으로 5개영역(N,S,NS,NA,SS)와 표준화 검사(PPVT, RPMT, SAT)로 구성되어 있습니다
바로 공변량을 MANOVA 결과를 뽑아보도록 하겠습니다
가장 많이 사용하는 검정방법인 "Wilks", "Pillai", "Hotelling-Lawley", "Roy" 모두 사용해봅시다
stu_lm <- lm(cbind(PPVT, RPMT, SAT) ~ Group, stu) # Group : 반응변수 / PPVT, RPMT, SAT : 설명변수인 선형모형입니다
stu_manova <- stu_lm %>% Manova()
stu_manova %>% summary()Sum of squares and products for error,
Sum of squares and products for the hypothesis도 살펴볼 수 있습니다
MANOVA의 결과 값은 모두 H0기각입니다. 그러므로 그룹간의 차이는 존재합니다
(H0 : μ1 = μ2 = μ3, μ는 반응변수 Group의 평균벡터)
### 프로파일 분석을 실시하고, 프로파일 그림을 통해 두 집단의 프로파일의 평행성, 일치성, 수준성을 검토하라
프로파일 분석은(Profile Analysis, PA)은 두 집단 이상에서 p개의 처리에 의해 구성된 평균벡터 μj = t(μj1, ... ,μjp), j =1, ... ,g에 대해 다양한 관계를 살펴보는데 관심이 있는 분석방법입니다
(Johnson과 Wichern, 2007, 6.8절; Srivastava, 2002, 7장; Rencher, 1995, 5.0절)
여기서 다양한 관계라는 것은 평행성(parallel), 일치성(flat), 수준성(equal levels)입니다
프로파일 분석은 범죄자를 추려내는 프로파일링(Profiling, 어떤 개인의 심리적, 행동적 특성을 분석함으로써 특정 상황이나 영역에서의 행동을 예상하는 것)의 프로파일이 맞습니다
확보한 증거와 정보를 바탕으로 용의자를 정량적으로 추려내는데 사용하기도 합니다
텍스트 북에서는
1단계 : 평행성(parallel) 검정
2단계 : 일치성(flat) 검정
3단계 : 수준성(equal levels) 검정
3단계로 프로파일을 검정합니다만 다른 문헌에서는
1단계 : 평행성(parallel) 검정
2단계 : 수준성(equal levels) 검정
3단계 : 일치성(flat) 검정
3단계로 하기도 하며, 단계를 따지지 않은 경우도 있는 것 같습니다
단계를 고려하지 않고도 각각의 관계의 결과 자체는 얻어낼 수 있기 때문일지도 모르겠습니다
우리가 사용할 library(profileR)는 평행성(parallel), 수준성(equal levels), 일치성(flat) 순서로 결과를 줍니다이번에는 공변량(N,S,NS,NA,SS)까지 고려하여 프로파일 분석을 해봅시다
stu_pa1 <- stu %>% select(c("NS", "NA.", "PPVT", "RPMT", "SAT"))
stu_pa2 <- stu %>% select(c("Group"))
stu_pa2 <- stu_pa2$Group %>% factor()
stu_pa <- pbg(data=stu_pa1, group=stu_pa2, original.names=TRUE, profile.plot=TRUE) # 프로파일 분석과 plot을 뽑습니다육안으로 봤을때 어느정도 두 그룹이 유사해보이긴 합니다만 과연 그러한지 결과값을 보겠습니다
stu_pa$profile.test # Ho: Profiles are parallel(평행성)
Wilks, Pillai, Hotelling-Lawley, Roy 방법 모두 영가설(H0) : Profiles are parallel(평행성)을 기각합니다. 그러므로 그룹 간의 프로파일이 유사하지 않습니다
# Ho: Profiles are flat(일치성)
영가설(H0) : Profiles are flat(일치성)을 기각합니다. 그러므로 그룹 간의 프로파일이 유사하지 않습니다
# Ho: Profiles have equal levels(수준성)
영가설(H0) : Profiles have equal levels(수준성)을 기각합니다. 그러므로 그룹 간의 프로파일이 유사하지 않습니다
MANOVA와 프로파일 분석(Profile Analysis)의 결과값을 조합하면
두 그룹(Group 1, Group 2)은 다르다고 결론 지을 수 있겠습니다
'R + Statsitic (통계학)' 카테고리의 다른 글