R + Statsitic (통계학)
-
R 다변량 통계 분석 - 5. 프로파일 분석, 다변량 정규성 검정, Profile Analysis, Multivariate NormalR + Statsitic (통계학) 2020. 7. 1. 17:36
아래 내용은 에서 대부분 발췌하였습니다 다변량 통계 분석에서 정규성 검정, 시각화 방법 등에 필요한 라이브러리 입니다 library(MVT) library(MVN) library(dplyr) library(profileR) #### 두 집단(Group 1, Group 2)에 대한 공변량을 제외한 MANOVA의 결과를 요약하라 실습에 사용할 데이터를 불러오겠습니다 stu % head() student 데이터는 공변량으로 5개영역(N,S,NS,NA,SS)와 표준화 검사(PPVT, RPMT, SAT)로 구성되어 있습니다 바로 공변량을 MANOVA 결과를 뽑아보도록 하겠습니다 가장 많이 사용하는 검정방법인 "Wilks", "Pillai", "Hotelling-Lawley", "Roy" 모두 사용해봅시다 stu_..
-
R 교차분석(crosstable) p-value 추출 설문지 데이터R + Statsitic (통계학) 2020. 5. 12. 22:13
교차분석은 검증하고자 하는 변수가 모두 범주형자료(categorical data) 일 때, 두 변수 간 연관성을 판단하는 분석입니다 설문지 데이터를 분석하는데 있어 가장 널리 쓰이며, 유의한 변수를 가려낼 때 가장 먼저 배우는 분석 기법이 아닐까 싶습니다 교차분석의 정의와 원리는 다른 자료가 많기에 굳이 설명드리지 않겠습니다 다만, 설문지 데이터를 다루게 되면 교차분석 굉장히 많이 해야하는 경우가 발생합니다 설문지의 질문이 많아질 경우 관심있는 변수(종속변수)에 영향을 주는 변수(독립변수)를 하나하나 가려내야하는 경우가 발생합니다 이럴 경우 SPSS나 엑셀로 하나씩 P-value를 확인하려면 시간이 어마어마하게 걸립니다 이를 대처하는 R코드를 소개하겠습니다 사회과학을 공부하시거나 설문지 데이터를 다루는 ..
-
R 다변량 통계 분석 - 4. 다변량 정규성 검정, 상관계수, 직선성, 주성분 분석, 주성분 정규성, correlation, qqplot, Principal component analysis, PCA, screeplot, biplotR + Statsitic (통계학) 2020. 4. 29. 17:58
아래 내용은 에서 대부분 발췌하였습니다 다변량 통계 분석에서 정규성 검정, 시각화 방법 등에 필요한 라이브러리 입니다 library(MVT) library(MVN) library(dplyr) library(car) library(multifluo) library(chemometrics) library(DMwR) library(tidyr) library(data.table) library(corrplot) library(factoextra) library(FactoMineR) #### Q-Q plot의 직선성을 상관계수로 검토하라 ### 일변량 데이터 상관계수 일변량 데이터는 cor()함수와 qqnorm()함수로 상관계수를 구하여 직선성을 구할 수 있습니다 실습에 사용할 데이터를 불러오겠습니다 klpga
-
R 다변량 통계 분석 - 3. 다변량 정규성 이상치 검토(outlier) classical Mahalanobis distance, robust Mahalanobis distance, Local Outlier Factors, 이상치 제거 (outlier cut-off)R + Statsitic (통계학) 2020. 4. 28. 20:23
아래 내용은 에서 대부분 발췌하였습니다 다변량 통계 분석에서 정규성 검정, 시각화 방법 등에 필요한 라이브러리 입니다 library(MVT) library(MVN) library(dplyr) library(car) library(multifluo) library(chemometrics) library(DMwR) #### 다변량 정규성에 영향을 미치는 이상치 검토하기 ### 마할라노비스 거리(mahalanobis distance)로 이상치 구하기 마할라노비스 거리로 examScor 데이터의 이상치를 구해보겠습니다 library(chemometrics)를 불러옵니다 이야기 전개를 쉽게하기 위해 두 개념을 살펴보고 가겠습니다 # 마할라노비스 거리(Mahalanobis distance) https://en.wi..
-
R 다변량 통계 분석 - 2. 이변량 정규분포, 다변량 정규성, qqplotR + Statsitic (통계학) 2020. 4. 27. 11:39
아래 내용은 에서 대부분 발췌하였습니다 다변량 통계 분석에서 정규성 검정, 시각화 방법 등에 필요한 라이브러리 입니다 library(MVT) library(MVN) library(dplyr) library(car) library(multifluo) #### 데이터 불러오기 examScor 데이터를 불러옵니다 원활한 분석을 위해 결측치를 제거하고 데이터 형태와 요약 정보를 확인해봅시다 data(examScor) examScor % na.omit() examScor %>% head() examScor %>% summary() examScor data에 대한 설명을 잠깐 하겠습니다 examScor는 학생 88명을 대상으로 두 가지 방식(open-book, closed-book)에 따라 치른 다섯 과목 mech..
-
R 다변량 통계 분석 - 1. 일변량 정규성 검정(Normality Test) Q-Q plot, qqplotr, Kolmogorov-Smirnov test, Shapiro-Wilk testR + Statsitic (통계학) 2020. 4. 17. 10:51
아래 내용은 에서 대부분 발췌하였습니다 다변량 통계 분석에서 정규성 검정, 시각화 방법 등에 필요한 라이브러리 입니다 library(MVT) library(MVN) library(dplyr) library(car) library(multifluo) #### 데이터 불러오기 examScor 데이터를 불러옵니다 원활한 분석을 위해 결측치를 제거하고 데이터 형태와 요약 정보를 확인해봅시다 data(examScor) examScor % na.omit() examScor %>% head() examScor %>% summary() #### 각 과목별 일변량 정규성 검정 과목별로 데이터 프레임을 분리합시다 메카 % select(mechanics) 벡터 % select(vectors) 대수 % select(algeb..