R 통계
-
[R기초] apply 계열 함수의 활용법R 통계/R 기초 2021. 9. 17. 08:00
지난번 포스팅에서 split과 sapply를 통해 집단별 기술 통계 값(평균 등)을 알아본 바 있다. 이번 포스팅에서는 apply 계열(apply family)의 함수들 (apply, lapply, sapply, mapply, tapply)의 사용 문법을 알아본다. 0. apply와 유사한 기능을 하는 colMean() 과 RowMean() 함수 - colMean() : 변수의 열 방향 평균 값을 계산해줌 - colMean() : 변수의 행 방향 평균 값을 계산해줌 *합산 값을 산출해주는 colSums와 rowSums도 있다. #임의 데이터 생성 gender
-
[R기초] subset 함수를 활용해 원하는 데이터만 선택하자R 통계/R 기초 2021. 9. 14. 08:00
subset 함수는 데이터 프레임에서 분석에 활용할 데이터만 선택할 때 유용하다. subset(데이터명, select = c("변수1," "변수2", ... , "변수n") 의 형태로 column을 선택할 수 있고, subset 내에 다시 subset을 통해, 특정 범위의 변수 값을 가진 데이터만 선택(혹은 제외) 할 수 있다. subset(데이터명, subset = (변수명(height) >= 170 & 변수명(weight)
-
[R기초] 데이터 단위 위계 한 방 정리(스칼라, 벡터, 요인, 행렬, 배열, 데이터프레임, 리스트)R 통계/R 기초 2021. 9. 11. 07:22
R에서 사용되는 데이터 형태가 다양했지만, 머릿속에 혼재되어있었다. 개별적인 의미를 정리한 블로그는 많았지만, 이들을 구조화하고 차이를 발힌 글은 잘 보지 못했다. 각각의 내용의 차이점을 요약하면 다음과 같았다. 요약 > 각 데이터 단위의 위계를 정리하면 다음과 같다. 1. 스칼라 (Scalar) > 하나의 값으로 대부분 언어에서의 가장 최소 단위 > 통계 분석이 목적인 R에서는 스칼라 개념을 사용하지 않으며, 벡터를 최소단위로 계산한다. > 아래의 예시에서, 1이라는 하나의 Scalar) 값도 R에서는 하나의 벡터(Vector)로 인식함을 알 수 있다. is(1) [1] "numeric" "vector" 2. 벡터 (Vetcor) > R에서 사용되는 기본 단위로, 1차원 자료구조로, 동일한 자료형으로 ..
-
[R 기초] 데이터의 형태 (Character, Numeric, Integer, Complex, Logical)R 통계/R 기초 2021. 9. 10. 22:32
처음 연구방법론를 학습하며, 변수의 척도에 관해 학습한 기억이 있다. 명목척도 양적 의미가 없으며, 범주 구분에 사용되는 척도 ex) 남, 여 서열척도 양적 의미는 없으나, 구분 간 서열이 존재하는 척도 ex) A+, A, B+, B, C+, C 등각척도 데이터간 간격이 동일하나, 절대 0이 존재하지 않아, 더하거나 뺄 수 있으나, 나누거나 곱할 수 없는 척도 ex) 섭씨 10도, 20도, 20도가 10도에 비해 2배 더 덥다고 말할 수 없다 비율척도 절대 0이 존재하는 데이터로 모든 연산이 가능하다 ex) 170cm, 65kg R도 비슷하게 변수 내 데이터의 형태를 구분하고 있으며, 데이터의 형태에 따라 적용 가능한 연산이 다르다. 1. Character(문자형) > 수치가 아닌 문자로 명목척도로서 구..