[R 기초] 데이터의 형태 (Character, Numeric, Integer, Complex, Logical)

R 통계/R 기초

캐 2021. 9. 10. 22:32

728x90

처음 연구방법론를 학습하며, 변수의 척도에 관해 학습한 기억이 있다.

<연구방법론 4가지 척도>

명목척도	양적 의미가 없으며, 범주 구분에 사용되는 척도	ex) 남, 여
서열척도	양적 의미는 없으나, 구분 간 서열이 존재하는 척도	ex) A+, A, B+, B, C+, C
등각척도	데이터간 간격이 동일하나, 절대 0이 존재하지 않아, 더하거나 뺄 수 있으나, 나누거나 곱할 수 없는 척도	ex) 섭씨 10도, 20도, 20도가 10도에 비해 2배 더 덥다고 말할 수 없다
비율척도	절대 0이 존재하는 데이터로 모든 연산이 가능하다	ex) 170cm, 65kg

R도 비슷하게 변수 내 데이터의 형태를 구분하고 있으며, 데이터의 형태에 따라 적용 가능한 연산이 다르다.

1. Character(문자형)

> 수치가 아닌 문자로 명목척도로서 구분의 역할만 가능하며, 연산이 불가하다.

> 문자형과 다른 자료형(정수형, 소수형, 논리형) 이 혼합되면, 모두 문자형으로 변환된다.

<입력1>
A <- c("남", "여", "여", "여", "남", "남")
class(A)

<결과1>
[1] "character"


<입력2>
B <- c("남", "여", 1, 2, T)
class(B)

<결과2>
[1] "character"

2. Numeric(수치형_소숫점 포함)

> 소수를 포함한 전반적인 숫자형태

> 논리값 역시 수치형과 함께 사용되면 수치형으로 변환되며, TRUE는 1, FALSE는 0으로 변환된다

<입력1>
C <- c(1, 2, 3, 4, 5)
class(C)

<출력1>
[1] "numeric"


<입력2>
D <- c(1, 2, 3, TRUE)
str(D)
class(D)

<출력2>
num [1:4] 1 2 3 1
[1] "numeric"

3. Integer(정수형)

> 소숫점을 포함하지 않은 정수(1, 2, 3...)의 자료형태

> numeric에 비해 연산의 속도가 빠르며, 작은 데이터상에서는 차이를 느낄 수 없으나,

데이터의 양이 많아지면, 연산속도의 차이가 크다고 한다.

<입력>
D <- as.integer(c(1, 2, 3, 4, 5))
class(D)

<출력>
[1] "integer"

4. Complex(복소수형)

> 허수(복소수) i를 포함한 한 자료 형태

<입력>
E = 1 + 2i
class(E)

<출력>
[1] "complex"

5. Logical(논리형)

> 분석결과의 참/거짓을 판단하는 자료형으로 이진형(False:0 / True:1) 형태로 되어있다.
> 향후 조건문과 반복문 사용시 자주 활용되게 된다.

<입력>
G <- c(TRUE, FALSE)
class(G)

<출력>
[1] "logical"

728x90