R 통계/R 기초
[R 기초] 데이터의 형태 (Character, Numeric, Integer, Complex, Logical)
캐
2021. 9. 10. 22:32
728x90
처음 연구방법론를 학습하며, 변수의 척도에 관해 학습한 기억이 있다.
<연구방법론 4가지 척도>
명목척도 | 양적 의미가 없으며, 범주 구분에 사용되는 척도 | ex) 남, 여 |
서열척도 | 양적 의미는 없으나, 구분 간 서열이 존재하는 척도 | ex) A+, A, B+, B, C+, C |
등각척도 | 데이터간 간격이 동일하나, 절대 0이 존재하지 않아, 더하거나 뺄 수 있으나, 나누거나 곱할 수 없는 척도 |
ex) 섭씨 10도, 20도, 20도가 10도에 비해 2배 더 덥다고 말할 수 없다 |
비율척도 | 절대 0이 존재하는 데이터로 모든 연산이 가능하다 | ex) 170cm, 65kg |
R도 비슷하게 변수 내 데이터의 형태를 구분하고 있으며, 데이터의 형태에 따라 적용 가능한 연산이 다르다.
1. Character(문자형)
> 수치가 아닌 문자로 명목척도로서 구분의 역할만 가능하며, 연산이 불가하다.
> 문자형과 다른 자료형(정수형, 소수형, 논리형) 이 혼합되면, 모두 문자형으로 변환된다.
<입력1>
A <- c("남", "여", "여", "여", "남", "남")
class(A)
<결과1>
[1] "character"
<입력2>
B <- c("남", "여", 1, 2, T)
class(B)
<결과2>
[1] "character"
2. Numeric(수치형_소숫점 포함)
> 소수를 포함한 전반적인 숫자형태
> 논리값 역시 수치형과 함께 사용되면 수치형으로 변환되며, TRUE는 1, FALSE는 0으로 변환된다
<입력1>
C <- c(1, 2, 3, 4, 5)
class(C)
<출력1>
[1] "numeric"
<입력2>
D <- c(1, 2, 3, TRUE)
str(D)
class(D)
<출력2>
num [1:4] 1 2 3 1
[1] "numeric"
3. Integer(정수형)
> 소숫점을 포함하지 않은 정수(1, 2, 3...)의 자료형태
> numeric에 비해 연산의 속도가 빠르며, 작은 데이터상에서는 차이를 느낄 수 없으나,
데이터의 양이 많아지면, 연산속도의 차이가 크다고 한다.
<입력>
D <- as.integer(c(1, 2, 3, 4, 5))
class(D)
<출력>
[1] "integer"
4. Complex(복소수형)
> 허수(복소수) i를 포함한 한 자료 형태
<입력>
E = 1 + 2i
class(E)
<출력>
[1] "complex"
5. Logical(논리형)
> 분석결과의 참/거짓을 판단하는 자료형으로 이진형(False:0 / True:1) 형태로 되어있다.
> 향후 조건문과 반복문 사용시 자주 활용되게 된다.
<입력>
G <- c(TRUE, FALSE)
class(G)
<출력>
[1] "logical"
참고자료: http://www.r-tutor.com/r-introduction/basic-data-types
728x90