R에는 데이터를 크게 3가지 유형으로 나눈다.
숫자형, 문자형, 논리형
오늘은 이 3가지 유형에 대해 알아보자.
1. 숫자형(Numeric) 데이터
숫자형, 수치형이라고 부르는 이 유형은 말그대로 숫자 데이터를 R에서 저장할때 쓰는 용어이다.
앞서 할당 연산자를 배웠기 때문에 a와 b라는 변수(Object)를 만들어 보자.
# 1. 숫자형(Numeric) 데이터
# 정수형(integer)과 실수형(double)
a <- 10 # 정수형 데이터 할당
b <- 10.2 # 실수형 데이터 할당
a라는 변수에 10이라는 숫자를 할당했다. 그리고 b라는 변수에는 10.2라는 숫자를 할당했다.
이렇게 R에서 a와 b라는 변수는 이제 숫자형 데이터가 할당이 된 것이다. 숫자형 데이터를 할당할 때는 따옴표(') 없이 그냥 숫자만 할당하면 된다. 여기서 a와 b 변수의 차이는 하나는 정수형이고 하나는 실수형이라는 것이다.
우리는 정수형과 실수형의 차이를 이미 알고 있으니 넘어가자.
2. 문자형(Character) 데이터
문자형 데이터는 숫자형과 다르게 따옴표(') 혹은 쌍따옴표(") 사이에 영문자 혹은 한글 문자를 입력해서 할당하면 된다.
# 2. 문자형(Character) 데이터
d <- "BTS is WorldClass!" # 영어 문자도 할당 가능
e <- "BTS는 월드클래스이다!" # 한글 문자도 할당 가능
d와 e라는 변수에 각각 문자형(Character) 데이터를 할당해 보았다. 따옴표나 쌍따옴표 둘다 써도 된다. 따옴표 안에
있는 문자 전체를 하나의 문자형 데이터로 인식한다는 것만 알고 가자.
3. 논리형(Logical) 데이터
논리형 데이터는 지난 포스팅에서 '논리 연산자'를 할때 잠깐 등장했다. 바로 TRUE(T)와 FALSE(F)로 된 데이터이다.
R에서 진실을 말하고 있다면 TRUE로 출력을 거짓을 말하고 있다면 FALSE를 출력할 것이다.
# 3. 논리형(Logical) 데이터
# TRUE, FALSE
f <- TRUE # T로 대체 가능
g <- FALSE # F로 대체 가능
R에서 TRUE를 T로 쓰기도하고 FALSE를 F로 쓰기도 한다. R Studio를 쓴다면 TRUE와 FALSE라는 논리형 데이터는 색이 오묘하게 다를테니 문자열형 데이터와 헷갈릴 필요 없다. 물론 문자형 데이터는 따옴표 안에 있다.
4. 문자형과 숫자형, 논리형을 같이 쓰면 어떤 데이터로 할당될까?
사실 오늘 포스팅은 이 부분이 가장 중요하다고 생각한다. c() 함수를 통해 문자형과 숫자형 그리고 논리형을 같이 할당한다면 R은 어떻게 인식을 할까?
# 4. 숫자형, 문자형, 논리형 어느 것이 우선일까?
h <- c("BTS", 3, T)
h
i <- c(3, T)
i
h는 과연 문자형으로 할당될까? 숫자형으로 할당될까? 아니면 논리형으로 할당될까?
h는 문자형("")으로 할당되었다.
즉 R에서는 문자형과 숫자형, 논리형 데이터를 한번에 할당을 하면 문자형으로 인식한다.
나중에 데이터를 불러왔는데 숫자와 문자가 섞여 있는 열이 있다면 R에서는 문자형으로 인식할 것이다.
만약에 숫자형과 논리형 두 유형의 값을 할당한다면? 정답은 숫자형이다.
R에서는 논리형 데이터인 T를 1로 F를 0으로 인식한다.
R에서는 문자형이 왕이다. (문자형 > 숫자형 > 논리형 우선순위)
오늘의 포스팅 끝.
'R 문법' 카테고리의 다른 글
[R 문법] R에서 csv 파일 여러개 한번에 불러오기 (0) | 2022.03.15 |
---|---|
R에서 문자형 데이터를 숫자형으로 바꾸는 방법(is.numeric, is.character, mode, as.numeric 함수) (0) | 2021.12.07 |
R에서 가능한 4개의 기본 연산자(계산, 할당, 논리, 비교 연산자) (0) | 2021.12.03 |