본문 바로가기
Programing/R

[R] dplyr 라이브러리를 이용한 데이터 가공

by 구루미94 2021. 10. 10.

* 실습에서 사용한 gapminder 데이터.

gapminder.csv
0.08MB

* 아래의 실습은 Colab에서 진행하였습니다.

 

1. 샘플과 속성의 추출

1) select 함수 사용

- 열을 지정할 때 $ 기호나 " " 없이 열 이름 그대로 사용할 수 있다.

 

2) filter 함수 사용

- 조건식을 사용한다는 점에서 베이스 R과 비슷하지만,

함수 내에서 인덱싱을 위해 데이터 프레임의 이름을 매번 입력하지 않아도 된다.

 

2. 행/ 열 단위의 연산

- group_by 함수를 사용해 데이터 프레임에 포함된 범주형 속성을 활용해 전체 데이터를 그룹으로 분류한다.

- 보통 summarize 함수를 같이 사용해 통계 지표를 산출한다.

 

3. %>%  연산자를 사용한 연속 처리

- 파이프 연산자는 앞의 명령어를 처리한 결과를 다음 명령어로 전달하는 역할을 한다.

728x90

'Programing > R' 카테고리의 다른 글

[R] 모델링을 위한 가공  (0) 2021.10.18
[R] 방대한 데이터 요약  (0) 2021.10.11
[R] 베이스 R을 이용한 데이터 가공  (0) 2021.10.10
[R] 이상값 처리  (0) 2021.10.10
[R] 결측값 처리  (0) 2021.10.10

댓글