* 실습에서 사용한 gapminder 데이터.
* 아래의 실습은 Colab에서 진행하였습니다.
1. 샘플과 속성의 추출
1) select 함수 사용
- 열을 지정할 때 $ 기호나 " " 없이 열 이름 그대로 사용할 수 있다.
2) filter 함수 사용
- 조건식을 사용한다는 점에서 베이스 R과 비슷하지만,
함수 내에서 인덱싱을 위해 데이터 프레임의 이름을 매번 입력하지 않아도 된다.
2. 행/ 열 단위의 연산
- group_by 함수를 사용해 데이터 프레임에 포함된 범주형 속성을 활용해 전체 데이터를 그룹으로 분류한다.
- 보통 summarize 함수를 같이 사용해 통계 지표를 산출한다.
3. %>% 연산자를 사용한 연속 처리
- 파이프 연산자는 앞의 명령어를 처리한 결과를 다음 명령어로 전달하는 역할을 한다.
728x90
'Programing > R' 카테고리의 다른 글
[R] 모델링을 위한 가공 (0) | 2021.10.18 |
---|---|
[R] 방대한 데이터 요약 (0) | 2021.10.11 |
[R] 베이스 R을 이용한 데이터 가공 (0) | 2021.10.10 |
[R] 이상값 처리 (0) | 2021.10.10 |
[R] 결측값 처리 (0) | 2021.10.10 |
댓글