[R] dplyr 라이브러리를 이용한 데이터 가공 * 실습에서 사용한 gapminder 데이터. * 아래의 실습은 Colab에서 진행하였습니다. 1. 샘플과 속성의 추출 1) select 함수 사용 - 열을 지정할 때 $ 기호나 " " 없이 열 이름 그대로 사용할 수 있다. 2) filter 함수 사용 - 조건식을 사용한다는 점에서 베이스 R과 비슷하지만, 함수 내에서 인덱싱을 위해 데이터 프레임의 이름을 매번 입력하지 않아도 된다. 2. 행/ 열 단위의 연산 - group_by 함수를 사용해 데이터 프레임에 포함된 범주형 속성을 활용해 전체 데이터를 그룹으로 분류한다. - 보통 summarize 함수를 같이 사용해 통계 지표를 산출한다. 3. %>% 연산자를 사용한 연속 처리 - 파이프 연산자는 앞의 명령어를 처리한 결과를 다음 명령어로 전달하는 역할.. 2021. 10. 10. [R] 데이터 가공(목차) 목차 1. 베이스 R을 이용한 데이터 가공 https://haseulx-x.tistory.com/11 2. dplyr 라이브러리를 이용한 데이터 가공 https://haseulx-x.tistory.com/12 3. 데이터 가공의 실제 1) 방대한 데이터 요약 https://haseulx-x.tistory.com/19 2) 모델링을 위한 가공 https://haseulx-x.tistory.com/29 3) 데이터 구조 변경 https://haseulx-x.tistory.com/30 2021. 10. 10. 이전 1 다음