본문 바로가기
Programing/R

[R] ggplot2 라이브러리를 이용한 데이터 시각화

by 구루미94 2021. 10. 22.

1. aes 함수

- 플롯의 가로축과 세로축에 대응될 데이터의 항목을 지정한다.

- 데이터 프레임 형식의 데이터를 시각화할 때 데이터 프레임의 이름을 반복 사용하지 않아도 되므로 명령어가 간결하다.

- aes 내부에서 col이나 size 옵션을 활용해 플롯의 색상이나 마커의 크기 등을 속성에 대응시킬 수 있다.

- 막대그래프를 그리고자 할 때는 geom_histogram 혹은 geom_bar 함수의 내부에 stat="identity" (데이터 프레임의 값을 그대로 사용해서 그래프를 그리라는 뜻)을 선택 인자로 전달해야 한다.

 

2. geom_point 함수

- 데이터를 점으로 표시하는 플롯을 그린다.

- 내부에서 alpha 옵션을 통해 점의 불투명도(투명 0.0 ~ 불투명 1.0)를 설정할 수 있다.

- geom_point 외에도 아래와 같은 함수들을 사용할 수 있다.

- geom_line: 데이터를 선으로 표시

- geom_bar: 데이터를 막대그래프로 표시. 별도의 설정이 없으면 분포를 자동으로 계산해서 geom_histogram과 동일하게 히스토그램을 그리기 때문에 히스토그램이 아닌 막대그래프, 즉 aes 함수에 x, y가 모두 지정된 그래프를 그리려면 stat="identity" 옵션을 지정한다.

- geom_histogram: 히스토그램 전용의 플롯 함수. 데이터가 그룹으로 구분되어 있는 경우 기본 옵션을 position = "stak"으로 막대를 위로 쌓아 올리도록 되어 있다. 막대를 나란히 옆으로 표시하려면 position = "dodge" 옵션을 지정한다.

 

3. geom_boxplot 함수

- 여러 항목의 분포를 한꺼번에 관찰하는 함수

- 이상값을 파악하는데 유용

 

4. scale_x_log10, scale_y_log10 함수

- 데이터에 직접 로그를 취하지 않고도 축의 스케일을 바꾸어 동일한 효과를 얻을 수 있다.

 

5. coord_flip 함수

- 축의 눈금에 표시될 문자열이 길어 서로 겹쳐서 안 보이는 경우, 플롯의 방향을 전환함으로 해결한다.

- x축이 세로로, y축이 가로로 놓여진다.

 

6. scale_fill_brewer 함수

- aes 함수 내부에 col 옵션을 이용해 플롯의 색상을 그룹마다 다르게 지정할 때, 다양한 조합의 색상 팔레트들 중에서 원하는 것을 선택하여 화면의 색상 팔레트를 변경할 수 있다.

- RColorBrewer 라이브러리를 함께 사용하면 R의 기본 색상 구성보다 훨씬 다양한 색상 팔레트 중에서 선택하여 사용할 수 있다.

728x90

댓글