GNI2014 데이터셋으로 트리맵 만들기(feat. treemap library)
데이터를 시각화할 때, 막대한 양의 정보를 한눈에 파악하는 것이 어렵지 않으셨나요? 특히, 국가별 경제 데이터를 다룰 때는 더더욱 그렇습니다. 이러한 문제를 해결하기 위해 트리맵 만들기를 사용해보는 건 어떨까요?
이번 포스트에서는 R의 treemap
라이브러리를 사용하여 GNI2014 데이터셋을 시각화하는 방법을 설명해드립니다. 데이터를 시각적으로 쉽게 이해할 수 있도록 트리맵 만들기 과정을 단계별로 설명하며, 각 국가의 GNI를 지역별로 비교하는 법을 배울 수 있습니다. 중요한 정보를 놓치지 않도록 끝까지 읽어주세요!
라이브러리 설치 및 불러오기
트리맵 시각화를 위해 우선 treemap
라이브러리를 설치하고 불러옵니다.
# 트리맵 라이브러리 설치
install.packages("treemap")
# 트리맵 라이브러리 불러오기
library(treemap)
GNI2014 데이터셋 준비
GNI2014 데이터셋은 treemap 라이브러리의 내장 데이터셋으로, 각 국가의 국민총소득(GNI)과 지역 정보를 포함하고 있습니다. 데이터셋에는 다음과 같은 변수들이 포함되어 있습니다:
Country
: 국가 이름Region
: 지역 이름Population
: 인구 수GNI
: 국민총소득 (Gross National Income)GNI_perCapita
: 1인당 국민총소득
이 데이터셋을 사용하여 트리맵을 생성할 것입니다.
# GNI2014 데이터셋 불러오기
data(GNI2014)
# 데이터 확인
head(GNI2014)
트리맵 만들기
이제 GNI2014 데이터셋을 이용하여 트리맵 만들기를 해보겠습니다. 각 국가의 GNI와 지역별로 그룹화하여 시각화합니다.
# 트리맵 생성
treemap(GNI2014,
index = c("continent", "country"),
vSize = "GNI",
vColor = "GNI",
type = "value",
title = "GNI2014 데이터셋 트리맵")
위의 코드에서 index
매개변수는 계층 구조를 정의하며, vSize
는 각 타일의 크기를, vColor
는 각 타일의 색상을 지정합니다. type
은 값에 따른 색상 매핑을 의미합니다. title
은 트리맵의 제목을 지정합니다.
트리맵 만들기 결과물 설명
소스코드를 실행하면 최종적으로 위와 같은 ‘2014년 국가별 국민총소득(GNI)을 나타내는 트리맵(Treemap)‘이 나타나는데 주요 특징은 다음과 같습니다.
- 크기: 각 국가를 나타내는 사각형의 크기는 해당 국가의 GNI 규모를 반영합니다. 큰 사각형일수록 GNI가 높습니다.
- 색상: 짙은 녹색에서 연한 녹색, 그리고 베이지색으로 변화하는 색상 스펙트럼은 GNI 수준을 나타냅니다. 짙은 녹색일수록 GNI가 높고, 연한 색상일수록 낮습니다.
- 지역 구분: 국가들은 대륙이나 지역별로 그룹화되어 있습니다. 예를 들어, Europe, Asia, North America 등의 구역이 명확히 구분되어 있습니다..
- 스케일: 하단의 색상 막대는 GNI 값의 범위를 나타내며, 0에서 1e+05(100,000) 이상까지 분포되어 있습니다.
이 시각화를 통해 한눈에 각 국가의 경제 규모와 상대적인 경제력을 비교할 수 있으며, 대륙별 경제 상황도 파악할 수 있습니다. 예를 들어, 유럽과 북미 지역의 국가들이 전반적으로 짙은 녹색을 띄고 있어 GNI가 높은 반면, 아프리카나 남미 지역 국가들은 상대적으로 연한 색상을 보이고 있어 GNI가 낮음을 알 수 있습니다.
추가 설명
버뮤다와 노르웨이가 진한 녹색으로 표시된 이유는 이 두 국가의 1인당 국민총소득(GNI)이 매우 높기 때문입니다. 이에 대해 좀 더 자세히 설명드리겠습니다.
- 버뮤다
- 버뮤다는 영국령 해외 영토로, 인구가 약 6만 명 정도인 작은 섬나라입니다.
- 주요 산업은 국제 금융과 관광업으로, 특히 조세 피난처로 유명합니다.
- 금융 서비스 산업이 매우 발달해 있어 1인당 소득이 높습니다.
- 인구가 적고 고부가가치 산업 중심이라 1인당 GNI가 매우 높게 나타납니다.
- 노르웨이
- 노르웨이는 북유럽의 선진국으로, 풍부한 천연자원을 보유하고 있습니다.
- 특히, 북해의 석유와 천연가스 자원이 국가 경제에 크게 기여합니다.
- 높은 수준의 사회 복지 제도와 함께 효율적인 자원 관리로 경제적 번영을 이루었습니다.
- 인구가 약 540만 명 정도로 상대적으로 적은 편이며, 석유 산업 등의 고부가가치 산업으로 1인당 GNI가 매우 높습니다.
이 두 국가가 진한 녹색으로 표시된 것은 단순히 총 GNI의 크기가 크다는 의미가 아니라, 인구 대비 GNI, 즉 1인당 GNI가 매우 높다는 것을 나타냅니다. 이는 해당 국가의 경제적 번영과 국민들의 높은 생활 수준을 반영하는 지표가 됩니다.
그러나 이러한 높은 1인당 GNI가 반드시 모든 국민의 균등한 부를 의미하지는 않으며, 각 국가의 특수한 경제 구조와 자원 분배 방식 등을 고려해야 한다는 점도 유의해야 합니다.
정리하기
트리맵은 데이터의 계층적 구조를 시각적으로 표현하는 강력한 도구입니다. treemap
라이브러리를 사용하면 GNI2014 데이터셋을 효과적으로 시각화할 수 있습니다. 이를 통해 각 국가와 지역의 GNI를 직관적으로 비교할 수 있습니다.
아래의 전체 소스코드를 활용해서 보유하고 계신 데이터를 이용, 트리맵 만들기를 해서 R을 이용한 시각화의 묘미를 느껴보시기 바랍니다.
전체 소스코드
# 트리맵 라이브러리 설치
install.packages("treemap")
# 트리맵 라이브러리 불러오기
library(treemap)
# GNI2014 데이터셋 불러오기
data(GNI2014)
# 데이터 확인
head(GNI2014)
# 트리맵 생성
treemap(GNI2014,
index = c("continent", "country"),
vSize = "GNI",
vColor = "GNI",
type = "value",
title = "GNI2014 데이터셋 트리맵")
한발짝 더 나가기
그런데 생성된 그래프가 조금 구식인 느낌이 듭니다. 아래와 같이 조금 더 트렌디하게 멋진 트리맵을 그릴 수 있지 않을까요? 어떻게 시각적으로 더 화려하게 그래프를 그려낼 수 있을까요? 궁금하시면 여기를 클릭해보시기 바랍니다.
추가 리소스
추가적으로 treemap 라이브러리 관련 정보를 더 알기 원하시는 분은 아래의 링크를 이용해보세요.