2024년 전세계가 주목하는 빅 이벤트, 미국 대선 지지율 살펴보기 – R 코딩 시각화
미국 대선 지지율, 어디까지 믿을 수 있을까요? 예측이 엇갈리고, 경합주에서는 한치의 양보 없는 접전이 펼쳐지고 있어요. 이 뜨거운 선거에서 누가 승자가 될지 궁금하죠? 여기서는 전국 및 경합주별 여론조사 지지율을 함께 살펴보면서, R 코드로 데이터를 시각화해보는 방법도 알아볼 거예요. 미국 대선 시스템의 큰 그림과 함께 현재의 지지율 상황을 쏙쏙 이해할 수 있도록 준비했으니 끝까지 주목해 주세요!
미국 대선의 구조: 왜 경합주가 중요할까요?
미국 대선은 ‘선거인단 투표’ 방식으로, 단순한 전국 득표율로 대통령을 선출하지 않아요. 50개 주와 워싱턴 D.C.에는 각각 선거인단이 배정되어 있으며, 각 주의 인구 규모에 따라 선거인단 수가 달라집니다. 예를 들어, 캘리포니아는 가장 많은 55명의 선거인단을, 와이오밍은 단 3명의 선거인단을 보유하고 있어요. 각 주에서 다수 득표를 차지한 후보가 그 주의 모든 선거인단을 가져가는 방식(승자독식제)을 대부분 채택하고 있죠.
이 시스템은 큰 주뿐만 아니라 ‘경합주’라 불리는 특정 주의 결과가 매우 중요한 이유를 설명해줍니다. 경합주는 선거에서 자주 변동하는 주로, 이번 선거에서는 위스콘신, 네바다, 펜실베이니아 등이 여기에 속해 있어요. 전체 선거인단 중 270명을 확보하면 대통령으로 당선되기 때문에, 이런 주의 투표 결과가 선거의 향방을 크게 좌우하죠.
참고로 이번 선거의 7개 경합주의 선거인단 수는 다음과 같습니다. 이 경합주들의 선거인단을 합치면 총 93명으로, 대통령 당선에 필요한 270명의 선거인단 중 중요한 비중을 차지하고 있습니다.
경합주 | 선거인단 수(명) |
위스콘신 | 10 |
네바다 | 6 |
펜실베이니아 | 19 |
미시간 | 15 |
노스캐롤라이나 | 16 |
조지아 | 16 |
애리조나 | 11 |
경합주 지지율: 트럼프 vs. 해리스, 접전의 진실
경합주에서는 각 후보의 지지율이 아주 미세하게 엇갈리고 있어요. 예를 들어, 위스콘신에서는 해리스가 0.2% 우위를, 네바다에서는 트럼프가 0.2% 우위를 보이고 있죠. 각 주별 상황을 정리하면 다음과 같아요. 이 데이터는 선거 분석 사이트 538에서 가져왔습니다.
경합주 | 우세 후보 | 지지율 격차(%p) |
위스콘신 | 해리스 | 0.2 |
네바다 | 트럼프 | 0.2 |
펜실베이니아 | 트럼프 | 0.3 |
미시간 | 해리스 | 0.4 |
노스캐롤라이나 | 트럼프 | 1.3 |
조지아 | 트럼프 | 1.5 |
애리조나 | 트럼프 | 1.8 |
여론조사 오차와 현실의 차이, 무엇을 믿어야 하나요?
여론조사에는 항상 일정한 오차가 존재해요. 특히 미국 대선 지지율에서는 경합주의 오차 범위가 평균 3.4%p로 추정돼요. 이를 시각적으로 쉽게 이해할 수 있도록 R 코드를 사용하여 데이터를 시각화해 볼 거예요.
R 코드로 미국 대선 지지율 격차 시각화하기
이번에는 R 코드를 사용해 경합주 여론조사 데이터를 시각화해 볼게요. 이 코드는 각각의 경합주별로 지지율 격차와 오차 범위를 한눈에 볼 수 있게 해줍니다.
#필요한 패키지 로드
library(ggplot2)
#데이터 준비
data <- data.frame(
State = c("Wisconsin", "Nevada", "Pennsylvania", "Michigan",
"North Carolina", "Georgia", "Arizona"),
Margin = c(0.2, -0.2, -0.3, 0.4, -1.3, -1.5, -1.8), # 해리스(양수), 트럼프(음수)
Poll_Error = rep(3.4, 7) # 여론조사 오차 (3.4% 포인트)
)
#시각화
ggplot(data, aes(x = State, y = Margin, fill = Margin > 0)) +
geom_bar(stat = "identity", position = "dodge", color = "black", width = 0.7) +
geom_errorbar(aes(ymin = Margin - Poll_Error, ymax = Margin + Poll_Error), width = 0.2) +
scale_fill_manual(values = c("red", "blue"), labels = c("Trump 우세", "Harris 우세")) +
labs(title = "경합주 여론조사 격차와 오차 범위",
x = "주(State)", y = "지지율 격차 (%)") +
theme_minimal() +
theme(legend.position = "top") +
guides(fill = guide_legend(title = "우세 후보"))
라인별 코드 설명
- 패키지 로드: ggplot2 패키지를 불러옵니다. 이 패키지는 R에서 데이터를 시각화할 때 가장 많이 사용됩니다.
- 데이터 준비: 경합주의 이름과 지지율 격차, 그리고 여론조사 오차를 포함한 데이터를 생성합니다.
- 기본 그래프 구조 설정: ggplot()을 사용해 x축을 주(State), y축을 지지율 격차로 설정하고, 막대 색을 후보의 우세에 따라 구분합니다.
- 막대 그래프 추가: geom_bar()로 막대를 그려 후보별 지지율 격차를 표시합니다. fill = Margin > 0를 통해 해리스 우세는 파란색, 트럼프 우세는 빨간색으로 나타냅니다.
- 오차 범위 추가: geom_errorbar()로 각 경합주의 여론조사 오차 범위를 추가하여 실제 결과의 변동성을 반영합니다.
- 색상 설정: scale_fill_manual()을 사용해 트럼프와 해리스의 우세 색상을 지정합니다.
- 레이블과 제목 추가: labs()로 그래프 제목과 축 레이블을 설정하여 이해도를 높입니다.
- 테마 설정: theme_minimal()로 깔끔한 배경을 설정하고, 범례 위치를 상단으로 조정합니다.
왜 여론조사를 신뢰할 수 없는지: 과거 데이터의 교훈
여론조사는 중요한 정보원이지만, 실제 선거 결과와는 꽤 차이가 날 수 있어요. 대표적인 사례가 바로 2016년과 2020년 미국 대선입니다. 2016년 대선에서 여론조사들은 대부분 힐러리 클린턴의 승리를 예측했지만, 결국 도널드 트럼프가 승리했죠. 경합주에서 특히 큰 오차가 있었어요. 여론조사는 트럼프의 핵심 지지층(낮은 학력을 가진 백인 노동자 등)을 충분히 반영하지 못해 예상보다 더 많은 지지를 받은 겁니다.
2020년에도 마찬가지였어요. 조 바이든이 이길 것이라는 예측은 맞았지만, 경합주의 득표 격차는 예상보다 훨씬 좁았어요. 이때도 샤이 트럼프(여론조사에 드러나지 않는 트럼프 지지자) 현상이 나타났다는 평가가 있습니다. 여론조사는 결국 표본에 기반하기 때문에, 특정 집단이 과소 혹은 과대 반영될 위험이 존재합니다.
또한 여론조사의 방식이 점점 전화 조사에서 온라인 조사로 바뀌면서, 설문 참여 방식에 따른 응답률과 신뢰도 차이가 발생할 수 있어요. 특히 정치 성향이 강한 사람들이 적극적으로 참여하는 경향이 커서, 중립적인 유권자들의 의견이 반영되지 않는 경우가 있습니다.
이번 2024년 대선에서도 이런 오차가 반복될 가능성이 있기에, 미국 대선 지지율을 볼 때 단순히 수치가 아니라 경향성으로 접근하는 것이 필요합니다.
마무리하며: 누가 이길까? 여론조사만으로는 예측 불가!
결론적으로, 이번 2024년 미국 대선은 역대급 접전으로 예상됩니다. 여론조사는 흥미로운 힌트를 주지만, 그 이상의 변수를 고려해야 하죠. 이번 포스트를 통해 미국 대선 지지율에 대해 조금 더 이해할 수 있었길 바라며, 함께 결과를 주목해봐요!