R-Blogger블로그·해설한국어2025-10-04
Gini 지수란 무엇이며 계산 방법은?
Buy Me a Coffee로 최소 기부를 요청드립니다 이 글이 도움이 되셨다면 Buy Me a Coffee에서 작은 기부를 부탁드립니다. 기부금은 오픈소스 활동 지속에 사용됩니다. Gini 지수란? Gini 지수는 통계학에서 불평등 정도를 정량화하기 위해 사용되는 지표이며, 주로 소득이나 부의 분포에 적용됩니다. 이 지수는 이탈리아의 Corrado Gini가 1912년에 개발하였습니다. 값은 0에서 1(또는 0%에서 100%) 사이이며, 0은 완전 평등, 1은 완전 불평등(단일 인물이 모든 소득을 차지) 을 의미합니다. 간단한 예시 니카노르 파라가 “두 개의 빵이 있습니다. 당신은 두 개를 먹고, 나는 아무것도 먹지 않습니다. 평균 소비량은 사람당 한 개입니다.” 라고 말했다고 가정합시다. 평균은 1개이지만, 실제로 한 사람이 모든 빵을 먹는 상황이므로 Gini 지수는 1이 됩니다. 계산 원리 Gini 지수는 Lorenz 곡선을 이용해 계산됩니다. Lorenz 곡선은 누적 소득 비율을 누적 인구 비율에 대입해 그린 곡선입니다. Gini 지수는 Lorenz 곡선과 완전 평등선(45도 선) 사이의 면적을, 완전 평등선 아래 전체 면적으로 나눈 값으로 정의됩니다. 예시: 2024년 칠레 소득 분포 아래 표는 칠레의 소득 분포(소득 백분율)를 나타낸 것입니다. 1분위: 1.7% 2분위: 3.1% 3분위: 4.2% 4분위: 5.2% 5분위: 6.4% 6분위: 7.7% 7분위: 9.4% 8분위: 11.9% 9분위: 16.2% 10분위: 34.2% 이 데이터를 이용해 Gini 지수를 계산하면 약 0.44 (44%)로, 중간 정도의 불평등 수준을 나타냅니다. R을 이용한 Gini 지수 계산 예시 다음은 R 코드로 Gini 지수와 인간 개발 지수(HDI) 사이의 상관관계를 분석하는 예시입니다. # Calculo sin usar librerías # Porcentaje acumulado de ingreso por decil ingreso % select(iso2c, HD.HCI.OVRL) , by = "iso2c" ) cor(combined_data$SI.POV.GINI, combined_data$HD.HCI.OVRL) [1] -0.2657431 결과는 Gini 지수와 인간 개발 지수 사이에 음의 상관관계가 있음을 보여줍니다. 즉, 불평등이 증가할수록 인간 개발 수준이 낮아지는 경향이 관찰됩니다. 산점도 시각화 아래 코드는 d3po 패키지를 이용해 산점도를 그립니다. d3po(combined_data, width = 800, height = 600) %% po_scatter(daes(x = SI.POV.GINI, y = HD.HCI.OVRL, group = country, tooltip = country)) %% po_labels( title = "Índice de Desarrollo Humano en América del Sur", subtitle = "Fuente: Banco Mundial") 이 그래프는 불평등이 높더라도 인간 개발 수준이 높은 국가와, 불평등이 낮더라도 인간 개발 수준이 낮은 국가가 존재함을 시사합니다. 따라서 소득 불평등만으로는 인간 개발 수준을 완전히 설명하기 어렵습니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2025-10-04