
안녕하세요. 직장인의 엑셀 능력을 향상 시켜주는 쑥떡입니다! 오늘의 그래프는 "기준선 분산 그래프"입니다. 분산 그래프는 데이터 집합을 비교, 분석하는 경우에 많이 사용하며, 두가지의 값을 가진 데이터를 x, y축으로 표현된 그래프 위에 마치 흩뿌리듯이 표현한느 그래프입니다. 단순히 데이터를 뿌리는 것에 그치지 않고 특정 기준선을 기준으로 두 그룹으로 나누는 방법에 대해 알아보겠습니다.

국가별 2020년 경제성장률과 2021년 경제성장률을 기준으로 설명하겠습니다. 나라별로 두개의 데이터가 부여되어 있으며, '2020년 대비 2021년 경제 성장률이 10%p 이상 증가"를 기준선으로 국가들을 분류해보겠습니다.

우선 두개년도의 성장률 차이값으로 데이터를 분류해야하므로, 2개연도 성장률의 차이값을 구해줍니다. 해당 값이 그래프에 포함되지는 않으나, 그래프의 기초자료가 되는 표를 만들때 사용될 예정입니다. 그리고 데이터 가장 아래부분에 최대값과 최소값을 추가해줍니다. 최대값, 최소값은 이후 그래프를 추가한 다음 기준선을 그리는데 사용이 되므로, 기준선을 어떻게 구성할지 생각하여 임의의 점으로 구성해줍니다. 예를 들어 위의 경우에는 차이값 10이 기준이 되므로, 차이값 10이 되는 임의의 점 두개를 지정해주되, 데이터 모두를 포함해야 하므로 (10,20)을 최대값, (-15,-5)를 최소값으로 지정해주었습니다.

기존 표 오른쪽에 새로운 표를 하나 추가합니다. 첫 열에는 2020년 데이터를 그대로 옮겨넣고, 2021년 데이터는 두번째 및 세번째 열에 나눠서 기입할 예정입니다. 10%p를 기준으로 데이터를 나눠야 하므로 두번째열(G열)에는 기존에 구해둔 차이가 10%p보다 클 경우 해당 차이값을 기재하고, 아닐경우 데이터 없음으로 처리해야 합니다. 이를 수식으로 표현하면 G3=IF(D3>=10,C3,NA())가 됩니다. 반대로 세번째열에는 10%p보다 작을 경우 데이터가 기재되어야 하므로 H3=IF(D3<10,C3,NA())가 기재되어야 합니다. 해당 수식을 기재한 다음 모든 셀에 붙여넣으면, 차이값이 10을 기준으로 G열과 H열로 나눠서 기재됩니다.

데이터 구성을 완료한 표를 전체 선택한 다음 [삽입]탭에서 [분산형 그래프]를 추가합니다. 10을 기준으로 데이터를 2개로 나누었는데, 그래프에도 해당 분류 기준에 맞춰 점이 찍혀있습니다. 꼭 2개로 나누지 않아도 되지만, 2개로 데이터를 미리 나눠 둘 경우 가장 큰 장점은 데이터 그룹별로 서식을 한번에 지정할 수 있다는 점입니다. 데이터를 나누지 않아도 개별 데이터의 색상을 변경할 수 있으나 데이터가 많은 경우에는 하나하나 색상을 지정하기에는 시간이 오래 소요됩니다.

만들어진 분산그래프를 살펴보면 우측 상단 끝부분과 좌측하단 끝부분에 점이 있는 것을 확인할 수 있습니다. 최대값과 최소값으로 지정한 점들인데, 최대값 점을 클릭한 다음 데이터 요소 서식으로 이동하여 [실선]을 선택하면 최대값과 최소값을 이어주는 선이 추가됩니다. 만약 추가된 선이 너무 길거나 짧으면 표에 기재된 최대/최소값 부분의 데이터를 수정하여 선의 위치, 길이를 수정해주면 됩니다.

선의 위치, 길이를 조정하였다면, 이번에는 가로/세로축 서식으로 이동하여 축 길이를 조정해줍니다. 임의로 설정하여도 좋지만, 기준선이 그래프 끝에 위치하도록 맞춰주는 것이 좋습니다. 축의 최대/최소값을 데이터에 정해둔 최대값, 최소값의 데이터와 동일하게 맞춰주는 것이 가장 보기 좋습니다. 그리고 가로선/세로선은 불필요하면 삭제하되, 점의 정확한 데이터를 한눈에 파악하고 싶다면 그대로 두는 것도 나쁘지 않습니다.

대략의 그래프 윤곽이 잡혔습니다. 이번에는 기준선 양끝에 위치한 점을 제거해 줍니다. 클릭하고 Delete키를 누르거나 삭제를 하면 데이터도 같이 삭제되어 그래프모양이 변경되므로 삭제가 아니라 투명하게 만드는 방법을 사용하여야 합니다. 최대값 점을 클릭(두번 클릭해야 해당점만 클릭됩니다.)한 다음 서식으로 이동하여, [표식]을 클릭하고 [채우기 없음], [테투리 선 없음]을 클릭하여 점이 보이지 않게 만들어 줍니다. 같은작업을 최소값에도 해주면 기준선 양끝에 있던 표식이 사라지고 깔끔한 직선으로 변경됩니다.

점 색상과 선 색상을 원하는 양식으로 적용하고, 주요 포인트에는 레이블을 적용해 줍니다. 분산 그래프에서 점들이 특정 영역에 몰려있는 경우에는 레이블을 모두 추가 하는 것 보다 주요 포인트에만 추가하는 것이 좋습니다. 모두 추가하려면 위치 조정에 시간이 오래걸리고 겹치지 않게 하기 위해서 글씨 크기를 줄여야하기 때문입니다.

추가로 필요한 경우에는 텍스트 박스를 추가하여 x축, y축 제목을 추가하고 그래표 주요 부분에 대한 설명도 간략하게 추가해 줍니다. 기준선을 기준으로 위 아래 영역이 각각 어떤 항목들의 집합인지 간략히 표현해준다면 좋은 그래프가 될 것이라 생각합니다. 엑셀은 쑥떡!
쑥떡(SSOOKDDEOK)
인스타 │@ssookddeok.excel
이메일 │ssookddeok.official@gmail.com
*문의/질문은 언제나 환영합니다!
'EXCEL GRAPH' 카테고리의 다른 글
| 엑셀 그래프 시리즈 004. 추정치 포함 그래프 (0) | 2023.03.19 |
|---|---|
| 엑셀 그래프 시리즈 003. 변화 브릿지 그래프 (0) | 2023.03.18 |
| 엑셀 그래프 시리즈 002. 차이값 강조 그래프 (0) | 2023.03.16 |
| 엑셀 그래프 시리즈 001. 양방향 가로 그래프 (6) | 2023.03.15 |




































