통계에서는 변수라는 개념이 존재한다. 보통 tabular data에서 변수를 사용하게 된다. tabular data란, 표 형식의 정형화된 데이터를 의미한다. 보통 이렇게 생겼다. 환자|변수 ID 키 성별 1 X1231 180.2 M 2 X2123 171.7 F 여기서 키, 성별이 각각 변수에 해당한다. 그런데 이 변수들에도 종류가 있다. 바로, 연속형 변수와 이산형 변수이다. 그렇다면 각 변수별로 요약을 하고 싶을 때 어떤 방식으로 해야할까? 각 대표값 표시법과 산포도 표시법에 대해서 알아보도록 하자. 먼저 연속형 변수는 대표값 표시를 위해서 흔히 평균(mean)을 쓴다. 그렇지만 데이터의 분포가 한쪽으로 치우쳐 있는 경우(skewed) 중위수(median)나 최빈도(mode)값을 표시해주는 경우도 더..