이른바 선거여론조사의 계절이 왔다. 국회의원 선거가 채 한 달도 남지 않은 지금, 각 언론에서는 갖가지 선거여론조사 결과들을 쏟아내고 있다. 통합민주당은 경합지역에 대해 여론조사를 통해 최종 후보 공천을 할 것이라고 한다. 또한 각 당의 공천이 거의 마무리되고 일부 여야의 간판 인물들이 전략지역에서 서로 맞붙는 것이 확정되자 이런 선거구들에 대한 여론조사가 발 빠르게 이루어져 보도되고 있다. 그런데 과연 선거여론조사 결과들을 그대로 믿어도 되는 것일까?
2002년 제16대 대통령 선거를 치르던 날, 오후 6시 정각이 되자 우리나라 공중파 TV 방송사들은 선거 예측 결과를 발표했다. KBS의 경우 출구조사를 통해 노무현 후보 49.1%, 이회창 후보 46.8%, 근소한 차이로 노무현 후보가 당선될 것이라고 예측했다. 다음날 최종 개표 결과 두 후보의 득표율은 각각 48.9%와 46.6%로 나타나 예측 결과와 불과 0.2% 차이밖에 나지 않았다. 이 결과에 대해 사람들은 놀라워하며 과학적인 통계조사의 정확성에 찬사를 아끼지 않았다. 그러나 그로부터 불과 1년여 지난 2004년 제17대 국회의원 선거여론조사에서 예측 결과와 실제 개표 결과에는 적지 않은 차이가 생겨 혼란을 초래하였다. 특히 두 후보자 간의 차이가 근소하였던 11개 초박빙 선거구의 경우 당선을 예측했던 후보가 모두 떨어지는 웃지 못 할 상황이 벌어졌다. 그 결과 각 방송사들은 잘못된 예측보도에 대해 사과를 해야 했다.
선거여론조사에 대해 일반인들이 갖는 대표적인 오해는 통계를 사실로 여긴다는 것이다. 통계는 사실 그 자체가 아닌 사실에 대한 추측일 따름이다. 사실을 알지 못하기 때문에 여론조사를 통해 사실을 추측하고자 하는 것이다. 불확실한 결과를 추측하는 통계에는 반드시 오차의 가능성이 따른다. 불과 1천 명 안팎의 유권자조사를 통해 사실을 추측하는 것이므로 어떤 유권자를 어떻게 조사하느냐에 따라 결과가 얼마든지 변할 수도 있는 것이다. 따라서 통계학에서는 후보의 지지율에 대한 통계를 발표할 때에는 추측값과 함께 그에 따르는 오차의 한계도 함께 제시하도록 권하고 있다.
미국 시카고 지역의 한 유력 일간지는 1948년 미국 대통령 선거 다음날 1면 머리기사에 듀이(Dewey) 후보가 대통령에 당선되었다고 보도하였다. 그런데 실제로는 상대 후보인 트루먼(Truman)이 당선되었다. 이 신문은 개표 전에 기사가 마감되어야 하는 상황에서 여론조사 결과를 근거로 예측기사를 낸 것인데 이것이 희대의 오보가 되고 만 것이었다. 이런 상황이 발생하게 된 것은 추측값인 통계를 마치 사실인 것처럼 간주하고 통계에 수반되는 오차를 무시한 까닭이었다.
가령, 유권자 1천명을 대상으로 한 여론조사 결과 갑과 을 두 후보의 지지율이 각각 34%와 32%로 나왔다고 하자. 이 여론조사 결과를 보고 갑 후보가 당선될 것으로 판단할 수 있을까? 이때 오차의 한계가 4%포인트라고 하면, 갑과 을의 참 지지율은 각각 (30%~38%)와 (28%~36%)에 사이의 값일 가능성이 크다는 것을 의미한다. 따라서 현재 표본을 통한 지지율은 갑이 다소 높은 것으로 나왔지만 실제로는 을의 지지율이 높을 수도 있는 것이다. 그러므로 선거여론조사 결과를 대할 때 지지율의 추측값만 보고 성급히 판단할 것이 아니라 반드시 오차의 한계도 함께 감안하여 파악하는 것이 필수적이다.
우리나라 대통령 선거 예측조사의 경우 수만 명을 대상으로 조사하므로 오차의 한계가 작아 정확성이 높다. 반면, 국회의원 선거여론조사는 한 조사구 당 표본크기가 500명 내지 1000명에 불과하여 오차의 한계가 3%포인트에서 많게는 5%포인트에 이른다. 그러므로 국회의원 선거의 경우 여론조사를 통해 초박빙 지역의 당선 후보를 정확히 예측하는 것은 사실상 불가능하다. 이번 총선에서는 제발 통계학의 한계에 대한 바른 이해 가운데 선거여론조사가 이루어져 국민들에게 혼란을 초래하는 일이 다시는 반복되지 않았으면 좋겠다.
로그인 후 이용해 주세요