DNA검사에 숨어 있는 확률의 비밀

  • 확대
  • 축소
이미지 확대하기3최근 부녀자 10여 명을 살해한 연쇄살인범이 붙잡혀 온 국민이 충격에 빠졌다. 원래 지난 12월 실종된 여대생을 살해한 용의자로 그를 검거했지만 여죄를 밝히는 과정에서 범인의 점퍼에 묻은 체액의 DNA가 지난 11월 실종된 또 다른 사람의 DNA와 일치하는 것으로 나타났다. 이 증거를 내밀자 자포자기한 용의자가 그동안의 연쇄살인사건의 범인이 자신임을 털어놨다. 다음날 범인이 진술한 곳을 파자 정말 실종자들의 시체가 줄줄이 나와 사람들을 경악시켰다.

이번 사건에서 DNA가 범인을 밝히는 데 결정적인 역할을 했지만 언제나 그럴까. 다음 경우를 생각해 보자. 범죄 현장에서 범인이 뱉은 것으로 보이는 침이 발견됐다. DNA 테스트를 시행한 국립과학수사연구소는 용의자의 DNA가 그 침에 들어 있는 DNA와 일치한다고 법원에서 증언했다. 다만 무작위로 택한 사람의 DNA가 범죄 현장의 침 DNA와 일치할 확률은 100만분의 1이라고 덧붙였다. 검사는 용의자가 범인이라고 기소하면서 이런 주장을 펼칠 수 있다.

1. 범인이 아닌데 DNA가 일치할 확률은 100만분의 1이다.
2. 현장의 침이 용의자의 침이 아닐 확률은 100만분의 1이다.
3. 따라서 용의자가 범인일 확률은 99.9999%다.

하지만 변호사는 이렇게 반박할 수 있다. 남한 인구가 대략 5000만 명이므로 100만분의 1인 약 50명이 범죄 현장의 침 DNA와 일치하는 DNA를 갖고 있다. 용의자는 그 가운데 한명이므로 용의자가 범인일 확률은 2%다. 누구의 주장이 더 설득력이 있을까.
독자 여러분은 어떻게 생각할지 모르겠지만 다른 증거가 없으면 용의자를 무죄로 풀어주는 것이 유럽이나 미국의 일반적인 판례다.

법조인도 확률과 통계 알아야
이미지 확대하기최근 15~20년 사이에 확률이나 통계의 정확한 의미를 법조인에게 가르쳐야 할 필요성이 급격히 커졌다. 담배나 의약품이 건강을 실제로 해쳤는지 여부를 가리거나 환경파괴로 인한 손해배상을 청구하는 소송이 늘고 있기 때문이다. 미국통계학회는 판사들에게 통계학을 가르치기도 했다. 미국의 사법부가 요청해서 벌어진 일이다.

검사의 오류는 과학동아 독자들은 많이 알고 있을 ‘몬티 홀 문제’처럼 조건부 확률에 관한 것이다. 사실 조건부 확률을 현실에 적용하는 일은 전문가들에게도 상당히 어려운 문제다. 예를 들어 주사위를 던졌을 때 숫자 1 또는 2가 나오는 사건을 A라고 놓고, 짝수가 나오는 사건을 B라고 하자. 따라서 사건 A가 발생할 확률 P(A)는 1/3이고 P(B)는 1/2이다.

P(A|B)는 눈을 감고 던졌더니 친구가 짝수(즉 B)가 나왔다고 알려줬을 때 주사위 눈이 1 또는 2, 즉 A일 확률을 말한다. 짝수는 2, 4, 6이 있으므로 P(A|B)는 1/3이다. 그런데 P(B|A), 즉 1, 2가 나왔다는 사실을 알고 있을 때 주사위 눈이 짝수인 경우는 하나이므로 짝수일 확률은 1/2이다. 검사의 오류는 P(DNA가 일치한다|범인이 아니다)와 P(범인이 아니다|DNA가 일치한다)의 차이를 구별하지 못한데서 발생한 것이다. 몬티 홀 문제를 다시 보자.

문제
TV쇼 진행자 몬티 홀은 행운에 도전하는 출연자에게 3개의 문을 보여준다. 문마다 1에서 3까지 번호가 매겨져 있다. 3개의 방 중 하나에는 최신형 자동차가 있고 나머지 두 방에는 염소가 있다. 만일 출연자가 문을 열어서 자동차가 있으면 그 자동차를 준다. 출연자가 만일 1번 문을 선택한다면, 정답을 아는 몬티는 3번(또는 2번) 문을 열어서 염소를 보여주고 이렇게 묻는다. “처음 선택한 1번 문을 열어보시겠어요, 아니면 지금이라도 마음을 바꿔서 2번(또는 3번) 문을 여시겠어요?”

무조건 마음을 바꾸는 것이 유리한데, 먼저 말로만 따져 보면, 1번 방에 자동차가 있을 확률은 1/3, 2번이나 3번 방에 자동차가 있을 확률은 2/3이다. 3번 방은 몬티가 열어줬으니까 2번 방에 자동차가 있을 확률이 2/3이 된다. 조건부 확률을 사용해 계산해보자.

이미지 확대하기

혼란에 빠지지 않고 이 사실을 증명할 수 있다면 대단히 우수한 학생이다.
어떤 사실이 참일 때(검사의 경우에는 DNA 일치, 몬티 홀의 경우에는 염소가 있는 방 공개) 확률이 변한다는 개념은 어떻게 보면 당연하다. 도박을 할 때에도 새로운 추가 정보를 얻으면 다르게 행동할 것이다. 하지만 막상 이런 생각과 확률이라는 개념을 조화시키는 일은 전문가에게도 어려운 과제다.

조건부 확률은 고등학교 수학 I, 확률 단원에 나온다. 학생들에게는 조건부 확률이라는 개념은 물론 한글 표현도 혼란스러운 것 같다. 주사위의 예에서 P(A|B)를 구할 때 조건인 B에 해당하는 “눈을 감고 던졌더니 친구가 짝수(즉 B)가 나왔다”고 알려줬을 때 ‘주사위의 눈이 이미 정해져 있으므로 확률은 0이거나 1이다’ 라고 생각하는 학생들도 꽤 있다. 독자 가운데 누군가 이렇게 생각했다면 먼저 확률의 개념을 확실히 익히자.

한상근 교수는 미국 오하이오주립대에서 박사학위를 받고 1989년 KAIST에 부임했다. 정수론과 그 응용인 암호학, 정보학 분야를 연구하고 있다. 1992년 조선시대 수학자 최석정의 저서 ‘구수략’을 접하고 이듬해 ‘최석정과 그의 마방진’이라는 논문을 써 최석정이 조합론 분야의 원조임을 알리는 데 기여했다.

글 : 한상근 KAIST 수학과학과 교수 기자 sghahn@kaist.ac.kr
과학동아 2009년 03호


위로