[K-CSI] 유괴, 납치, 협박 ‘그놈 목소리’ 어떻게 알아낼까

우리가 자주 접하는 사람의 목소리는 듣기만 해도 그가 누구인지를 알 수 있다. 이것은 모든 사람의 목소리는 고유한 파장을 갖고 있기 때문에 가능한 것이다.

이렇듯 음성은 개인마다 고유한데 이러한 특징은 각 개인의 음성기관의 특성에 의한 것도 있지만 오랫동안의 언어습득 등에 의한 발성습관에 따라 목소리가 달라지기도 한다.이러한 특성은 각종 범죄를 해결하는데 유용하게 사용될 수도 있다.

각종 유괴 및 납치 사건, 폭파 위협, 독극물 또는 이물질 투입 협박사건, 전화폭력사건, 사기사건, 항공기 사고 원인분석 등 음성이 사용된 사건에서 녹음된 음성 및 소리를 분석하여 사건을 범인이 누구인지를 밝혀낼 수 있는 것이다.

개인 고유의 파장 통해 납치, 협박범 음석 분석해 범인 밝혀 음성에 의한 개인식별은 1960년대 들어서 체계적으로 연구되기 시작했다. 미 FBI 가 벨연구소에 의뢰하여 연구를 한 결과 사람의 목소리는 지문처럼 개인별로 독특한 특징을 가지고 있으며 사람을 식별할 수 있는 정확도가 99% 이상이라고 했다.

이 연구 결과는 저명한 과학잡지인 네이처에 발표되었다. 1960년대 중반 미시간주경찰연구소는 미시간주립대학과 같이 음성식별 프로젝트를 수행하였다.

이 연구 결과에서 성문(목소리 지문)은 조건에 따라 차이는 있지만 신뢰할 수 있는 방법이라고 결론을 내렸다. 이때부터 미국에서는 화자식별의 신뢰도를 인정하게 되었으며 법정에 증거로 제출되어 수사에 중요한 참고자료로 활용돼 왔다.

우리나라에서는 1980년대 초부터 음성감정을 실시하였으며 1987년부터 본격적으로 범죄수사에 활용하기 시작했다. 1987년 원혜준양 유괴사건의 범인이 음성 감정에 의해 검거된 이후 많은 사건을 해결하는데 중요한 역할을 하여왔다.

▲ 음성분석기는 사람의 성도의 크기와 모양에 따라 달라지는 공명주파수와 주파수별 세기 등을 비교 분석해 동일인 여부를 판정한다.

우리나라는 1987년 원혜준 양 유괴사건 이후 범죄 수사에 활용 음성은 성대의 진동에 의해 만들어진 소리가 성도를 통과하면서 공명되어 입으로 나오면서 만들어진다. 사람의 음성은 여러 가지 파가 혼합되어 있는 복합파이고 이 복합된 파는 음성분석기에 의해 눈으로 볼 수 있는 여러 가지 형태로 분석된다.

사람의 성도의 크기와 모양에 따라 달라지는 공명주파수와 주파수별 세기와 성대의 진동형태, 음의 높이 등에 영향을 받는 억양, 발음지속시간 등 음성기관과 발음상 특징에서 나타나는 여러 가지 요소들을 비교 분석하여 동일인 여부를 판정한다.

성문비교 실험은 비교할 음성들에서 같은 말을 찾아 비교하게 되는데 이를 단서어라고 한다. 단서어는 범인이 여러 번 반복하거나 명확하고 크게 발음한 말이 좋다. 명확한 개인식별을 위해서는 약 20개 이상의 단어가 필요하다.

▲ 음성분석기를 통해 분석된 음성

다른 사람 목소리로 위장해도 구분 가능 음성의 높이에 따라 화자가 남성인지 여성인지를 알 수 있다. 여자의 경우는 평균 약 240 Hz 정도, 남자의 경우 약 120 Hz 로 명확하게 구분된다. 연령에 따라서도 음성의 높이가 다른데 통계적 수치를 활용하여 나이를 추정할 수 있다. 또한 지역별로 억양, 발음특징, 발음의 세기 등이 다르게 때문에 이러한 요소들을 분석하여 화자가 어느 지역 출신인지를 판단할 수도 있다.

범죄를 위장하기 위해 다른 사람의 목소리로 위장하거나 변형하는 경우도 있다. 이런 경우 위장 음성 여부를 구분할 수 있을까? 사람들 중에는 다른 사람의 목소리를 잘 흉내 내는 사람이 있다.

이런 경우도 원래의 사람과는 확연하게 구별할 수 있기 때문에 위장한 목소리임을 정확하게 판단할 수 있다. 목소리를 변형한 경우에도 같은 사람의 성대와 습성을 통해서 나오는 음성이기 때문에 여러 가지 분석 패턴을 비교하면 같은 사람의 목소리인지를 구별할 수 있다.

남성이 여성의 목소리로 변형하여 말하는 경우도 있는데 이런 경우도 남성과 여성의 음성의 높이가 다르므로 구별할 수 있다.

박기원 전 국과수 부장 kwpark001@hanmail.net