Skip Navigation
Skip to contents

STRESS : STRESS

Sumissioin : submit your manuscript
SEARCH
Search

Articles

Page Path
HOME > STRESS > Volume 33(2); 2025 > Article
Original Article
심리생리검사에서 정신적 대응수단의 효과
김기평1,2orcid, 홍현기1orcid, 지형기1orcid, 김태호3orcid, 현명호4orcid
Effectiveness of Mental Countermeasures in Psychophysiological Detection of Deception
Kipyoung Kim1,2orcid, Hyeongi Hong1orcid, Hyungki Ji1orcid, Taeho Kim3orcid, Myoung-Ho Hyun4orcid
STRESS 2025;33(2):111-116.
DOI: https://doi.org/10.17547/kjsr.2025.33.2.111
Published online: June 30, 2025

1국립과학수사연구원 법의검사과 감정관

2중앙대학교 심리학과 박사과정

3국립과학수사연구원 법의검사과 연구보조원

4중앙대학교 심리학과 교수

1Researcher, Forensic Medical Examination Division, National Forensic Service, Wonju, Korea

2Ph.D. Program, Department of Psychology, Chung-Ang University, Seoul, Korea

3Research Assistant, Forensic Medical Examination Division, National Forensic Service, Wonju, Korea

4Professor, Department of Psychology, Chung-Ang University, Seoul, Korea

Corresponding author Myoung-Ho Hyun Department of Psychology, Chung-Ang University, 84 Heukseok-ro, Dongjak-gu, Seoul 06974, Korea Tel: +82-2-820-5125 Fax: +82-2-816-5124 E-mail: hyunmh@cau.ac.kr
• Received: June 2, 2025   • Revised: June 19, 2025   • Accepted: June 20, 2025

Copyright © 2025 Korean Society of Stress Medicine.

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

prev
  • 125 Views
  • 44 Download
  • 본 연구는 심리생리검사에서 정신적 대응수단이 비교질문검사(CQT)의 탐지 정확도에 미치는 영향을 검증하였다. 성인 45명을 무죄, 유죄, 대응수단 조건에 무작위로 배정하고 Utah ZCT와 ESS-M 채점 체계를 적용한 결과, 유죄와 무죄 집단은 각각 100%, 91.7%의 높은 정확도를 보인 반면, 대응수단 집단은 정확도가 25%로 급감하였다. 이는 정신적 대응수단이 생리반응을 왜곡하여 탐지를 회피할 수 있음을 시사하며, fNIRS와 기계학습 기반 대안의 필요성을 강조한다.
  • Background
    This study examined the impact of mental countermeasures on the accuracy of the comparison question test (CQT) in psychophysiological detection of deception.
  • Methods
    Forty-five participants were randomly assigned to three groups: innocent, guilty, and guilty with mental countermeasures. A mock crime scenario was used, and the Utah Zone Comparison Test was conducted. Scoring was performed using the Empirical Scoring System–Multinomial.
  • Results
    The CQT accurately identified all guilty participants (100%) and 91.7% of the innocent participants. However, only 25% of the guilty with mental countermeasures participants were correctly classified, indicating a substantial reduction in detection accuracy due to the use of mental countermeasures.
  • Conclusions
    Mental countermeasures can significantly distort physiological responses, undermining the core assumption of the CQT. These findings emphasize the need for advanced detection techniques that integrate neurophysiological measures such as functional near-infrared spectroscopy (fNIRS) and machine learning approaches.
심리생리검사는 생리적 반응을 측정하여 피검사자 진술의 신빙성을 평가하는 기법으로, 범죄수사, 국가안보, 그리고 법심리평가 장면에서 광범위하게 활용되고 있다[1]. 심리생리검사의 주요 기법으로는 비교질문검사(Comparison Question Test), 유죄지식검사(Guilty Knowledge Test), 숨김정보검사(Concealed Information Test) 등이 있다. 이 중 비교질문검사는 현재 가장 널리 사용되는 방식으로, 범죄 관련 질문(Relevant Question, RQ)과 비교 질문(Comparison Question, CQ)에 대해 피검사자가 보이는 생리적 반응을 비교하여 거짓 여부를 판단한다[1,2].
비교질문검사의 핵심 가정은 거짓말을 하는 피검사자는 RQ에서 강한 생리적 반응을 보이는 반면, 진실한 피검사자는 CQ에서 강한 반응을 보일 것이라는 점이다[2,3]. RQ는 “당신이 00을 칼로 찔렀습니까?”와 같이 범죄와 직접 관련된 내용으로 구성되며, CQ는 일반적으로 피검사자가 거짓말을 하게끔 유도하는 내용으로 구성된다(예: “과거에 의도적으로 다른 사람을 속인 적이 있습니까?”).
비교질문검사는 1940년대 존 E. 리드(John E. Reid)가 개발한 이후 현재까지 가장 널리 사용되는 심리생리검사 기법으로, 기존의 관련/무관 질문 기법(Related/Irrelevant Test, RIT)의 한계를 보완하기 위해 도입되었다[4]. RIT는 “당신이 피해자를 살해했습니까?”와 같은 RQ와 “당신의 국적이 한국입니까?”처럼 사건과 무관한 질문을 번갈아 제시하는 방식으로 구성된다. 그러나 이 방식은 절대적인 생리적 반응의 강도만을 기준으로 거짓을 탐지하기 때문에 무고한 사람도 RQ에 강한 생리 반응을 보일 경우 허위 긍정(False positive) 오류가 발생할 가능성이 높다.
허위 긍정 오류 문제를 보완하기 위해 개발된 비교질문 검사는 CQ와 RQ를 사용하여 피검사자의 생리반응을 유도하고 그 차이를 비교하는 방식을 사용한다. 이러한 방식은 기본적으로 다른 피검사자에 비해 RQ에서 생리 반응이 매우 높은 피검사자도 상대적인 비교가 가능하여 허위 긍정 오류를 줄일 수 있다는 장점이 있다.
비교질문검사는 이러한 장점을 바탕으로 현재까지 가장 많이 사용되는 심리생리검사 기법이다. 하지만, CQ에 의도적으로 생리 반응을 조작하는 대응수단을 사용하면 비교질문검사의 핵심 가정인 “유죄 피검사자는 RQ에 강한 반응을 보이며, 무죄 피검사자는 CQ에 강한 반응을 보인다.”는 기제를 무력화하여 거짓을 말하는 피검사자도 진실한 피검사자로 판단될 수 있다는 문제가 있다.
비교질문검사에서 피검사자의 생리 반응을 왜곡시킬 수 있는 대응수단으로는 신체적 대응수단과 정신적 대응수단이 있는데, 이 중 정신적 대응수단은 외부 관찰이 어렵고 탐지 기술에 한계가 있어서 심리생리검사에 대한 신뢰를 크게 저하시킬 수 있다[5,6]. 신체적 대응수단은 검사관이 피검사자의 움직임을 통해 직접 탐지할 수 있으며, 최근에는 전기근육도나 영상 분석 기법의 발전으로 탐지 효율이 높아지고 있다[7]. 하지만, 정신적 대응수단은 수학 연산, 감정 조절과 같은 내적 사고 과정을 활용하는 방식이기 때문에 외부에서 관찰하거나 기존의 생리 반응 측정 방식으로는 탐지하기 어렵다[6].
대응수단 사용의 위험성은 점차 높아지고 있다. 미국의 경우 돈을 받고 심리생리검사 대응수단을 은밀하게 교육하는 행위가 증가하고 있고, 연방정부의 대대적인 수사를 통해 수천 명을 상대로 대응수단을 교육한 전직 심리생리 검사관이 체포되어 징역형을 선고받기도 하였다[8]. 국내에서는 아직 이와 유사한 사례가 보고된 바는 없으나 최근 들어 퇴직 검사관의 사설 감정 기관 설립과 민간 교육기관을 통한 심리생리검사관 양성 교육이 점차 증가하고 있는 실정이다. 일부 피검사자는 사설 기관을 통해 자신이 기소된 사건을 주제로 심리생리검사를 미리 경험한 뒤 국가기관의 공식 검사에 임하는 경우도 증가하고 있다.
피검사자가 사전에 정신적 대응수단을 충분히 훈련한 상태로 국가기관의 검사에 응하게 된다면, 단기간의 훈련만으로도 쉽게 사용할 수 있으며 외부에서 탐지하기 어려운 정신적 대응수단의 특성을 고려할 때, 심리생리검사의 신뢰성을 심각하게 위협하게 될 것이다. 실제로 숙련된 피검사자가 정신적 대응수단을 활용하여 비교질문검사의 탐지 정확성을 현저히 낮출 수 있었다는 연구[5,9]도 보고된 바 있다. 이러한 점을 고려할 때, 비교질문검사 기반의 심리생리검사가 지니는 구조적 한계를 보다 구체적으로 규명하고, 나아가 정신적 대응수단의 실질적 효과를 정량적으로 분석하기 위한 연구가 필요하다.
한편, 대응수단의 효과에 관한 기존 연구는 적용된 조건이나 실험 설계에 따라 서로 다른 결과를 보고하고 있다. 예컨대, 일부 연구에서 비교질문검사를 하면서 대응수단을 사용하자 탐지 정확도가 저하되었다고 보고된 반면[2,5], 대응수단 관련 정보를 사전에 제공하였음에도 탐지 정확도에는 유의한 차이가 없었다는 결과도 제시된 바 있다[10,11]. 또한, 유죄지식검사를 기반으로 한 연구에서는 정신적 대응수단이 피부전도반응의 분별력을 저하시켰다는 결과도 보고되었다[6].
이처럼 선행연구 간 결과가 일치하지 않으며, 정신적 대응수단은 외부에서 탐지하기 어려울 뿐 아니라, 최근에는 관련 교육 및 사전 훈련의 가능성이 높아지고 있다는 점에서 심리생리검사의 신뢰성을 위협하는 요소로 지적되고 있다. 따라서 본 연구는 현재 실무에서 널리 활용되는 비교질문검사를 기반으로, 정신적 대응수단이 탐지 정확도에 미치는 영향을 체계적으로 확인함으로써 향후 대응 전략 마련과 검사 신뢰성 제고를 위한 기초자료를 제공하고자 한다. 이를 위해 피검사자를 무죄 집단, 유죄 집단, 그리고 정신적 대응수단을 사용하는 유죄 집단으로 구분하여 심리생리검사를 실시하고, 각 조건에서 나타나는 반응 양상과 탐지 정확성을 분석함으로써 정신적 대응수단의 효과를 명확히 규명하고자 한다.
본 연구는 국립과학수사연구원 기관생명윤리위원회(IRB)의 연구윤리 심의를 받은 후 진행되었다(승인번호: 906-240131-HR-019-01).
1. 연구 참여자
본 연구는 만19세에서 50세 사이의 신체적으로 건강한 46명을 대상으로 실험을 실시하였고 46명의 지원자를 유죄조건에 14명, 무죄조건에 17명, 대응수단 조건에 15명을 무작위 할당하였다. 검사 중 조는 모습이 나타나 정상적인 측정이 불가능했던 무죄조건 1명을 분석에서 제외하여 총 45명의 데이터를 분석에 사용하였다.
2. 측정도구
심리생리검사의 측정도구인 폴리그래프는 Lafayette Instrument에서 제작한 LX5000이 사용되었다. 이 장비는 최대 9개의 신호를 동시에 측정하며 초당 360회의 샘플링 속도로 각 채널의 데이터를 수집한다. 본 연구에서는 피부전도반응, 심장혈관반응, 흉부와 복부의 호흡반응을 측정하여 분석에 사용하였다.
3. 분석방법
심리생리검사는 Utah ZCT (Utah Zone Comparison Test) 기법을 이용하여 실시하였으며, 검사결과는 검사에 참여하지 않은 각각 경력 23년과 15년인 두 명의 검사관이 ESS-M (Empirical Scoring System-Multinomial) 채점 체계를 사용하여 분석하였다. Utah ZCT 기법은 대부분의 국가에서 가장 많이 사용하는 심리생리검사 질문기법으로 CQ와 RQ의 반응 차이를 분석하여 피검자가 거짓말을 하고 있는지를 평가한다.
ESS-M 채점 체계는 ZCT 방식으로 실시한 검사 결과를 분석하기 위해 개발된 표준화된 심리생리검사 채점 방식으로, 검사관이 RQ와 CQ에 대한 생리적 반응 차이를 기준으로 점수를 부여한다. 이 채점 기준은 기존의 대규모 검사 데이터를 바탕으로 베이지안 확률 모델을 활용하여 유죄와 무죄 집단을 가장 잘 구별할 수 있도록 최적화된 cut-score 체계를 바탕으로 설정된 것이다. 즉, 실제 채점 과정에서는 베이지안 확률 계산을 따로 수행하지 않으며, 사전에 베이지안 모델을 이용해 설정된 기준에 따라 CQ에 대한 반응이 더 큰 경우 최대 +2점, 두 질문 간 차이가 없거나 명확하지 않은 경우 0점, RQ에 대한 반응이 더 큰 경우 최대 −2점을 부여하게 된다[12,13].
본 연구에서는 11개의 질문으로 구성된 한 개의 차트를 3회 반복 시행하고, 각 차트에서 채점된 점수를 합산하여 총점을 산출하였다. 산출된 총점은 ESS-M 체계에서 제시된 해석 기준에 따라 분류되었으며, +3 이상은 ‘진실(NDI)’, −3 이하는 ‘거짓(DI)’으로 판정하였다. −2에서 +2 사이의 총점은 ‘판단불능(INC)’으로 간주되며, 이후 Two-Stage Rule을 적용하여 최종 판정 결과를 보완하였다. 두 검사관의 평가가 모두 ‘진실’일 경우에는 최종 결론을 ‘진실’로, 모두 ‘거짓’일 경우에는 최종 결론을 ‘거짓’으로 처리하였다. 만약, 두 검사관의 평가 결과가 일치하지 않거나 모두 ‘판단불능’으로 평가한 경우에는 최종 결론을 ‘판단불능’으로 결정하였다. 이러한 결정 방식은 실제 감정을 수행할 때 검사관의 의사결정 과정과 유사하다.
산포도 작성은 양적 분석을 위해 이전 연구[14,15]에서 사용한 방식과 동일하게 두 검사관의 총점 평균을 활용하여 최종 결론을 도출하는 방식을 사용하였다. 또한, 평가자 편향을 방지하기 위해 각 검사관은 피검사자의 조건(유죄, 무죄, 정신적 대응수단)을 모르는 상태에서 독립적으로 검사를 수행하였고, 수집된 데이터 역시 개별적으로 분석하였다. 평정자 간 신뢰도(Intraclass Correlation Coefficient, ICC)는 Shrout와 Fleiss [16]의 기준에 따라 ICC(2,1) 유형으로 산출되었으며, 그 값은 0.943으로 매우 높았다. ICC(2,1)은 평가자와 피검사자를 모두 무작위 효과로 가정하고, 평가자 간 절대적 일치도를 측정하는 방식이다.
4. 실험설계

1) 실험방법

실험 절차는 사전설명, 과제수행, 측정, 사후 설명의 4단계로 구성된다. 먼저, 사전 설명 단계에서 실험 참가자는 대기실에서 진행자로부터 실험의 전반적인 절차에 대한 설명을 듣고, 실험 참가 동의서를 작성하였다. 이 과정에서 진행자는 참가자에게 모의범죄 수행과 유죄, 무죄, 정신적 대응수단 각 조건에 대한 개요를 간략히 설명하였다. 또한, 참가자에게 심리생리검사 결과가 ‘진실’로 판정되면 5만 원의 참가비를 받고,‘거짓’으로 판정되면 1만 원의 참가비를 받게 된다는 점을 알려주었다.
참가자는 실험 진행자가 대기실을 나간 후 무작위로 섞여 있는 여러 개의 봉투 중 하나를 선택하였다. 봉투에는 유죄, 무죄, 정신적 대응수단 중 하나의 조건이 포함되어 있으며, 해당 조건에 대한 자세한 설명과 구체적인 지시사항이 기재되어 있었다. 참가자는 충분한 시간 동안 자신의 조건과 지시사항을 숙지한 후, 과제 수행 장소인 뇌파실로 이동하여 각 조건에 따라 정해진 과제를 수행하였다.
무죄 조건 참가자는 뇌파실로 들어가 책상 위에 흩어져 있는 책을 정리한 후 대기실로 돌아오라는 지시를 받았다. 유죄 조건 참가자는 뇌파실로 들어가 책상 위에 흩어져 있는 책을 정리한 후 서랍에 들어 있는 반지를 가지고 대기실로 돌아와 이후 진행될 심리생리검사에서 자신이 반지를 훔치지 않았다고 주장하라는 지시를 받았다. 정신적 대응수단 참가자는 유죄 조건과 동일한 과제를 수행하였다. 다만, 정신적 대응수단 참가자의 지시문에는 검사에서 거짓말을 탐지당하지 않도록 검사를 속이는 방법에 대한 구체적인 정보가 기재되어 있다. 참가자는 지시문을 통해 특정 질문이 제시될 때마다 다음 질문이 제시되기 전까지 암산 과제를 반복적으로 수행하라는 지침을 받았으며, 이 방법이 심리생리검사 결과가 ‘진실’로 판정될 가능성을 높이는 효과적인 대응수단임을 안내 받았다.
과제 수행을 마친 모든 참가자는 다시 대기실로 돌아온 후 검사실로 이동하여 동일한 방식으로 심리생리검사를 받았다. 검사 종료 후 참가자는 대기실에서 사후 설명을 듣고, 실험 참여에 대한 비밀유지 서약서를 작성한 후 실험을 마무리하였다.

2) 심리생리검사

심리생리검사는 경력 12년의 검사관과 검사 장비 운용 교육을 받은 심리생리검사 연구 경력 5년의 연구보조원이 각각 진행하였다. 스크립트를 바탕으로 두 명의 검사관은 동일한 설명과 절차대로 검사를 진행하였다.
검사실에 입장한 모든 피검사자는 동일한 방식과 내용으로 검사 절차에 대한 설명을 제공받았다. 본 사전 설명은 실제 심리생리검사와 유사한 방식으로 진행되었다. 검사관은 먼저 검사의 목적이 도난당한 반지의 범인을 특정하는 것임을 설명한 후, 피검사자에게 반지를 훔친 사실이 있는지를 확인하였다. 피검사자가 반지를 훔치지 않았다고 진술한 후 검사관은 피검사자가 착용할 센서, 검사 중 유의사항, 그리고 전반적인 측정 절차를 안내하였다. 설명이 완료된 후, 검사관은 검사에서 활용될 질문 항목을 소개하였다.
이어서 피검사자의 생리적 반응을 측정하기 위해 혈류량, 심혈관 활동, 피부전도, 호흡 센서를 부착하고 각 센서의 신호가 정상적으로 측정되는지 확인하였다. 측정 장비가 정상적으로 작동함을 확인한 후, 검사자는 피검사자의 검사 적합성을 확인하기 위한 간단한 사전 검사를 실시하였다. 피검사자가 검사를 받기에 적합한 상태임이 확인되면 본 검사가 진행되었다. 본 검사는 총 11개의 질문으로 구성되며, 피검사자는 각 질문에 대해 ‘예’ 또는 ‘아니오’로 응답하여야 한다. 한 회기에서 모든 질문에 대한 응답이 완료되면 1회기 측정이 종료되며, 동일한 절차를 총 3회 반복하여 검사를 마무리하였다.
1. 심리생리검사의 정확성
ESS-M 채점 체계를 적용한 결과, 전체 45명 중 10명(22.2%)은 판단불능(−2∼+2)으로 분류되었다. 이를 제외한 35명을 조건별로 분석한 결과, 유죄 집단은 전원(11명)을 정확히 판별하여 민감도는 100%, 무죄 집단은 12명 중 11명을 진실로 판단하여 특이도는 91.7%로 나타났다. 반면, 정신적 대응수단 집단은 12명 중 3명만을 거짓으로 판단하여 정확도는 25%에 불과하였다(Table 1, Fig. 1).
2. 판별점수 산포도 분석
산포도 분석 결과, 유죄 조건에서는 민감도가 91.7%로, 무죄 조건에서는 특이도가 84.6%로 나타났다(Fig. 2). 이러한 결과는 검사관의 실질적 의사결정 방식을 적용하여 분석한 결과에서 확인된 민감도 100% 및 특이도 91.7%에 비해 다소 낮은 값이다.
본 연구는 심리생리검사가 무죄 집단, 유죄 집단, 그리고 정신적 대응수단을 사용하는 유죄 집단을 구분할 수 있는지를 실험적으로 검토하고, 동시에 정신적 대응수단이 탐지 과정에 미치는 영향을 확인해보았다. 분석 결과, 심리생리검사는 유죄 집단에서 100%의 민감도를, 무죄 집단에서 91.7%의 특이도를 보여 정신적 대응수단 집단을 제외하면 분류 정확도는 95.7%에 이르는 것으로 확인되었다. 이러한 수치는 Handler 등[17]이 제시한 ESS-M 평균 정확도(90.1%)와 비교할 때 대체로 유사한 수준으로, 본 연구 결과 역시 해당 채점 체계의 타당성을 지지하는 근거로 해석할 수 있다. 그러나 정신적 대응수단 집단은 민감도가 25%에 불과하여 정신적 대응수단이 심리생리검사의 정확성을 심각하게 저해할 수 있음을 시사한다. 이는 선행연구에서 보고된 다양한 대응수단 조건의 정확도인 약 50%보다 더 낮은 수준이었다. 이러한 양상은 정신적 대응수단이 다른 대응수단에 비해 효과적임을 시사하며, 선행연구의 결론[5]과 맥락을 같이한다.
산포도 분석 결과에서도 정신적 대응수단 집단은 높은 변동성을 보였으며, 일부 피검사자는 무죄 집단 컷오프(+3점)를 초과하는 점수를 기록하였다. 정신적 대응수단을 사용한 피검사자 중 일부는 유죄 집단과 유사한 생리 반응 양상을 나타냈으나, 다수는 무죄 집단과 가까운 점수를 보였고, −2점에서 +2점 사이의 판단불능 범위에 위치한 사례도 적지 않게 관찰되었다. 이와 같은 결과는 정신적 대응수단이 적용될 경우 심리생리검사가 명확한 결론 도출에 어려움을 겪을 수 있음을 간접적으로 보여준다.
아울러, 산포도 분석 방식이 실제 의사결정 방식과 구조적으로 상이하다는 점은 분류 정확도를 해석할 때 조심해야 함을 보여준다. 산포도 분석은 두 검사관의 총점을 평균하여 하나의 대푯값으로 산출하지만, 실제 심리생리검 사에서는 검사관의 판정이 불일치할 경우 판단 불능으로 처리된다. 이로 인해 동일한 사례라도 분석 방식에 따라 상이한 최종 판단이 내려질 수 있다. 예를 들어, 무죄 조건의 한 피검사자에 대해 A 검사관은 -9점(거짓), B 검사관은 −2점(판단불능)으로 평가하였고, 실제 검사에서는 불일치로 인해 판단불능으로 처리되었다. 그러나 산포도 분석에서는 평균값 −5.5점을 기준으로 ‘거짓’으로 분류되었다. 이러한 차이는 분석 방식의 구조적 특성이 민감도 및 특이도 수치에 영향을 미쳤음을 시사하며, 실제 의사결정 기준을 적용한 분석(민감도 100%, 특이도 91.7%)보다 산포도 분석결과(민감도 91.7%, 특이도 84.6%)가 낮게 보고된 배경이었음을 보여준다.
본 연구에서는 ESS-M 채점 기준에 따라 심박수, 혈압,호흡, 피부전도 등 개별 생리 지표의 반응 값을 통합한 총점을 중심으로 분석을 수행하였다. 이러한 방식은 ESS-M을 포함한 대부분의 심리생리검사에서 공통적으로 채택되는 절차로, 개별 지표가 아닌 종합 점수를 기준으로 거짓 여부를 판단하는 것이 일반적인 분석 방법이다. 그러나 정신적 대응수단이 각 생리 지표에 미치는 구체적인 영향을 분석하지 않았다는 점에서 해석상의 한계가 있으며, 향후 연구에서는 각 지표별 반응 양상을 질적인 측면과 양적인 측면에서 분석하고, 이를 바탕으로 대응수단 탐지 기준을 정립할 필요가 있다.
대응수단의 효과성을 검증한 기존 연구는 대응수단의 종류와 연구 방법에 따라 다양한 결과를 보고하고 있다. 정신적 대응수단과 신체적 대응수단을 사용한 집단의 50%가 심리생리검사를 속이는 데 성공한 것으로 보고된 연구[5]가 있으며, Ben-Shakhar와 Dolev [6]의 연구에서는 정신적 대응수단을 사용한 조건에서 검사 정확도가 40∼50% 수준으로 감소하였다.
반면, 검사 기법의 이론적 배경과 신체적ㆍ정신적 대응 수단에 대한 정보를 사전에 제공받은 경우에도 검사의 정확도가 감소되지 않은 연구[10]도 있다. Hong 등[18]의 연구에서도 150페이지 분량의 대응수단 관련 내용을 학습하고 검사에 임한 피검사자의 검사 정확도가 대응수단을 사용하지 않은 집단과 비교해 유의한 차이가 나타나지 않았다. 이처럼 일부 연구에서 대응수단의 효과가 제한적으로 나타난 것은, 대응수단 관련 정보를 제공받은 피검사자의 이해도와 실행 수준 차이 또는 제공되는 정보의 구체성 결여에서 비롯된 것으로 해석할 수 있다.
본 연구는 선행연구와 달리, 피검사자가 특정 질문 구간에서 동일한 암산 과제를 반복 수행하도록 설계하여 정신적 대응수단을 보다 효과적으로 사용하게 하였다. 특히 모든 피검사자가 동일한 과제를 수행하도록 함으로써, 과제 난이도나 수행 방식의 차이로 인한 개인차를 최소화하고, 대응수단의 효과를 보다 명확히 검증할 수 있도록 하였다.
실험 결과, 정신적 대응수단을 사용한 피검사자는 특정 질문 유형에서 비교적 강한 생리반응이 나타났다. 이러한 반응은 단순히 자율신경계 변화만으로 설명하기 어려우며, 그 이면에는 복합적인 인지 개입이 작용했을 가능성이 있다. 실제로 본 연구에서 사용된 암산 과제는 전전두엽(prefrontal cortex) 활성화와 연관이 깊은 것으로 알려져 있다. 특히, 기능적 근적외선 분광법(fNIRS)을 활용한 선행 연구에서도, 뺄셈과 같은 정신적 작업을 수행할 때 전전두엽 부위의 산화헤모글로빈(HbO) 수치가 증가하는 현상이 관찰된 바 있다[19].
이러한 결과는 심리생리검사의 반응 기제를 죄책감이나 탄로 우려와 같은 정서적 요소로만 해석하려 했던 초기 이론보다는, 인지 부하(cognitive load)를 보다 핵심적으로 고려하려는 최근 연구 경향[20]이 설득력을 얻고 있음을 시사한다. 따라서 향후에는 자율신경계 반응만을 다루는데 그치지 않고, 전전두엽 활성화와 같은 인지적 측면까지 포괄적으로 측정할 수 있는 신경생리학적 방법을 활용한 심리생리검사기법 개발이 필요할 것으로 보인다.
본 연구를 통해 확인된 결과에 따르면, 현재 가장 많이 사용되는 심리생리검사 기법인 비교질문검사[1]는 피검사자가 정신적 대응수단을 사용할 경우 탐지 정확성이 감소하는 취약점이 드러났다. 비교질문기법은 개발 이후 과도한 불안 반응과 개인차를 조절하는 데 효과적으로 평가받으며 현재까지 대표적인 검사 기법으로 사용되어 왔다. 그러나 본 연구 결과 CQ 반응을 인위적으로 조작하는 경우, 개인 내 비교(personal within-subject comparison) 방식인 비교질문검사의 탐지 정확도와 신뢰도는 심각하게 저하될 수 있음이 명확히 드러났다.
개인 내 비교 방식을 기반으로 하는 비교질문기법의 한계를 보완하기 위해서는 분석의 패러다임을 개인 간 비교(inter-individual comparison) 방식으로 전환하는 것이 필요할 것으로 사료된다. 즉, RQ 반응을 중심으로 진실한 피검사자와 거짓 진술을 하는 피검사자 사이에서 나타나는 심리적 속성의 근본적인 차이를 비교하는 것이다. 이러한 방식은 대응수단을 통해 조작이 용이한 CQ 반응을 분석에 사용하지 않으므로 정신적 대응수단에 대한 저항성을 높일 수 있을 것이다.
그러나 RQ 반응은 개인 간 변산성이 크고 외부 요인에 민감하다는 자율신경계 기반 생리 지표의 구조적 한계를 가지므로, 이를 극복하기 위해 보다 정량적이고 안정적인 반응 측정 지표의 도입이 요구된다. 이를 보완할 수 있는 생리 지표로는 전전두엽 반응을 측정하는 fNIRS 기술이 대안적으로 고려될 수 있으며, 이는 전전두엽의 대사적 혈류 반응을 기반으로 인지 부하, 주의 집중, 작업기억 등 고차원적 인지 기능과 연관된 활성 변화를 실시간으로 측정할 수 있는 기술이다. 이러한 측정 방식은 최근 심리생리 검사 분야에서 반응 기제를 정서 중심에서 인지 중심으로 확장하려는 연구 흐름과도 맞닿아 있다.
Hong 등[18]은 산술 연산 및 공간 회전 과제를 수행한 참가자의 전전두엽 HbO 반응이 과제별로 유의하게 분화되며, 참가자 간 반응 양상에도 일정한 차이가 존재함을 보고하였다. 또한 Kwon 등[20]은 자기조절 기반 과제 수행 시 전전두엽 반응 데이터를 바탕으로 딥러닝 분류 모델을 적용하였고, 이 과정에서 개별 참가자별 특성을 반영한 높은 예측 정확도가 확인되었다. 이러한 결과는 fNIRS 기반 전전두엽 활성 반응이 참가자 고유의 인지적 특성까지 정량적으로 반영할 수 있음을 시사하며, 개인 간 비교 지표로서의 fNIRS 활용 가능성을 실증적으로 뒷받침한다. 따라서 fNIRS는 전통적인 자율신경계 기반 지표에 비해 정밀하고 객관적인 정량 지표로 기능할 수 있으며, 기존 비교질문검사에서 CQ 반응 조작으로 발생할 수 있는 오류를 줄이고, RQ 중심 분석을 더욱 타당하게 수행할 수 있는 대안으로서의 활용 가능성을 제공한다.
분석 방법을 한 단계 더 고도화하고 정교화하기 위한 전략으로는 기계 학습(machine learning) 기술을 도입하는 방안도 적극적으로 고려할 필요가 있다. 현재 심리생리 검사 결과의 분석은 차트 상에 표기되는 반응 크기를 검사 관이 눈으로 확인하여 수기 채점하는 방식이 사용되고 있다. 이러한 방식은 평가의 용이성과 함께 피검사자의 검사 태도, 측정 방해요인, 피검사자 고유의 생리 반응 패턴을 고려한 개별화된 분석이 가능하다는 장점이 있으나, 검사관 간 평가결과의 불일치와 검사관의 주관성 및 편향이 작용할 수 있다는 단점이 있다.
이와 달리, 기계 학습을 적용할 경우 판별 알고리즘을 통해 보다 정교한 분석이 가능하며 객관적인 판단지표를 이용하여 개인 간 비교가 가능할 것으로 기대해 볼 수 있다. 또한 전전두엽 활성도 측정과 기계 학습 기술을 결합하는 접근 방식은 대응수단의 위협으로부터 심리생리검사의 신뢰성과 정확성을 확보할 수 있는 효과적인 대안이 될 수 있다.
본 연구는 국내 심리생리검사 연구로는 처음으로 정신적 대응수단의 위험성을 실험을 통해 실증적으로 검증했다는 점에서 학술적 의의를 지닌다. 최근 우리나라도 미국의 사례와 같이 민간영역에서 심리생리검사 활용과 교육이 증가함에 따라 검사의 정확성과 신뢰성, 한계점에 대한 관심이 높아지고 있다. 이러한 환경 변화 속에서 심리생리 검사가 지속적으로 신뢰성을 확보하고 범죄사건 해결에 기여할 수 있는 법심리감정 기법으로서 효과성을 유지하기 위해서는 검사의 고도화를 위한 연구뿐만 아니라 다양한 대응수단에 대한 지속적인 연구가 필요하다.

Acknowledgements

이 논문은 2022년도 중앙대학교 연구년 결과물로 제출됨.

Conflicts of interest

The authors declared no conflict of interest.

Funding

This work was supported by National Forensic Service (NFS2025PSY01), Ministry of the Interior and Safety, Republic of Korea.

Fig. 1.
Classification accuracy.
kjsr-2025-33-2-111f1.jpg
Fig. 2.
Scatterplot of classification scores by condition.
kjsr-2025-33-2-111f2.jpg
Table 1.
Classification accuracy results
Condition Judged deceptive Judged truthful Sensitivity/specificity
Guilty (N=11) 11 0 Sensitivity: 100%
Innocent (N=12) 1 11 Specificity: 91.7%
Mental countermeasure (N=12) 3 9 Sensitivity: 25%
  • 1. Krapohl DJ, Shaw PK. Fundamentals of polygraph practice. Academic Press; 2015.
  • 2. Raskin DC, Kircher JC. Validity of polygraph techniques and decision methods in the detection of deception. In Baer BS, Killeen AR (Ed.), Credibility assessment: scientific research and applications. San Diego: Academic Press; 2014. p. 63-93. http://doi.org/10.1016/B978-0-12-394433-7.00003-8.
  • 3. Honts CR, Raskin DC, Kircher JC. Effects of physical countermeasures on the physiological detection of deception. Journal of Applied Psychology. 1985;70:177-187. https://doi.org/10.1037/0021-9010.70.1.177ArticlePubMed
  • 4. Synnott J, Dietzel D, Ioannou M. A review of the polygraph: history, methodology and current status. Crime Psychology Review. 2015;1:59-83. https://doi.org/10.1080/23744006.2015.1060080Article
  • 5. Honts CR, Raskin DC, Kircher JC. Mental and physical countermeasures reduce the accuracy of polygraph tests. Journal of Applied Psychology. 1994;79:252-259. https://doi.org/10.1037/0021-9010.79.2.252ArticlePubMed
  • 6. Ben-Shakhar G, Dolev K. Psychophysiological detection through the guilty knowledge technique: the effects of mental countermeasures. Journal of Applied Psychology. 1996;81:273-281. https://doi.org/10.1037/0021-9010.81.3.273ArticlePubMed
  • 7. Gamer M. Detecting of deception and concealed information using neuroimaging techniques. In Verschuere B, Ben-Shakhar G, Meijer E (Eds.), Memory detection: Theory and application of the Concealed Information Test. Cambridge: Cambridge University Press; 2011. p. 90-113. https://doi.org/10.1017/CBO9780511975196.006.
  • 8. Kaplan D. The true story of an ex-cop’s war on lie detectors. Bloomberg Businessweek. 2015 Aug 4 [Internet]. [cited 2025 May 31]. Available from: https://www.bloomberg.com/graphics/2015-doug-williams-war-on-lie-detector/
  • 9. Elaad E, Ben-Shakhar G. Effects of mental countermeasures on psychophysiological detection in the guilty knowledge test. International Journal of Psychophysiology. 1991;11:99-108. https://doi.org/10.1016/0167-8760(91)90001-eArticlePubMed
  • 10. Rovner L. The accuracy of physiological detection of deception for subjects with prior knowledge. Polygraph. 1986;15:1-39.
  • 11. Honts CR, Alloway WR. Information does not affect the validity of a comparison question test. Legal and Criminological Psychology. 2007;12:311-320. https://doi.org/10.1348/135532506X123770Article
  • 12. Nelson R. Reference guide for the Empirical Scoring System-Multinomial (ESS-M). Polygraph & Forensic Credibility Assessment. 2024;53:103-106.
  • 13. Nelson R, Handler R, Shaw P, Gougler M, Blalock B, Russell C, et al. Using the Empirical Scoring System. Polygraph. 2011;40:67-78.
  • 14. Jung JY, Kim JH, Kim MY, Kang MK, Ji HG, Kim KH, et al. Estimating the accuracy of polygraph for cases involving opposing statements. The Korean Journal of Social and Personality Psychology. 2010;24:1-10. https://accesson.kr/ksppa/v.24/1/1/14710Article
  • 15. Kim HS, Hong HG, Ji HK, Choi YS, Choi HT. Experimental study on validity of NFS examination technique by comparison between NFS with utah technique. Korean Journal of Forensic Science. 2013;14:9-17.
  • 16. Shrout PE, Fleiss JL. Intraclass correlations: uses in assessing rater reliability. Psychological Bulletin. 1979;86:420-428. https://doi.org/10.1037/0033-2909.86.2.420ArticlePubMed
  • 17. Handler M, Nelson R, Goodson W, Hicks M. Empirical Scoring System: A cross-cultural replication and extension study of manual scoring and decision policies. Polygraph. 2010;39:200-217.
  • 18. Hong SH, Lee JM, Heo J, Baek HJ, Park KS. The estimation of activated prefrontal brain area due to the execution of mental tasks using fNIRS. Journal of Biomedical Engineering Research. 2015;36:177-182.Article
  • 19. Vrij A, Fisher R, Mann S, Leal S. Detecting deception by manipulating cognitive load. Trends in Cognitive Sciences. 2006;10:141-142.ArticlePubMed
  • 20. Kwon SH, Park SH, Park JS, Hwang NR, Kwon YJ. Identification of fNIRS brain activity and exploration of deep learning-based predictive model in self-regulation process taking mirror task. Brain, Digital & Learning. 2020;10:365-376.Article

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      • PubReader PubReader
      • ePub LinkePub Link
      • Cite
        CITE
        export Copy
        Close
        Download Citation
        Download a citation file in RIS format that can be imported by all major citation management software, including EndNote, ProCite, RefWorks, and Reference Manager.

        Format:
        • RIS — For EndNote, ProCite, RefWorks, and most other reference management software
        • BibTeX — For JabRef, BibDesk, and other BibTeX-specific software
        Include:
        • Citation for the content below
        Effectiveness of Mental Countermeasures in Psychophysiological Detection of Deception
        STRESS. 2025;33(2):111-116.   Published online June 30, 2025
        Close
      • XML DownloadXML Download
      Figure
      • 0
      • 1
      Effectiveness of Mental Countermeasures in Psychophysiological Detection of Deception
      Image Image
      Fig. 1. Classification accuracy.
      Fig. 2. Scatterplot of classification scores by condition.
      Effectiveness of Mental Countermeasures in Psychophysiological Detection of Deception
      Condition Judged deceptive Judged truthful Sensitivity/specificity
      Guilty (N=11) 11 0 Sensitivity: 100%
      Innocent (N=12) 1 11 Specificity: 91.7%
      Mental countermeasure (N=12) 3 9 Sensitivity: 25%
      Table 1. Classification accuracy results


      STRESS : STRESS
      TOP