개인선별용 일상우울척도 단축형의 개발 및 타당화

Development and Validation of Short Form of the Normal Depression Scale for Individual Screening

Article information

STRESS. 2018;26(4):277-289
Publication date (electronic) : 2018 December 31
doi : https://doi.org/10.17547/kjsr.2018.26.4.277
이순묵1orcid_icon, 김종남2,orcid_icon, 채정민3orcid_icon, 최승원4orcid_icon, 서동기5orcid_icon
1 성균관대학교 심리학과
1 Department of Psychology, Sungkyunkwan University, Seoul, Korea
2 서울여자대학교 교육심리학과
2 Department of Educational Psychology, Seoul Women’s University, Seoul, Korea
3 서울사이버대학교 상담심리학과
3 Department of Counseling Psychology, Seoul Cyber University, Seoul, Korea
4 덕성여자대학교 심리학과
4 Department of Psychology, Duksung Women’s University, Seoul, Korea
5 한림대학교 심리학과
6 Department of Psychology, Hallym University, Chuncheon, Korea
Corresponding author Jong-Nam Kim Department of Educational Psychology, Seoul Women’s University, 621 Hwarang-ro, Nowon-gu, Seoul 01799, Korea Tel: +82-2-970-5561 Fax: +82-2-970-5969 E-mail: kimjn@swu.ac.kr
This work was supported by the National Research Foundation of Korea Grant funded by the Korean Government (NRF-2014S1A5A2A03064999). This paper was presented at the 2017 Annual Conference of the Korean Psychology Association.
Received 2018 October 23; Revised 2018 November 05; Accepted 2018 November 05.

Abstract

본 연구는 일반인이 경험하는 일상우울 상태를 손쉽게 판단할 수 있는 개인선별용 검사를 제작하고 신뢰도와 타당도를 조사하는데 목적이 있다. 이를 위해 원척도인 일상우울 집단연구용 척도(17문항)를 바탕으로 5문항으로 된 단축형 척도를 개발하였다. 연구 결과, 집단연구용 척도와 단축형 척도 간 상관은 .94로 높았으며, 검사-재검사 신뢰도(60일 이내 .73) 또한 양호한 수준이었다. 검사의 내적 구조는 1요인으로 확인되었다. 끝으로 기준점수를 구하였는데, 단축형 5개 문항의 총점이 18점 이상이면 일상우울 수준을 넘어 역기능우울의 가능성이 있으므로 역기능우울척도를 실시하는 것을 권고한다.

Trans Abstract

Background:

The purpose of this study is to develop a short form of the normal depression scale for individual use in the school, health, industry, organization, and counseling settings, based on the original normal depression scale (17 items).

Methods:

To achieve this purpose, we selected five items from the original test and analyzed data using Mplus 7.4 and SPSS 21.0.

Results:

The normal depression scale-short form consists of 5 items. The reliability of the short form (test-retest reliability) was good. The content validity and internal structure validity (1 factor model) were verified. The cut score between normal and dysfunctional depression was determined to be 18.

Conclusions:

The normal depression scale-short form for individual screening is verified to have good reliability and validity, so it is expected to be useful to perform quick screening of normal depression in the practical settings.

서론

본 연구에서는 검사 또는 척도 개발 시에 집단연구용과 개인추론용의 구분을 분명히 하고, 개인추론용 가운데에서도 입시나 자격시험이 아닌 임상/상담/건강 장면에서의 선별용 검사라면 현장에서의 실용성을 추구하여 단축형 척도가 필요함을 제시하였다. 그러한 맥락에서, 이미 개발된 일상우울 집단연구용 척도(17개 문항) (Lee S et al., 2018)에 기반하여 개인선별용 척도(5개 문항)를 개발하고 타당화하였다. 일상우울 집단연구용 척도에 대해서는 Lee S et al.(2018)에 자세한 내용이 실려 있으나, 여기서 간략히 설명하자면 일상우울척도는 임상우울이나 준임상우울과 같은 역기능적 우울을 측정하기보다 일반인의 우울경험과 우울수준을 측정하기 위해 개발된 것이다. 일상우울척도와 유사한 기존의 우울척도로는 CES-D (The Center for Epidemiologic Studies Depression Scale; Radloff, 1977)가 있다. 그러나 CES-D가 개발된 1970년대에는 일상우울의 개념이 없었고 우울을 역학적 연구의 일부로서 고려하는 차원에서 척도가 개발된 것이므로 측정대상이 되는 개념의 영역으로 보아 일상우울에 대한 측정을 위한 것도 아니고 그 영역에 타당화 된 것도 아니다. 보다 기술적으로 측정의 영역을 구분해본 Lee S et al.(2018, Table 5)이 일상우울문항과 CES-D 문항의 속성수준을 비교 분석한 결과, 일상우울 문항들은 CES-D보다 더 낮은 수준의 우울을 측정하고 CES-D는 비교적 높은 수준의 우울을 측정하는 것으로 나타났다. CES-D가 역학적 관점에서 개발된 것이고 일상우울 척도가 정상인의 우울을 대상으로 하고 있는 구성 개념의 차이에 일관성 있는 결과이다. 또한 일상우울이 정의하는 영역에 대해서 CES-D가 타당화 된 것은 아니므로, 서로 겹치는 부분이 있음에도 불구하고 일상우울 척도의 기능을 CES-D로 대체하기는 어렵다. 이는 보다 경미한 우울에 대해서는 일상우울 척도가 더 적합함을 시사한다.

Confirmatory factor analysis of 1 factor model of the NDS-SF

국내의 문헌에서 아직은 집단연구용과 개인추론용 척도의 구분이 정착된 상태는 아니다. 이 구분이 명시적으로 언급되는 맥락은 검사의 신뢰도에 대한 논의에서이다(예: Lee S, 1996; Haertel, 2006). 예로서, 검사의 신뢰도는 집단연구용에서 .60 이상이면 무난하지만 개인추론(의사결정, 진단, 선별)의 용도이면 그보다 높은 값이 요구된다. 개인추론 시의 신뢰도로서 Mehrens et al.(1980)은 .85 이상, Haertel(2006)은 학생 개인에 대한 평가(individual student evaluations) 장면에서 검사 신뢰도는 .70 아래로 내려가서는 안 된다고 하였다. 이것은 모두 개인추론용이 될수록 집단연구용에 비하여 높은 신뢰도가 요구됨을 의미한다. 국내의 검사 개발에서 집단연구용에 대비하여 개인추론용 척도에 대한 차별적 용도를 분명히 하고 해당되는 기술적 사항을 제시한 예를 보기는 쉽지 않다.

그런데 검사의 양호도를 평가하는 데는 기술적으로 가장 중요한 타당도와 신뢰도 외에도 수용 가능성과 실용성이 언급된다(Lee S, 1999). 신뢰도와 타당도가 양적인 품질을 강조한다면, 수용 가능성은 검사가 수검자들에 의해서 검사로서 수용가능한지에 대한 것(안면타당도)이고, 실용성(Thorndike et al., 1991)은 비용의 경제성과 절차의 편리성에 대한 것이다. 집단연구용은 상세한 내용의 추출 또는 학술적 검토의 기반이 되는 자료를 제공하므로 충분한 차원과 수효의 문항을 필요로 한다. 개인추론용도 입시나 임용시험, 자격시험 등에서는 역시 공정성과 정확성을 위해서 측정되는 차원과 관련 문항의 수효가 충분해야 할 것이다. 그러나 임상/상담/건강 현장에서 보다 정교한 진단용 검사 또는 전문가의 판단이 준거로 있는 가운데, 신속하고 간단하게 선별용(screening)으로 사용하기 위한 목적이라면 실용성 측면에서 단축형 검사가 유용할 것이다.

특히 임상장면에서 선별용으로 단축형에 대한 많은 요구가 있다. DSM-5 (American Psychiatric Association, 2013, pp. 735-748)에 제시된 성인우울 자가평정용 수준1 도구(Adult DSM-5 self-rated level1 cross-cutting symptom measure)는 2개 문항(흥미 또는 즐거움 상실; 기분저하, 우울, 또는 절망감)이고 수준2 도구는 8개 문항이다. Whooley et al.(1997)은 우울증 환자를 탐지하는데 2개 문항으로 가능하다고 하였으며, Lὄwe et al.(2005) 또한 2문항으로 구성된 PHQ-2 질문지를 통해 주요우울장애 진단이 가능하다고 하였다. 특히 문항수가 매우 많은 MMPI에 대한 단축형 논의는 오래되었다(Jung S et al., 2011). 이처럼 우울척도 단축형에 대한 연구가 이루어지고 있는 이유는 연구나 임상 현장에서 우울증이 선별의 대상으로서 유일하게 고려되는 경우 보다는 다른 증상들과 함께 고려되는 경우가 자주 있고, 바쁜 의학 현장에서 측정도구가 짧을수록 우울증 외에도 다양한 선별 질문을 할 수 있게 되기 때문이다(Lὄwe et al., 2005). 실제 많은 임상가들은 일반적으로 사용하는 측정도구들이 시간-소모적이고 너무 부담스럽다고 느낀다(Whooley et al., 1997). 이러한 맥락에서 본 연구에서도 일상우울(Lee S et al., 2018)에 대한 집단연구용(17개 문항) 척도를 선별용으로 단축하여 타당화하였다.

먼저 집단연구용 척도와 개인추론용 척도의 개념과 특징에 대해 살펴보면 다음과 같다. 집단연구용 척도에서는 응답자의 성명을 묻지 않지만 개인추론용은 반드시 개인의 신분이 명기되어야 한다. 집단연구용 척도는, 개인에 대한 평가와 의사결정을 하기 위해 사용되는 개인추론용 척도(임상/상담/건강 장면 검사들, 산업/조직/학교 장면에서의 각종 자격시험, 입사시험, 입학시험 등)에 대비되는 용어이다. 여기서의 집단연구용 척도(검사)와 개인추론용 척도(검사)는 검사실시의 방법으로서 언급되는 집단검사(집단으로 실시) 및 개인검사(개인적으로 실시)와는 다른 개념이다. 즉, 집단연구용 척도를 집단검사 또는 개인검사로 실시할 수 있고 개인추론용 척도 역시 그러하다. 집단연구용으로 흔히 사용되는 의견조사용 설문지는 대부분 집단으로 실시되지만 방문하거나 만나서 개인으로 실시하기도 한다. 임상/상담/건강 장면에서는 개인추론용 척도를 개인의 증상을 조사하고 증세의 진전에 따른 추적을 위한 목적에서 개인적으로 실시하는 경우가 많다. 거기에는 MMPI나 Wechsler 지능검사처럼 긴 시간을 요하는 경우도 있고 Beck 우울검사처럼 짧은 경우도 있다. 반면 산업/조직/학교 장면의 입학시험, 입사시험, 자격시험은 개인 추론용이지만 대체로 집단으로 실시된다. 앞으로 맥락이 분명할 경우 개인추론용 척도를 개인용 척도로 명명할 것이다. 개인용 척도에는 산업/조직/학교 장면에서의 입시, 입사시험, 임용/자격시험처럼 의사결정용이 있고, 임상/상담/건강 장면에서처럼 진단용이 있다. 또한 의사결정이나 진단 이전에 예비판단을 위해 선별용(screening) 검사로 사용할 수도 있다.

집단연구용 척도는 다른 개념에 대한 척도들과 함께 사용되어 학술적 경험연구에 폭넓게 기여한다. 즉, 측정되는 이론 개념의 내적 구조 및 관련 이론변수들과의 관계를 파악하는데 사용된다. 이미 일상우울척도 개발 및 타당화 보고서(Kim JN et al., 2017a)에서 17개 문항으로 구성된 척도의 타당화 작업으로서 내용 타당화, 내적 구조 파악, 및 관계구조 모형을 검증한 것이 그 예이다. 집단연구용 척도에서는 많은 개인용 심리검사들에서 제시되는 규준표를 제시하지 않는다. 즉, 집단연구용 척도에서는 점수의 분포 정보를 간단하게 제시할 뿐, 개인추론용의 안내가 필요하지 않다.

반면 개인용 척도에서는 높은 신뢰도가 요구되며 해석을 위해 규준표나 기준점수가 제시된다(Lee S, 2018, in press). 개인용 척도의 목적은 상대평가와 절대평가로 나뉘는데, 목적이 상대평가(규준참조 평가)이면 규준을 포함하여 보다 상세한 비교정보를 담고 있는 규준표를 제시하며, 그 목적이 절대평가(준거참조 평가 또는 영역참조 평가)인 경우에는 기준점수를 제시한다. 개인추론용 검사 중 의사결정 장면에서 대체로 상대평가를 사용한다. 절대평가를 하는 경우는 산업/조직/학교 장면에서 임용시험의 일부 단계 및 자격시험이 그러한데, 이때는 상대평가와 혼합된 방식을 사용하기도 한다(예: Lee S et al., 2002).

그러나 개인추론용 검사 중, 임상/상담/건강 장면에서 진단용의 검사와 선별용의 검사에서는 모두가 절대평가를 하게 된다. 내담자나 응답자 간 상대비교는 의미가 없는 정보이기 때문이다. 즉, 규준보다는 기준점수가 필요한 검사인데, 국내외의 많은 검사들이 아직은 규준을 제작하는 비용과 노력을 소비하는 현상이 지속되고 있다. 임상/상담/건강 장면에서도 진단용(예: Lee HC et al., 2007; Lee S et al., 2007) 검사라면 측정되는 차원 및 필요한 문항의 수효가 충분해야 할 것이다. 그러나 준거로서의 진단용 검사나 전문가의 판단이 있는 경우, 예비판단 내지 선별용으로는 다차원이고 문항수가 많은 원척도를 사용할 필요가 없다. 오히려 경제성이나 편리성을 중심으로 한 실용적 관점에서, 원척도의 일부를 사용하는 단축형이 필요하다. 선별용(예: Kim JN et al., 2011)이라면 단일차원으로 하고 10개 문항을 넘지 않는 것이 바람직하다. 10개 문항에 가까울수록 단일차원을 넘기가 쉽고 선별 목적의 실용성이 감소될 수 있다. 또한 다차원이면서 충분한 문항으로 원척도가 개발되었어도(예: BDI- II), 경험연구 결과 실제 구조가 단일요인 또는 쌍요인 구조(주로 일반요인 중심으로 해석)일 경우 단축하여 선별용으로 사용하는 것이 효율적일 수 있다.

우울 영역에서의 개인선별용 척도로 가장 널리 사용되는 검사인 BDI-II (Beck et al., 1996)는 미국 환자들의 경우 상관된 2개 차원(신체ㆍ정서, 인지)으로 구분되었으나(r= .66), 유럽을 포함한 서구학자들은 그 모형 대신 쌍요인 모형을 선호해 왔다(Ward, 2006; Al-Tunkait et al., 2010; Quilty et al., 2012). 전통적인 상관요인 모형 및 쌍요인(Bi-factor) 모형을 비교분석한 Brouwer et al.(2012)는 쌍요인 모형이 가장 적절한 합치도를 보이는 것으로 보고하였다. 즉, 우울 심각도라는 일반요인과, 그것을 추정하고도 남는 정보를 가지고 2∼3개의 특수요인을 추정하는 것이 가능하지만 현장에서 해석을 위해서는 일반요인 하나로도 충분하다는 것이다. BDI-II의 한국판(Kim JH et al., 2015)에서도 쌍요인 모형이 가장 우수한 모형 적합도를 보였다고 밝혔다(p.6). 이것은 하나의 개념으로 사용하는 것이 적절함을 경험적으로 보여준 것이다. 그렇다면 BDI-II 역시 하나의 일반요인만을 가지고 적은 수의 문항을 사용하는 것이 검사현장에서 실용적일 수 있다. 만약 그러한 단일차원의 단축형 척도가 원척도에 수렴하는 정도가 충분하다면 일종의 공시타당도(concurrent validity)가 될 것이다. 이와 같은 논리에서, 일상우울 집단연구용 17개 문항의 원척도(Lee S et al., 2018)를 단일 차원의 단축형 선별용 척도로 사용하는 것을 검토하게 되었다. 일상우울 집단연구용 척도가 1요인 구조(Lee S et al., 2018)로 이미 단일 차원이 확보되었으므로, 본 연구의 목적은 일상우울 집단연구용 척도를 개인선별용 검사로 단축하고, 그 검사의 기술적인 양호도를 확보하는 것이다.

연구방법

1. 연구대상

본 연구에서는 본검사와 재검사, 추가본검사로 3차례에 걸쳐 자료수집이 이루어졌다. 본검사는 전국적으로 남녀 각각 250부를 실시하였는데, 총 500부 중 473부가 회수되었다. 그 중 연령범위(만 19세∼64세)를 벗어나거나 연령 확인이 어려운 33명의 자료를 제외하여, 분석에는 총 440명의 자료가 사용되었다. 연령별로 10대, 20대, 30대, 40대, 50대, 그리고 60대가 각각 1.8%, 20.9%, 19.8%, 20.0%, 22.5%, 15.0%이었다(Table 1). 그리고 본검사 참여자 가운데 재검사에 동의한 사람들(107명)에게 재검사를 실시하였는데, 분석에 사용된 자료는 남성 44명, 여성 50명, 총 94명이었다. 추가본검사는 남녀성인 100명을 대상으로 실시되었으며 모두 분석에 사용되었다.

Demographic data of respondents (main study, n=440)

2. 연구도구

1) 일상우울 집단연구용 척도

Lee S et al.(2018)이 개발한 일상우울 집단연구용 척도 17개 문항을 원척도로 사용하였다. 이 척도는 5점 평정 척도로서 1점 ‘전혀 그렇지 않다’, 2점 ‘별로 그렇지 않다’, 3점 ‘그저 그렇다’, 4점 ‘약간 그렇다’, 5점 ‘매우 그렇다’로 반응하게 되어 있다. 점수가 높을수록 우울수준이 높음을 의미한다. 이 척도의 17개 문항에 기반하여 개인선별용 척도에 포함될 5개 문항을 선정하였다. 본 연구에서 일상우울 집단연구용 척도의 신뢰도는 본검사용 자료에서 .54, 타당화용 자료에서 .76으로 나타났다.

2) 지각된 스트레스 척도

스트레스 지각은 Cohen et al.(1983)이 개발한 척도를 Park JH et al.(2010)이 번안한 것을 사용하였다. 긍정적 지각과 부정적 지각이 각 7개의 문항으로 구성되어 있는데, 이중 부정적 지각 5개 문항을 사용하였다. 본 연구에서 지각된 스트레스의 신뢰도는 본검사용 자료에서 .77, 타당화용 자료에서 .78로 나타났다.

3) 사회적 지지

Yu E et al.(2015)의 연구에서 밝힌 사회적 지지의 4요인, 25개 문항 중 각 요인에서 요인부하량이 높은 문항을 기준으로 하여 정서적 지지 5문항과 평가적 지지 4문항, 정보적 지지 3문항, 물질적 지지 2문항 등 14문항을 사용하였다. 본 연구에서 사회적 지지의 신뢰도는 본검사용 자료에서 .84, 타당화용 자료에서 .94로 나타났다.

4) 사회경제적 지위 척도

지각된 사회경제적 지위를 측정하기 위해 본 연구팀에서 가구소득(7점 척도), 거주형태(0=자기소유 아님, 1=자기소유), 및 사회경제적 상태(6점 척도)의 3개 문항을 개발하여 사용하였다. 본 연구에서 사회경제적 지위의 신뢰도는 본검사용 자료에서 .44로 나타났고, 가구소득과 사회경제적 상태의 2개 문항만 사용한 타당화용 자료에서는 .41로 나타났다.

5) CES-D (역학적 우울) 척도

일상우울의 준거척도로서 Radloff(1977)의 CES-D 척도를 Chon KK et al.(2001)가 번안한 것에서 4개의 역문항을 제외하고 16개 문항을 사용하였다. 긍정적 정서를 측정하는 역문항들은 역방향으로 문항을 기술한 데서 오는 방법효과가 크게 포함되어 있는 것으로 판단되어, 본 연구에서는 제외하였다. 본 연구에서 CES-D의 신뢰도는 본검사용 자료에서 .85, 타당화용 자료에서 .90으로 나타났다.

3. 연구설계

집단연구용(17개 문항) 척도에서 개인선별용 척도를 구성하고자 두 가지 대안을 세웠다. 첫째는 3문항짜리 척도를 구성하고자 속성수준이 높은 5개 문항에서 3개 문항의 조합들을 정의하고 원척도와 가장 상관이 높은 조합을 구하는 것이었고, 둘째는 5문항짜리 척도를 구성하고자 속성수준이 높은 8개 문항에서 5개 문항의 조합들을 정의하고 원척도와 가장 상관이 높은 조합을 구하는 것이었다. 두 접근 가운데 공시타당도가 높은 경우를 선택하여 신뢰도, 타당도, 그리고 개인에 대한 절대평가를 위한 기준점수를 설정하였다. 본 연구는 서울여자대학교 IRB 승인(IRB-2015A-34)을 받았다.

4. 자료분석

자료분석을 위한 통계패키지는 Mplus 7.4와 SPSS 21.0을 사용하였다. SPSS 21.0을 사용하여 상관분석 및 신뢰도 분석을 하였고, Mplus 7.4를 사용하여 확인적 요인분석을 하였다. 또한 수정된 Angoff(1971) 방식에 따라 전문가들의 합의를 통해 검사점수의 해석에 사용될 기준점수를 설정하였다.

결과

1. 개인선별용 척도 문항 구성

우울 개념의 전 영역을 포괄하자면 일상우울과 역기능우울이 포함된다. 이 두 가지 우울을 측정하기 위한 일상우울척도의 문항들과 역기능우울 장면의 문항들이 가지는 문항수준 모수를 연계(linking)한 상태(Lee S et al., 2018, Table 6 참조)에서 일상우울 17개 문항의 수준을 Table 2에 제시하였다. 문항의 수준 모수를 연계하는 기법으로 공통문항 모수고정 방식에서의 평균-평균 방법(Loyd et al., 1980)을 이용해 일상우울과 역기능우울의 척도들을 동일한 측정 체계에 위치시켰다.

Fitting figure 2 to the developmental data including normal depression scale-short form

Attribute level of items of the normal depression scale (17)

개인선별용 척도는 현장에서 개인에 대하여 쉽게 반복적으로 사용하여 개인의 일상우울 상태를 점검하는데 사용하기 위한 것이다. 개인용 척도에 포함될 문항들을 선별하기 위해서 17개 문항으로 된 집단연구용 척도를 준거로 하고 3문항인 경우와 5문항인 경우의 공시타당도(concurrent validity)를 비교검토하였다. 우선 개인용 척도에 포함될 문항을 선별하기 위해서 1차 본검사 자료에서 원척도 문항의 일부를 묶어서 원척도와 비교하였다.

Table 2에서 일상우울을 측정하기 위한 집단연구용 척도(NORMAL42가 일상우울 수준 최상위 문항)를 원척도로 하여 문항의 속성들을 살펴보았다. 여기서 변수명을 가리키는 “NORMAL”은 일상우울 척도를 의미하며 속성수준이 가장 높은 NORMAL42번을 넘으면 역기능우울에 대한 문항이 된다. 역기능우울과의 경계가 되는 상위 속성수준에 있는 5개 문항들(Normal 11, 21, 22, 42, 52) 가운데 3문항씩 뽑은 다음(5C3=10개의 조합), 자료가 풍부한 1차 본검사 자료에서 원척도와의 상관을 구하였는데, 최소 .84 (Normal 11, 22, 52번의 조합)에서 최대 .89 (Normal 21, 42, 52번의 조합)까지의 공시타당도를 보였다.

한편 Table 2에서 상위 속성수준에 있는 8개 문항들(Normal 11, 17, 21, 22, 42, 43, 52, 58번) 가운데 5개씩(8C5=56개의 조합)을 뽑은 다음, 자료가 풍부한 1차 본검사 자료에서 집단연구용 척도와의 상관을 구하였는데 최소 .90 (Normal 11, 22, 42, 52, 58번의 조합)에서 최대 .94 (Normal 17, 21, 22, 43, 52번의 조합)로서 .90을 넘는 공시타당도를 보였다. 이것은 5문항 척도만으로도 원척도 분산에 대하여 최대 88%까지 설명하는 것이므로 원척도에 대하여 충분한 설명력을 가진다고 할 수 있다. 기대된 바와 같이 5개 문항인 경우가 3개 문항인 경우에 비해 높은 공시타당도를 보였다. 이에 따라 공시타당도가 가장 높았던 5개 문항, 즉 Normal17, Normal21, Normal22, Normal43, Normal52 문항을 사용해서 개인용 척도를 구성하였다. 개인선별용 척도에 대하여 본검사(N=440)에서 점수의 분포는 Fig. 1과 같다.

Fig. 1

Distribution of summed scores of five items of the normal depression scale-short form.

Fig. 1은 440명 자료에서 구한 기둥그림표(histogram)를 보여주고 있다. 간단한 형태의 규준 정보를 제공하자면, 비록 온전한 정규분포는 아니지만 그에 근접하고(대칭, 1봉 분포, 종모양) 총점이 최저 5점이고 최고 25점인 가운데, 평균은 11.04, 그리고 표준편차는 4.24이었다.

2. 신뢰도

개인용 5문항 척도의 신뢰도 계수는 .81로 높은 편이었다. 또한 검사-재검사 신뢰도(최소 35일∼최대 82일)는 기간에 따라 달랐는데, 60일 이내에 재검사가 실시된 경우 상관이 .73, 70일 이내에 실시된 경우 .70, 82일 이내에 실시된 전체에 대해서는 .63이었다. 기간이 길어질수록 점수의 안정성이 저하되는 것은 자연스러운 일이다. 개인추론용 척도의 신뢰도가 .70 아래로 내려가면 안 된다는 기준(Haertel, 2006)을 고려할 때, 2개월 이내에는 선별용 척도의 점수가 안정되어 있으므로 한 번 측정 후 2개월 이내에 높게 변화된 점수가 나오면 전문가의 도움을 받을 것을 권할 수 있다.

3. 타당도

가장 최근인 2014년의 검사표준서(AERA, APA, & NCME, 2014)와 그 이전 판인 1999년의 검사표준서(AERA, APA, & NCME, 1999)에서 타당도에 대한 일관된 개념은 ‘타당도 논변(argument)’이다. 즉, 검사점수의 정확성은 물론 그에 대한 ‘올바른’ 해석을 넘어 그것이 과연 증거와 이론에 의해 지지되는지에 대하여 객관적으로 평가하는 ‘논변(argument)’을 통해서 타당도가 확립된다는 관점이다. 그러한 논변을 위해서는 Cronbach(1988)이 제시한 다섯 가지 관점에서의 타당도 정의를 살펴볼 필요가 있다.

첫째, 측정실무적 관점(operationist perspective)에서의 타당도는 검사에서 측정되는 개념에 대하여 측정이 가능한 실무적, 구체적 정의가 제시되는 정도를 의미한다. 본 연구에서는 개인선별용 검사의 실무를 위한 문항들을 개발하고 조사와 분석을 실시하였으며, 채점 및 해석을 위한 교본 작성(Kim JN et al., 2017b)을 통해 지침을 제공하고 있다. 그러한 정보의 제시는 검사점수가 진실 즉, 검사를 통해 측정하고자 하는 개념인 일상우울에서 벗어나지 않도록 하는 안내가 될 것이다.

둘째, 기능적 관점(functional perspective)에서의 타당도는 검사점수가 가치(worth) 있는 정도를 의미한다. 이 가치 개념은 진실 개념보다 넓은 개념으로서, 검사가 개인이나 집단에 실시된 결과에 좋은 효과가 있는 것은 물론 부정적인 효과가 없는 정도까지 고려해야 온전한 타당화라고 할 수 있다(Messick, 1980). 이러한 관점에서 볼 때, 본 연구에서는 역기능 중심의 우울연구를 공중보건 및 건강 영역까지 확장하여 일반인 개인을 대상으로 쉽게 반복적으로 실시하여 일상우울의 수준을 파악할 수 있는 기능을 목표로 하였다. 한편 경우에 따라 역기능우울의 가능성이 있는 사람에게 더욱 정확한 판단을 위해 역기능우울 척도의 실시를 권함으로써 후속단계의 관리를 이끌어낼 수 있는 연계적 역할이 가능하다는 점에서 폭넓은 기능을 가지고 있다.

셋째로, 정치적 관점(political perspective)에서의 타당도는 진실이나 가치보다는 정치적, 법적 과정에서의 공정성이 보장되는 정도를 의미한다. 일상우울 개인선별용 척도 역시 장기적으로 남/녀 차별, 내국인/외국인 차별, 연령 차별 등과 같은 정치적 관점에서의 공정성을 확보하는 것이 필요하다. 즉, 수검자 집단을 차별하지 않는 문항 및 검사가 되어야 한다. 그러나 일상우울은 이제 막 개념의 정립을 위한 연구가 시작된 상태이므로 그러한 정치적 수준의 공정성까지 연구가 진행되기에는 좀 더 시간이 필요하다.

넷째로, 설명적 관점(explanatory perspective)에서의 타당도는 검사에 의해 측정되는 개념이 다른 개념들에 의해서 잘 설명되는 정도를 의미한다. 이 설명을 위해서는, 검사에서 측정되는 개념을 ‘주장되는 개념’이라고 할 때 이를 둘러싼 이론적 관계를 가급적 명시적으로 제시하고 그것을 부정할 수 있는지를 탐색하는 것이다. 부정이 되면 설명이 안 되는 것이고, 주장되는 개념을 측정하기 위한 검사의 타당도 역시 약화된다. 본 연구에서는 일상우울 선별용 척도가 선별용으로서의 측정실무적 및 기능적 측면에서 타당함을 넘어서, 학술적으로는 일상우울의 구성개념 정립에도 기여할 수 있도록 설명적 관점에서의 타당도를 확립하는 것을 중심으로 하였다. 거기에는 내용 관련의 타당도 증거, 내적 구조 관련의 타당도 증거, 그리고 구성개념 및 준거 관련의 타당도 증거를 포함하였다.

마지막으로, 타당도에 대한 다섯째 관점은 경제적 관점이다. 이것은 산업 및 조직심리학에서 일찍이 검사의 타당도를 조직에 대한 재정적 이익으로 환원하여 검사의 금전적 가치를 산출하는 것에 기반을 둔 관점이다. 일상우울척도는 산업장면에서의 선발 및 의사결정에 쓰이는 것은 아니므로 경제적 관점의 타당도를 이야기하기에는 아직 이르다.

1) 내용관련 타당도

내용타당도는 심리적 속성이 포괄하는 전체 영역에서 대표적이고 중요한 부분들이 검사에 문항으로 포함된 정도를 가리키는데(Lee S, 2018, in press), 그 ‘정도’는 전문가의 질적인 판단에 따르므로 계량적 의미는 아니다. 일상우울 선별용 척도의 내용타당도는 원척도인 집단연구용 척도의 내용타당도에 의존한다. 일상우울 집단연구용 척도를 개발하면서 이론적 개념화와 경험적 접근을 통해 일상우울의 영역에서 대표적이고 중요한 부분을 문항으로 포함하고자 하였다. 상세한 내용은 Lee S et al.(2017)에 제시되어 있으나, 간략한 소개를 통해 원척도가 내용타당도가 있으며 일상우울 선별용 척도의 내용적 모체가 됨을 밝히고자 한다.

일상우울 집단연구용 척도의 이론적 개념화는 2014년 심리학회 발표(Lee S, 2014)에서 출발하였다. 일상우울의 이론적 토대는 우울(depression)이라고 하는 행동과학적 개념의 연속선상에서 ‘일반인들이 일상생활에서 자주 경험하는 우울상태’(Lee S et al., 2017, Table 1 참조)로서 ‘울적함’을 원형(prototype)으로 한다. Lee S et al.(2017)은 일상우울에 대한 일반적 특징뿐만 아니라 개별적 특징으로서 촉발 및 위험요인, 양상, 기능수준, 지속기간, 및 회복 가능성으로 나누어 특징들을 제시하였다. 한편 일상우울 자체의 구성개념이 포괄하는 영역을 탐색하고자 DSM-5 (American Psychiatric Association, 2013), 우울증 선별에 가장 널리 사용되는 척도인 BDI-II (Beck et al., 1996), 긍정 및 부정 정서 문헌(예: Watson et al., 1988), 긍정 및 부정 사고 문헌(예: Ingram et al., 1988)에 반영된 일상우울의 개념들을 추출하였다(Lee S et al., 2017, Table 2).

이러한 틀을 유지한 가운데 경험적 접근으로 일반인들의 우울 경험과 그에 대한 표현을 조사하였다. 19개 검사용 개념과 일반인 초점집단면접 녹취록을 비교하면서 가급적 현장의 표현이 생생하게 담긴 문장으로 예비문항들을 개발하였다. 예비문항 개발과정과 예비검사, 본검사 분석 결과는 Lee S et al.(2018)에 소개되어 있다. 처음에 개발된 예비문항들은 75개였으나, 연구팀 내에서의 논의와 연구팀 밖의 17명 임상심리전문가들에 의한 적절성 판단 결과를 토대로 67개로 축소하였다. 67개 예비문항으로 실시된 예비검사에서 남녀 공통으로 적절하다고 판단된 29개 문항이 선정되었고 본검사 결과 집단연구용 17개 문항으로 축소되었다. 이렇게 내용타당하게 개발된 집단연구용 척도를 바탕으로 하여 본 연구에서 공시타당도가 높은 문항들로 개인선별용 척도를 구성하였다. 개인용 척도의 문항들이 기존의 우울관련 척도인 CES-D (Radloff, 1977; Chon KK et al., 2001가 한국어 번안)와 한국우울증 척도(Korea Depression Scale, KDS; Lee MS et al., 2003), 그리고 일상우울 개념 틀(Lee S et al., 2017, Table 2)과 비교하여 어떻게 문항의 내용에서 유사성과 차별성이 있는지를 Table 3에 제시하였다.

Theoretical linking of 5 items of the normal depression scale-short form

Table 3을 보면, 일상우울 개인용 척도는 CES-D 및 KDS에서의 1개 문항과 유사하고 나머지는 독자적인 문항들이다. CES-D와 KDS 중 어느 것도 개발 목적이 일상우울 중심은 아니었기에 동일한 문항은 전혀 없으며 유사문항으로서 행동적ㆍ사회적 철수를 나타내는 1개(‘말수가 줄었다’)가 있을 뿐이다. 그만큼 일상우울 선별용 척도는 CES-D 및 KDS와 충분히 차별적인 내용을 가지고 있다. 또한 일상우울의 개념 틀과 비교할 때 ‘인지/정서/행동/사회적 위축 및 자기관리 약화’ 라는 내용 영역을 잘 표상하고 있음을 알 수 있다.

2) 내적 구조 관련 타당도

일상우울 개인용 척도의 요인분석을 통해서 5개 문항들이 과연 어떻게 하나의 이론 개념으로 수렴하는지를 보이는 것이 내적 구조 관련 타당도의 증거가 된다. 1차 본검사 자료(N=440)에서 5개 문항 간 요약 자료는 Table 4와 같다.

Basic information of the normal depression scale-short form

Table 4를 보면, 평균은 1.93∼2.59로, 대체로 2점(=별로 그렇지 않다)과 3점(=그저 그렇다) 사이에 있고 표준편차는 1점을 약간 넘는데, 17문항인 집단연구용 척도의 자료(Lee S et al., 2018)와 유사하다. 상관은 모두가 다분상관이며 .45∼.64로 17개 문항의 경우와 유사하다. 이미 집단연구용 척도가 1요인의 구조를 가지므로 개인용 척도가 더 많은 요인을 가지기는 어렵다. 따라서 요인구조를 탐색하지 않고 타당화용 자료(N=194)에 1요인의 확인적 요인분석을 실시하였다. 그 결과(Table 5), 5개 문항은 1요인으로 잘 수렴하고 있고(요인분산=.40) 전반적 합치도 역시 무난하다. χ2=14.742 (p=.0115), RMSEA=.102 (.044∼.164), CFI=.990, TLI=.980, WRMR=.476. 그리고 수정지수(MI)가 10을 넘는 경우는 없었다. 이것으로 일상우울 개인용 척도에 대한 내적 구조는 1요인 구조이고, 측정오차 간 유의한 상관이 없어 특별히 문항들 간 방법 효과의 공유는 없다고 할 수 있다. 즉, 개인선별용 척도에 대한 내적 구조가 타당하다고 할 수 있다.

4. 일상우울 관련 변수들과의 관계구조 검증

집단연구용 척도를 가지고 관계모형 개발을 위해 탐색한 결과(본검사용 자료 사용) Fig. 2와 같은 관계구조 모형이 얻어졌고, 타당화용 자료(재검사 자료 및 추가 본검사 자료)에서 Fig. 2의 모형을 다시 탐색하였으나 유사한 모형인 Fig. 3의 형태로 종결되었다(Kim JN et al., 2017). 이에 다른 변수들과의 관계에 기초한 일상우울 단축형 척도의 타당화(구성개념 및 준거관련의 타당도 검증이 됨)를 검토하기 위해 Fig. 2와 3의 ‘일상우울’에 대한 측정치로서 단축형 5문항을 사용하여 분석하였다. 이때 지각된 스트레스(5문항), 사회적 지지(14문항), 및 역학적 우울(16문항)에 대해서는 문항 전체의 총점을 측정치로 사용하기보다는 2개 정도의 측정치를 구성하여 사용하는 것이 측정오차의 통제 및 모형의 합치도를 높일 수 있다(Little et al., 2002 참조). 이에 따라 Fig. 2에서 사회경제적 지위(3문항)와 일상우울(5문항)은 원문항들을 개별 측정치로 사용하였고, 나머지 요인들은 문항묶음을 통해 2개씩의 측정치를 사용하였다.

Fig. 2

Model among variables related to the normal depression in the developmental data.

Fig. 3

Model among variables related to the normal depression in the validation data.

1) 관계구조 모형 개발

먼저 본검사용 자료를 사용하여 모형검증을 실시하였다. 집단연구용 척도를 사용하여 탐색된 모형에 개인선별을 위한 일상우울척도의 단축형 5개 문항들을 사용하여 분석한 결과는 Fig. 2, Table 6과 같다. Fig. 2Table 6을 보면, 집단연구용 결과(Kim JN et al., 2017a)와 비교할 때 일상우울의 척도로서 5문항의 단축형 척도를 사용하면서 전반적 합치도가 약간씩 낮아졌다. 그러나 큰 차이는 없으므로 5문항 척도를 사용해서 관련 변수들과의 관계구조를 검증하는데 적절한 수준이었다. 표준화 해에서 요인계수들과 측정치의 신뢰도 역시 큰 변화가 없고 단지 ‘일상우울’에 대한 측정치들의 신뢰도 평균이 집단연구용 척도를 사용한 분석에 비해 저하되었다(.76에서 .54로 저하). 일상우울 척도의 신뢰도가 낮아짐에 따라 일상우울의 R2와 역학적 우울(CES-D)의 R2가 약간씩 저하되었다. 이것은 개인선별용 척도의 실용적 가치를 위해 문항의 수효가 1/3 이하로 감소된 것에 따른 비용이라고 할 수 있다.

요약하면, 일상우울척도의 단축형을 사용한 경우에도 관련변수들과의 모형검증은 집단연구용 척도를 사용하는 것과 유사하게 적절한 결과를 산출하므로 단축형 척도의 타당도에 대한 또 하나의 증거라고 할 수 있다.

2) 타당화용 자료에서의 모형검증

타당화용 자료(재검사 자료 및 추가 본검사 자료)를 사용하여 모형 검증을 실시하였다. 집단연구용 척도를 타당화용 자료에서 검증한 모형인 Fig. 3에 일상우울척도의 단축형 5문항을 사용하여 분석하였다. 그 결과를 Fig. 3Table 7에 제시하였다.

Fitting figure 3 to the validation data including normal depression scale-short form

Fig. 3Table 7을 보면, 집단연구용 결과(Kim JN et al., 2017a)와 비교할 때 타당화 자료에서도 일상우울 집단연구용 17개 문항 대신 개인선별용 5문항을 사용해도 전반적 합치도에 큰 변화가 없다. 표준화 해에서 요인계수들과 측정치의 신뢰도 역시 큰 변화가 없고 단지 일상우울에 대한 측정치의 신뢰도만이 집단용척도를 사용한 분석에 비해 저하되었다(.90에서 .76으로 저하). 본검사 자료를 사용하여 모형 검증을 하였을 때와 달리 이번에는 일상우울의 R2는 약간 상승하였고 역학적 우울의 R2는 약간 감소하였다. 즉 문항의 수효가 1/3 이하로 감소되어도 크게 변화가 없는 결과이다. 결론적으로 타당화 자료에서도 일상우울척도의 단축형을 사용해서 관련 변수들과의 모형을 검증할 때, 집단연구용 척도를 사용하는 것 못지 않게 적절한 결과가 산출되었다. 이것 또한 개인용 척도의 타당도에 대한 또 하나의 지지 증거라 할 수 있다.

5. 기준점수 설정

12명의 임상심리전문가들에게 준거(영역)참조검사에 대한 안내를 한 다음, 수정된 Angoff(1971) 방식에 의해 응답자를 두 범주, 즉 일상우울과 역기능우울로 구분하는데 사용될 기준점수 설정 연습을 실시하였다. 이후 기준점수 설정을 위해 2회의 평정을 실시하였다. 범주는 일상우울(0수준)과 역기능우울(1수준)이었다. 우선 일상우울과 역기능우울의 개념적 이해를 위해 각 우울의 특성들(Lee S et al., 2017, Table 1)을 소개하였다.

특성집합에 대한 소개 및 토론이 있은 후에 1수준에 해당되는 가장 마지막 사람(또는 0과 1수준의 경계에 있는 사람) 100명을 가정하고 개인용 척도의 문항별로 1(전혀 그렇지 않다), 2(별로 그렇지 않다), 3(그저 그렇다), 4(약간 그렇다), 5(매우 그렇다)의 각 눈금에 해당되는 사람이 몇 명이 될지를 응답하게 하였다. 그 사람 수를 100으로 나누면 비율 즉 확률의 추정치가 된다. 이 값을 눈금의 값과 곱한 후 더하면 문항별로 기대치가 된다. 그것을 12명의 전문가에 대해서 구한 후 평균을 구한 것이 해당 문항의 점수(Table 8에서 문항별 평균)가 되고 5개 문항에 대해서 합산을 하면 개인용 척도에서 0수준과 1수준을 가르는 기준점수가 된다. 1회기와 2회기에 대한 결과를 Table 8에 제시하였다.

1st and 2nd round for standard score setting (n=12)

Table 8을 보면, 1회기에서 2회기로 진행함에 따라 문항별 전문가들 응답의 표준편차가 감소되어 일치도가 높아졌음을 알 수 있다. 또한 평균의 합산은 17.26에서 17.67로 약간 높아졌다. 본 연구에서는 기준점수를 18점으로 하고 0~17점인 응답자는 일상우울 또는 건강한 상태이며, 18점부터는 일상우울을 넘어 역기능우울의 가능성이 있는 것으로 결정하였다. 따라서 총점 18점 이상인 경우에는 더 정확한 우울수준 평가를 위해 이후 역기능우울척도를 실시할 것을 권장한다. 참고로 12명의 전문가들이 1회기와 2회기에 걸쳐서 5개 문항에 대한 총점 변화는 Fig. 4와 같다. Fig. 4를 보면, 대체로 2회기에는 전체 평균에 좀 더 근접하는 방향으로의 움직임을 보였다.

Fig. 4

Summed scores of five items judged by 12 panels in the 1st and 2nd rounds.

고찰

본 연구에서는 17개 문항의 일상우울 집단연구용 척도(Lee S et al., 2018)를 기반으로 하여 5문항의 개인선별을 위한 일상우울 단축형 척도를 개발하였다. 이를 위해 만 19∼64세의 성인 남녀를 대상으로 자료수집이 이루어졌으며, 17개 문항 중 공시타당도가 가장 높았던 5개 문항으로 개인선별용 단축형 척도를 구성하였다. 일상우울 단축형 척도의 점수 범위는 5∼25점이고 평균은 약 11점, 표준편차는 약 4점으로 나타났다. 신뢰도와 타당도를 검증한 결과, 5문항 단축형 척도의 검사-재검사 신뢰도(2달 간격)는 .73으로 양호한 수준이었으며, 내적 구조는 1요인 모형으로 확인되었다. 기준점수 설정을 위한 전문가 워크샵을 통해 5∼17점은 일상우울, 18점 이상은 역기능우울의 가능성이 있는 것으로 결정되었다. 본 척도는 학교, 건강, 산업 및 조직, 상담 등의 현장에서 일반인이 일상생활에서 쉽게 경험하는 우울상태를 신속하게 평가, 선별하는데 사용될 것으로 기대된다.

본 연구의 의의는 다음과 같다. 첫째, 집단연구용 일상우울척도를 기반으로 현장에서 개인에게 신속하게 적용할 수 있는 일상우울 단축형 척도를 개발한 것을 의의로 들 수 있다. 단축형 척도는 선별용으로서뿐만 아니라, 집단연구용의 조사나 학술연구에서도 요구되고 있다. 즉, 충분한 차원과 문항이 요구되는 집단연구에서도 비용은 차치하고, 응답자의 시간과 인권의 문제를 고려한다면 지나치게 많은 차원과 문항들을 사용하는 것이 점차 어려워지고 있다. 응답자들에게 아무리 보상을 충분히 해도 장시간 응답하는 고통을 선뜻 감내하려 하지 않을 뿐만 아니라, 연구와 치료에 필요하다고 해도 환자와 가족들에게 수백 문항씩 되는 척도에 응답할 것을 요구하는 것은, 강화되고 있는 연구윤리를 고려할 때 우려되는 부분이다. 그에 따라 단축형 척도의 극단이라고 할 수 있는 1개념-1문항 척도가 오래 전부터 대안으로 연구되고 있다(예, Scarpello et al., 1983; Sackett et al., 1990; Aron et al., 1992; Robins et al., 2001; Postmes et al., 2012). 물론 단일문항 척도가 사용되기 위한 조건은 구성개념이 좁게 정의되고 전반적 의미를 담는 문항이어야 한다는 어려움이 있으나, 3∼5개 정도의 소수의 문항만으로도 원척도 분산의 90% (상관으로는 .95 이상) 이상을 설명한다면 간단한 절차와 신속한 사용을 필요로 하는 다양한 장면에서 수용 가능한 수준으로 판단된다. 원척도 분산 가운데 단축형에 의해 설명이 되지 못하는 차이는 척도 사용자의 내용 전문성의 몫이라고 할 수 있다.

둘째, 타당화 작업을 통해 신뢰도와 타당도가 비교적 양호함을 밝혔다. 5개 문항으로 된 개인선별용 척도의 신뢰도는 아주 높지는 않지만 무난한 수준으로 나타났다. 내용 관련 타당도는 개인선별용 척도 문항 선정의 기반이 되는 원척도(17문항)의 내용타당도에서 상당 정도 제공되고 있다. 또한 일상우울 단축형 척도의 내적 구조 관련 타당도(1요인 모형)와 준거관련 타당도가 양호한 수준으로 검증되었다.

셋째, 전문가 기준점수 설정 워크샵을 통해 일상우울과 역기능우울 수준을 구분할 수 있도록 기준점수를 설정하였다. 총점이 18점 이상일 경우 역기능우울의 가능성이 있으므로 역기능우울척도를 실시하여 더 정확한 우울수준을 평가할 필요가 있으며 이후 적합한 조치가 필요할 수 있다.

마지막으로, 실용성 측면에서 볼 때 이 척도는 높게 평가된다. 실용성은 경제성과 편의성(convenience)으로 나뉘는데(Lee S, 1999), 경제적 실용성은 시간적, 금전적 측면에서 평가되고 편의적 실용성은 실시 지침의 명료성, 사용 절차의 간단함이라고 할 수 있다. 본 연구에서 개발한 개인선별용 척도는 건강/상담/산업/조직/학교 현장에서 매우 중요한 시간적 경제성뿐만 아니라, 사용 절차의 간단함과 그로 인하여 개인에게 반복 사용의 용이함이라는 편의적 실용성이 크게 부각되는 척도이다. 그 동안 의사결정용 및 진단용 척도를 선별용으로 겸하여 사용해 온 관행(예: 산업장면에서 MMPI를 선별용으로 사용)을 벗어나 용도에 따라 선택을 달리하는 정교한 사용을 추구할 시점이 되었다.

이러한 의의에도 불구하고 본 연구의 제한점과 앞으로의 연구방향에 대한 제언은 다음과 같다. 첫째, 본 연구에서 검사-재검사 신뢰도가 예상보다 높지 않았다. 본 연구에서는 집단연구용 척도의 일부로 사용된 문항들로 개인용 척도를 구성하여 계산한 것이므로 집단연구용 척도의 나머지 문항들이 맥락으로 작용하여 동일 방법효과를 가져왔을 가능성이 있다. 따라서 추후 연구에서 이러한 맥락의 개입이 없는 가운데, 개인용 척도를 2회에 걸쳐 실시하고 검사-재검사 신뢰도를 산출해 볼 필요가 있다. 공시타당도를 구하기 위한 가장 좋은 방법은 원척도인 집단연구용 척도와 단축형인 개인선별용 척도를 동일한 사람들에게 시간차를 두고 실시하여 두 척도 간 상관을 공시타당도로 보고하는 것인데, 본 연구에서는 그렇게 하지 못하였다. 추후 연구에서 공시타당도를 보다 적절하게 구할 필요가 있다.

둘째, 본 연구에서는 전문가들의 워크숍을 통해서 기준점수를 설정하는 것까지는 포함하였으나 현장에서 개인의 척도점수를 기준점수와 비교하여 역기능우울의 가능성 여부를 판단한 것과, 전문가가 면담을 통해 판단한 결과 간 일치도의 신뢰도를 구하지는 못하였다. 이 신뢰도가 기준점수의 신뢰도이자 일종의 임상적 타당도로서 타당화 논변이라는 큰 틀에서 보면 측정실무적 측면이라고 할 수 있다. 그런데 아직은 일상우울에 대한 경험 연구 및 구성개념 정립이 보다 시급히 요구되는 시점이므로, 측정실무적 측면이 어느 정도는 희생되면서 설명적 관점에서의 타당화가 강조된다. 개념 정립의 노력이 진행되는 가운데 측정실무적 관점을 완벽하게 추구하는 것은 실용성이 저하되기도 하고, 설명적 관점에서 이루어지는 구성개념의 타당화에 의해 제약을 받을 수 밖에 없다는 한계를 가지고 있다. 따라서 기준점수의 임상적 타당화의 일부가 되는 ROC 분석 및 그에 따른 척도의 민감도와 특이도를 산출하는 것은 차후의 연구 과제로 미루어 졌다.

끝으로, 긍정 인지와 정서, 긍정적 기분의 유지 또는 기분반응성에 대한 개념화가 원척도에 포함되지 않았고 따라서 개인선별용 척도에도 포함되지 않은 것 역시 제한점이다. 긍정 인지와 정서가 일상우울의 개념 틀에 포함되어 있으며, 일상우울에는 긍정 측면이 어느 정도 유지되기에 역기능우울과 구분된다는 관점을 취하였으나, 경험적으로 이를 검증하지는 못하였다. 향후의 일상우울 연구에서 초점집단면접을 실시할 경우 긍정 인지와 기분, 기분반응성을 질문하여 이 부분을 좀더 적극적으로 탐색할 필요가 있다.

그런데 여기서 긍정 인지와 정서가 일상우울 척도에 어떻게 포함될 수 있는가에 대한 논의가 필요하다. 왜냐하면 국내 연구에서 문항 내용 중 긍정 기분을 포함시킬 경우 긍정 문항이 하나의 요인으로 묶이는 경우가 많았기 때문이다. 미국 자료의 분석에서는 CES-D의 역문항들(4-good, 8-hopeful, 12-happy, 16-enjoy)은 ‘긍정 기분’ 요인에만 지표가 되지 않고 일부(12, 16번)는 ‘울적한 기분’에도 지표가 되었다(Radloff, 1977, p. 398). 그러나 국내에서는 온전히 하나의 요인에만 지표로 나타났다(Chon KK et al., 1992, p. 68; 본 연구에서도 예비검사, 본검사 분석에서 모두 그러하였음). 특히 일상우울 예비검사와 본검사 분석에서 Radloff(1977)의 4요인 모형에 대한 확인적 요인분석을 실시했을 때 Radloff의 연구에서와 달리 12번, 16번 문항이 ‘울적한 기분’에는 유의한 지표가 되지 않았다. 따라서 Radloff의 역문항 4개 문항은 모두가 하나의 요인에만 지표가 되어, 이것을 ‘긍정 기분’이라는 내용요인으로 해석하기 어렵고 단지 ‘역방향 물음방식’에서 오는 방법요인으로 밖에는 해석할 수가 없었다. 이러한 결과는 이론적으로 중요한 시사점이 있다.

즉, 본 연구에서 K-CES-D의 방법요인(역문항)의 분산도 유의했고 나머지 3개 내용요인의 분산도 각각 유의했으나, 3개 내용요인 간 상관은 대체로 0.8 이상이었고 방법요인과 내용요인들 간 상관크기는 .5가 안되거나 크게 초과하지 못하였다. 이것은 내용요인이 하나의 큰 개념으로 수렴하되, 방법요인은 그와 함께 수렴하지 않음을 의미한다. 이러한 경우 합산적 복합개념의 설정이 필요한데, 이는 보다 고난도의 이론적 방법론적 작업을 수반한다(수렴적 복합과 합산적 복합에 대해서는 Johnson et al., 2011 참조). 이렇듯 복잡한 모형검증의 필요성이 시사됨에 따라 긍정 방향의 문항들에 대해서 본 연구에서는 마무리할 수 없는 두 가지 연구방향이 도출되었다. 첫째는 긍정방향 문항들이 가지는 방법효과와 내용효과를 어떻게 분명히 구분할 수 있는가에 대한 것이고, 둘째는 내용적으로 정적 인지/정서 요인이 일상우울의 연구 틀에 포함될 경우 부적 기분 요인들과 복합되어 일상우울로 구성되는 복합모형을 어떻게 검증할 것인가에 대한 것이다. 현재는 긍정 측면의 문항들이 상당 정도 방법효과를 포함하고 있다는 것, 그러나 이론적으로는 합산적/곱산적 복합개념의 정의 및 개념화를 통해 일상우울을 구성하는 하나의 내용이 되는 것을 감안하여 분석하는 새로운 도전을 해야 하는 시점이다. 즉, 긍정 인지/정서를 일상우울의 부분으로 개념화하는 과정은 단순히 문항 개발 및 측정으로 끝나지 않고 이론적-방법론적인 도전을 동시에 필요로 한다.

References

Amabile TM. Creativity in context 1996. Boulder, CO: Westview. doi:10.4324/978020335796595_chapter_7.
American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (AERA, APA, & NCME). Standards for educational and psychological testing 1999. Washington, D. C: American Educational Research Association.
American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (AERA, APA, & NCME). Standards for educational and psychological testing 2014. Washington, D. C: American Educational Research Association.
American Psychiatric Association. Diagnostic and statistical manual of mental disorders-Fifth edition (DSM-5). American Psychiatric Association 2013;
Al-Turkait FA, Ohaeri JU. Dimensional and hierarchical models of depression using the Beck Depression Inventory–II in an Arab college student sample. BMC Psychiatry 2010;10:60–74. doi:10.1186/1471-244X-10-60. 10.1186/1471-244X-10-60. 20670449. PMC2918548.
Angoff WH. In : R. L Thorndike, ed. Scales, Norms, and Equivalent Scores. Educational Measurement 1971. 2nd edth ed. p. 508–600. Washington, D.C: American Council on Education.
Aron A, Aron EN, Smollan D. Inclusion of other in the self and the structure of interpersonal closeness. Journal of Personality and Social Psychology 1992;63(4):596–612. doi:10.1037/0022-3514.63.4.596. 10.1037/0022-3514.63.4.596.
Beck AT, Steer RA, Brown GK. BDI-II: Beck Depression Inventory Manual 1996. 2nd edth ed. San Antonio. TA: Psychological Corporation.
Brouwer D, Meijer RR, Zevalkink J. On the factor structure of the Beck Depression Inventory-II: G is the key. Psychological Assessment 2012;25(1):136–145. doi:10.1037/a0029228. 10.1037/a0029228. 22800089.
Chon KK, Choi SC, Yang BC. Integrated adaptation of CES-D in Korea. Korean Journal of Health Psychology 2001;6(1):59–76.
Chon KK, Rhee MK. Preliminary development of Korean version of CES-D. Korean Journal of Clinical Psychology 1992;11(1):65–76.
Cohen S, Kamarck T, Mermelstein R. A global measure of perceived stress. Journal of Health and Social Behavior 1983;24:385–396. doi:10.2307/2136404. 10.2307/2136404. 6668417.
Cronbach LJ. In : H Wainer, H. I Braun, eds. Five Perspectives on Validity Argument. Test Validity 1988. NJ: LEA. p. 3–17.
Haertel EH. Reliability. In : R Brennan, ed. Educational Measurement 2006. 4th Edth ed. Westport, CT: American Council on Education and Praeger Publishers.
Ingram RE, Wisnicki KS. Assessment of positive automatic cognition. Journal of Consulting and Clinical Psychology 1988;56(6):898–902. doi:10.1037/0022-006X.56.6.898. 10.1037/0022-006X.56.6.898. 3204200.
Johnson RE, Rosen CC, Chang CH. To aggregate or not to aggregate: Steps for developing and validating higher-order multidimensional constructs. Journal of Business Psychology 2011;26:241–248. doi:10.1007/s10869-011-9238-1. 10.1007/s10869-011-9238-1.
Jung S, Lee S, Lee YS, et al. Development of a short form of the MMPI scale 2 using full-information item factor analysis. Korean Journal of Psychology: General 2011. 30(3)811–830. http://uci.or.kr/G704-001037.2011.30.3.008 .
Kim JH, Lee EH, Hwang ST, et al. K-BDI-II manual. Korea Psychology Corporation 2015;
Kim JN, Lee HP, Lee S. Development of a family scale for detecting gambling problems in family members. Korean Journal of Psychology: General 2011. 30(1)135–168. http://uci.or.kr/G704-001037.2011.30.1.010 .
Kim JN, Lee S, Choi SW, et al. Development of a culture-based depression model for Korean, and development and validation of a screening tool based on it: Report on the development of a normal depression scale. (unpublished) 2017a. Industry-University Cooperation Foundation, Seoul Women's University.
Kim JN, Lee S, Choi SW, et al. Manual of the normal depression scale for users. (unpublished) 2017b;Industry-University Cooperation Foundation, Seoul Women's University;
Lee HC, Choi YK, Lee S, Ban JC, et al. Development of a self-report scale for measuring behavioral symptom of adult's pathological internet use. The Korean Journal of Clinical Psychology 2007;26(3):765–791. doi:10.15842/kjcp.2007.26.3.014. 10.15842/kjcp.2007.26.3.014.
Lee MS, Rhee MK. A development of Korea depression scale. Journal of Korean Neuropsychiatry Association 2003. 42(4)492–506. http://uci.or.kr/G704-001050.2003.42.4.011 .
Lee S. Quality of standardized psychological testing: investigation of 13 test instruments. Korean Journal of Psychology: General 1996;15(1):1–25.
Lee S. Integrated view on the functions and methods of interview as a part of college admission procedure. Korean Journal of Industrial and Organizational Psychology 1999;12(1):55–76.
Lee S. Proposal of a depression scale fitting to a behavioral scientific and Korean culture-oriented model. In C. C. Kim, J. N. (Development of a behavioral scientific model and proposal of a Korean culture-oriented scale for depressive domain). 2014 Annual Conference of Korean Psychological Association 2014. 2014(1)Korean Psychological Association, Ehwa Womans University; Seoul: 2014.8, 112. Retrieved from http://www.koreanpsychology.or.kr/publication/thesisSearch.asp .
Lee S. In : Park Y, Park K, Choi Y, Oh H, Hah E, Lee S, Kim E, eds. Measurement Theory of Psychological Tests. Chapter 2 in 'Theory and Practice of Psychological Assessment' 2018. Seoul: Hakjisa.
Lee S, Ban JC, Lee HC, et al. A shift from norm-referenced evaluation to domain-referenced evaluation in diagnosis of internet-addiction. The Korean Journal of Clinical Psychology 2007;26(1):213–238. doi:10.15842/kjcp.2007.26.1.013. 10.15842/kjcp.2007.26.1.013.
Lee S, Kim JN, Chae JM, et al. The development and validation of the normal depression scale. The Korean Journal of Clinical Psychology 2018;37(3):411–430. doi:10.15842/kjcp.2018.37.3.011. 10.15842/kjcp.2018.37.3.011.
Lee S, Kim JN, Choi SW, et al. New directions for depression studies: Introduction of behavioral science approach. Journal of Psychology: General 2017;36(3):293–323. doi:10.22257/kjp.2017.09.36.3.293. 10.22257/kjp.2017.09.36.3.293.
Lee S, Kim MS, Kim CT, et al. Development of evaluation factors for electing government manager. Korean Journal of Industrial and Organizational Psychology 2002;15(3):23–47.
Loyd BH, Hoover HD. Vertical equating using the Rasch model. Journal of Educational Measurement 1980;17:179–193. doi:10.1111/j.1745-3984.1980.tb00825.x. 10.1111/j.1745-3984.1980.tb00825.x.
Lówe B, Kroenke K, Grafe K. Detecting and Monitoring depression with a two-item questionnaire (PHQ-2). Journal of Psychosomatic Research 2005;53:163–171. doi:10.1016/j.jpsychores.2004.09.006. 10.1016/j.jpsychores.2004.09.006. 15820844.
Mehrens WA, Lehmann IJ. Standardized Tests in Education 1980. 3rd Edth ed. New York: Holt, Rinehart, and Winston.
Messick S. Test validity and the ethics of assessment. American Psychologist 1980;35:1012–1027. doi:10.1037/0003-066X.35.11.1012. 10.1037/0003-066X.35.11.1012.
Park J, Seo YS. Validation of the Perceived stress scale (PSS) on samples of Korean university students. Journal of Psychology: General 2010. 29(3)611–629. http://uci.or.kr/G704-001037.2010.29.3.007 .
Yu EK, Seol HS. Factorial structure of the social support scale. Survey Research 2015. 16(1)155–184. http://uci.or.kr/G704-001342.2015.16.1.006 .
Postmes T, Haslam SA, Jans L. A single-item measure of social identification: reliability, validity, and utility. British Journal of Social Psychology 2012;52:597–617. doi:10.1111/bjso.12006. 10.1111/bjso.12006. 23121468.
Quilty LC, Zhang AZ, Bagby RM. 2012;The latent symptom structure of the Beck Depression Inventory–II in outpatients with major depression. Psychological Assessment 2012;22:603–608. doi:10.1037/a0019698. 10.1037/a0019698. 20822272.
Radloff LS. The CES-D scale: A self-report depression scale for research in the general population. Applied Psychological Measurement 1977;1:385–401. doi:10.1177/014662167700100306. 10.1177/014662167700100306.
Robins RW, Hendin HM, Trzesniewski KH. Measuring global self-esteem: construct validation of a single-item measure and the Rosenberg self-esteem scale. Personality and Social Psychology Bulletin 2001;27(2):151–161. doi:10.1177/0146167201272002. 10.1177/0146167201272002.
Sackett PR, Larson JR Jr. Research strategies and tactics in industrial and organizational psychology. In M. D. Dunnette & L. M. Hough(Eds.). Handbook of industrial and organizational psychology 1990. 2nd edth ed. 1p. 419–489. Palo Alto, CA: Consulting Psychologists Press.
Scarpello V, Campbell JP. Job satisfaction: Are all the parts there? Personnel Psychology 1983;36:577–600. doi:10.1111/j.1744-6570.1983.tb02236.x. 10.1111/j.1744-6570.1983.tb02236.x.
Thorndike RM, Cunningham GK, Thorndike RL, et al. Measurement and Evaluation in Psychology and Education 1991. New York: John Wiley.
Ward LC. Comparison of factor structure models for the Beck Depression Inventory–II. Psychological Assessment 2006;18:81–88. doi:10.1037/1040-3590.18.1.81. 10.1037/1040-3590.18.1.81. 16594815.
Watson D, Clark LA, Telegen A. Development and validation of brief measures of positive and negative affect: The PANAS scales. Journal of Personality and Social Psychology 1988;54(6):1063–1070. doi:10.1037/0022-3514.54.6.1063. 10.1037/0022-3514.54.6.1063. 3397865.
Whooley MA, Avins AL, Miranda J, et al. Case-finding instruments for depression: Two questions are as good as many. Journal of General Internal Medicine 1997;12:439–445. doi:10.1046/j.1525-1497.1997.00076.x. 10.1046/j.1525-1497.1997.00076.x. 9229283. PMC1497134.

Notes

Conflicts of interest

The authors declared no conflict of interest.

Article information Continued

Table 1

Demographic data of respondents (main study, n=440)

Male (%) Female (%)
Age 19 3 (0.7) 5 (1.1)
20~29 51 (11.6) 41 (9.3)
30~39 44 (10.0) 43 (9.8)
40~49 42 (9.5) 46 (10.5)
50~59 48 (10.9) 51 (11.6)
60~64 29 (6.6) 37 (8.4)
Living area Seoul/Gyeonggi 65 (14.8) 63 (14.3)
Chungcheonng 38 (8.6) 41 (9.3)
Gangwon 49 (11.1) 48 (10.9)
Gyeongsang 35 (8.0) 48 (10.9)
Jeolla 29 (6.6) 20 (4.5)
Total 217 (49.3) 223 (50.7)

Table 2

Attribute level of items of the normal depression scale (17)

Item Attribute Item Attribute
NORMAL29 .07 NORMAL17 .62
NORMAL20 .42 NORMAL58 .65
NORMAL46 .49 NORMAL43 .72
NORMAL51 .52 NORMAL52 .81
NORMAL26 .56 NORMAL21 .84
NORMAL18 .57 NORMAL11 .88
NORMAL41 .58 NORMAL22 .90
NORMAL32 .60 NORMAL42 .91
NORMAL25 .61

Table 3

Theoretical linking of 5 items of the normal depression scale-short form

 Item no.  Item content  Similar item in the K-CES-D  Similar item in the KDS  Concept of normal depression (Lee S et al., 2017)
1 (NORMAL17) I’d like to seek help from someone. I talked less than usual. I become to talk less than usual. normal depression embedded in DSM-5 (affective·cognitive withdrawal)
2 (NORMAL21) It is hard to adapt to a new situation. normal depression embedded in DSM-5 (behavioral withdrawal)
3 (NORMAL22) I become to talk less. normal depression embedded in DSM-5 (behavioral·social withdrawal)
4 (NORMAL43) I feel lonely. normal depression embedded in DSM-5 (affective withdrawal)/negative affect of PANAS
5 (NORMAL52) I seem to behave indiscreetly unlike before. other (deficit of self-management)

Table 4

Basic information of the normal depression scale-short form

Item no. Item content M SD Correlation

1 2 3 4 5
1 I’d like to seek help from someone. 2.59 1.25 1
2 It is hard to adapt to a new situation. 2.15 1.09 .48 1
3 I become to talk less. 1.93 .96 .45 .59 1
4 I feel lonely. 2.34 1.23 .51 .48 .64 1
5 I seem to behave indiscreetly unlike before. 2.03 1.11 .50 .57 .63 .56 1

Polycoric correlation coefficients calculated for the factor analysis of categorical variables are used.

Table 5

Confirmatory factor analysis of 1 factor model of the NDS-SF

Item no. Factor loading
1 .63
2 .72
3 .80
4 .82
5 .78

NDS-SF: normal depression scale-short form.

Table 6

Fitting figure 2 to the developmental data including normal depression scale-short form

1. Overall fit measures

 χ2(71)=158.963 (p=.000), RMSEA=.053, CFI=.970, TLI=.961, WRMR=.869

2. Correlation between factors (diagonal = variance)

Factor 1 2 3 4 5

1. Perceived stress (F 1) .54*
2. Social support (F 2) −.15* .44*
3. Socioeconomic status (F 3) −.24* .00 .64*
4. Normal depression (F 4) .75* −.29* −.30* .41*
5. CES-D (F 5) .24* −.20* −.21* .70* .39*

3. Factor coefficient (reliability of measurement)

Perceived stress Social support Socioeconomic status Normal depression CES-D

v 1=.86* (.75) v 3=.88* (.77) v 5=.80* (.64) v 8=.64* (.41) v 13=.97* (.95)
v 2=.89* (.78) v 4=.95* (.90) v 6=.46* (.21) v 9=.67* (.45) v 14=.87* (.76)
v 7=.70* (.48) v 10=.80* (.63)
v 11=.78* (.61)
v 12=.76* (.58)

  mean of reliability=.77 mean of reliability=.84 mean of reliability=.44 mean of reliability=.54 mean of reliability = .85
*

p<.05.

Fig. 1

Distribution of summed scores of five items of the normal depression scale-short form.

Fig. 2

Model among variables related to the normal depression in the developmental data.

Fig. 3

Model among variables related to the normal depression in the validation data.

Table 7

Fitting figure 3 to the validation data including normal depression scale-short form

1. Overall fit measures

 χ2(15)=27.660 (p=.024), RMSEA=.067, CFI=.960, TLI=.925, WRMR=.434

2. Correlation between factors (diagonal=variance)

1 2 3 4 5

1. Perceived stress (F 1) .54*
2. Social support (F 2) −.13 .49*
3. Socioeconomic status (F 3) −.20* .38* .35*
4. Normal depression (F 4) .77* −.27* −.46* .43*
5. CES-D (F 5) .57* −.20* −.33* .74* .43*

3. Factor coefficient & Reliability of measurement

Factor Measurement Factor coefficient Reliability (R2 )a

1. Perceived stress (F 1) v 1 .89* .79
v 2 .88* .77
2. Social support (F 2) v 3 .97* .94
3. Socioeconomic status (F 3) v 4 .59* .35
v 5 .68* .46
4. Normal depression (F 4) v 6 .87* .76
5. CES-D (F 5) v 7 .99* .99
v 8 .90* .81
*

p<.05.

Table 8

1st and 2nd round for standard score setting (n=12)

  Item 1st round 2nd round


M SD min. max M SD min. max
 Normal 17 3.50 .49 2.50 4.00 3.62 .28 2.98 3.95
 Normal 21 3.47 .48 2.50 4.10 3.55 .33 2.96 4.10
 Normal 22 3.39 .37 2.70 3.80 3.49 .27 3.00 3.80
 Normal 43 3.65 .47 2.70 4.10 3.70 .35 3.00 4.10
 Normal 52 3.25 .41 2.60 4.00 3.32 .28 3.00 3.90

  Total 17.26 17.67≈18

Fig. 4

Summed scores of five items judged by 12 panels in the 1st and 2nd rounds.