| Home | E-Submission | Sitemap | Editorial Office |  
top_img
Korean Journal of Otorhinolaryngology-Head and Neck Surgery > Volume 44(7); 2001 > Article
Korean Journal of Otorhinolaryngology-Head and Neck Surgery 2001;44(7): 700-706.
Acoustic analyses of monosyllabic words which are difficult to discriminate in the high frequency hearing loss.
Heil Noh, Sayong Chae
Department of Otorhinolaryngology, St. Vincent Hospital College of Medicine, the Catholic University of Korea, Seoul, Korea.
고음역 난청에서 분별하기 어려운 단음절어의 음향 분석
노혜일 · 채세용
가톨릭대학교 의과대학 성빈센트병원 이비인후과학교실
주제어: 언어 분별력고음역 난청음향적 분석.
ABSTRACT
BACKGROUND AND OBJECTIVES:
Speech discrimination testing has been used to evaluate the communication disability, select hearing aid candidacy and appropriate amplification, plan and evaluate aural rehabilitation programs and assist in the determination of the site of lesion. Since the words of speech discrimination tests were made on the basis of the linguistic aspects and used till now, they underestimate the disability of high frequency hearing loss (HFHL). To ameliorate this problem, we analysed the words which were difficult to discriminate in FHL in a commonly used speech testing material using the acoustic analysis method. Also, the words were assorted to establish a basic data for a new speech material which could estimate the disability of HFHL. METHODS: 20 HFHL subjects (age 20-70), selected on the basis of pure tone audiometry, were found to be the descending type. They were tested to repeat the monosyllabic words at 10-15dB HL above the puretone threshold of 1000Hz and checked with the error responses. These words were sorted out according to the error response or the confusion rate and analyzed by consonants and vowels. The words were recorded with an audiologist's voice using a GSI 10 audiometer connected to the personal computer. This was analyzed by the acoustic analysis program that has the MATLAB function. With this program, a word was analyzed by an initial consonant, a vowel, and a final consonant for the intensity, the formant peak frequency and the time course.
RESULTS:
The words which were difficult to discriminate for HFHL were sorted out by the confusion rates. The words of articulation score 15-50% were revealed to have low intensity with short duration, and the peak frequency spectrum above 3 kHz. Also the consonant-vowel transition frequency was located above 3 kHz.
CONCLUSION:
These results could be used as a basic clinical data to make a new speech discrimination material which evaluates the disability of HFHL more accurately.
Keywords: Speech discriminationhigh frequency hearing lossacoustic analyses

교신저자:노혜일, 442-060 경기도 수원시 팔달구 지동 93번지 가톨릭대학교 의과대학 성빈센트병원 이비인후과학교실
                  전화:(031) 249-7450 · 전송:(031) 257-3752 · E-mail:hinoh@vincent.cuk.ac.kr 

서     론


   말소리에 대한 이해 능력을 평가하는 어음 명료도 검사는 의사소통 장애의 정도, 보청기의 적응 및 선택, 언어 치료 계획, 병변의 부위 등에 필요한 정보를 제공한다. 그러나 현재 사용하는 어음표는 1960년대부터 신규식(1960년), 함태영(1962년), 백준기(1970년), 소진명(1970년), 이종담(1976년) 등이 작성한 것으로 이 단어들은 음향적인 면보다는 언어학적인 면에 기준을 두고 채택되었다. 현재 그 당시와 사용 빈도의 차이도 있으며 임상에서는 특히 고음역 난청의 경우, 장애 정도를 과소 평가하게 된다. 본 연구는 이러한 문제점을 해결하기 위하여 기존에 사용하고 있는 일부 어음표 단어들 중 고음역 난청에서 분별하기 어려운 단어들의 음향적 특성을 분석하여 분별하기 어려운 단음절어가 왜 분별이 어려운지 음향적으로 분석하려고 하였다. 또한 이 결과를 고음역 난청 환자의 언어 분별력 장애를 정확히 평가하는 새 어음표 작성의 기초 자료로 삼고자 하였다.

대상 및 방법

고음역 난청환자의 단음절 분별력 검사
  
순음 청력 검사에서 청력도가 하강형이면서 3 kHz이상의 고음역 역치 평균값이 2 kHz까지의 저음역 역치 평균값 보다 25~30 dB 이상인 고음역 난청환자 20명을 대상으로 하였고 이들의 평균 연령은 50±15.1세로 20~30대가 7명 40~50대가 6명 60~70대가 7명이였으며 이들의 순음 청력 역치의 평균값은 다음과 같다(Table 1). 이들을 대상으로 각각의 1 kHz의 순음 역치에 10~15 dB를 더한 크기로 현재 사용되고 있는 어음표(함태영)의 200개의 단음절어를 따라하도록 검사하여 듣지 못하거나 다른 소리로 응답하는 단음절어들의 오청 빈도수를 비교하고 그 오청률을 자음과 모음별로 분류하여 분석하였다.

단어의 음향적 분석
  
같은 단음절어 200개를 청각사의 정확한 발음으로 청력 검사용 방음실에서 GSI 10 Audiometer의 출력에 컴퓨터를 연결하여 녹음한 후 이를 MATLAB(version 5.30) 함수를 이용하여 만든 음향 분석 프로그램을 사용하여 단어의 초성, 중성, 종성별로 음의 크기(강도)와 주파수 특성을 시간 경과에 따라 분석하였다. 이 프로그램에서 단어의 시간별 일정 구간을 분리하여 단어의 초성, 중성, 종성의 소리를 따로 들어볼 수 있으므로 시간별 소리 크기의 모양을 보고(Fig. 1B) 초성과 중성을 분리한 후 구간별 소리를 들어 확인하는 방법으로 초성, 중성, 종성을 구분하여 분석하였다. Fast Fourier Transform 후 분석 화면(Fig. 1D)에서 formant 주파수를 비교하고 음의 시간별 formant peak(에너지의 봉우리)와 상대 출력을 측정하였으며 시간, 주파수, 상대 출력값의 삼차원과 이차원 영상을 얻어 formant transition을 그림으로 볼 수 있게 만들었다(Fig. 1A and C). “짐” 단어의 예를 들면 188 msec까지가 초성이며(Fig. 1B) 초성의 formant peak 주파수는 3 KHz 이상에 분포한다는 것을 그림으로 알아볼 수 있으며 주파수와 상대 출력값은 Fig. 1D 화면에서 측정하였다. 그 외 초성, 중성, 종성을 구분하기 어려운 경우, 필터를 이용하여 일부 주파수 소리를 제거한 후 선택한 주파수 영역 소리를 들어서 확인하였다.

통계적 검증
  
실험 결과는 20명에 대하여 평균±표준편차로 표시하였고, 값의 비교는 Mann-Whitney U-test 방법으로 SPSS program을 이용하여 검증하였으며 p 값 0.01 이하를 유의 수준으로 하였다.

결     과

   200개의 단음절어에 대한 20명의 평균 어음 명료도는 73.8±12.4%였다. 고음역 난청 환자에서 잘 분별하지 못하는 단음절어들은 그 빈도순으로 “폴, 짐, 설, 씨, 질, 뒤, 키, 법, 셋, 뼈, 살, 밥, 해, 침, 틈, 새, 봄, 방, 집, 선, 서, 불, 땀, 신, 섬, 죄, 글, 상, 김”이었고 그 명료도는 15~50% 범위였다(Table 2). 200개 단음절어의 오청률을 자음과 모음으로 나누어 분석했을 때 “ㅂ”이 39.0%, “ㅃ”이 36.3%, “ㅅ”이 38.2%, “ㅆ”이 51.7%, “ㅈ”이 33.8%, “ㅍ”이 42.5%, “ㅎ”이 35.0%였으며 “ㅚ”는 33.8%, “ㅟ”는 45.0%, “ㅣ”모음은 44.0%로 “ㅂ”과 “ㅅ”을 제외하고는 모음에 영향을 받았다(Table 3). 이들의 음향적 분석 결과를 통해 잘 분별하지 못하는 원인을 요약해보면 “폴, 법, 밥, 봄, 방, 불”들은 단어의 초성이 크기가 작고 시간이 짧았으며(Table 4), “설, 씨, 셋, 살, 새, 선, 서, 신, 섬, 상”들은 초성 자음의 최고점 주파수(세기가 최대인 주파수)가 3 kHz 이상의 고음역에 분포하였다. “짐, 질, 뒤, 키, 침, 집, 죄, 김”들은 자음과 연결된 중성 모음의 영향으로 일어난 초성의 자모음 전이(consonantvowel transition) 주파수가 고음역에 분포하였다(Table 5). 특히 “ㅂ”은 초성 자음으로 왔을 때 이 단어의 중성 모음에 따라 다르지만 모두 100 ms이하로 초성이 짧았으며(평균 88.0±3.67 ms), “ㅈ, ㄷ, ㅋ, ㅊ, ㄱ”은 초성의 길이가 짧지는 않으나(평균 155.6±29.57 ms, p=0.0003) “ㅣ” 모음이 중성으로 왔을 때 자음의 전이 주파수가 평균 4329±1399 Hz로 고음역으로 이동하였다. “ㅅ, ㅆ”은 평균 4000±1005 Hz로 자음자체가 고음역에 분포였고 “ㅎ”은 힘이나 해에서 각각 3448 Hz와 3049 Hz로 일부가 중성 모음의 영향으로 고음역에 분포하였다. 유성자음인 “ㄴ, ㅁ”은 자모음전이 현상이 분명하지 않았고 무성자음이 “ㅣ” 모음과 만났을 때 고음역 전이 현상이 잘 나타났다. 예를 들어 “ㅈ”의 경우 “ㅣ” 모음과 연결되었을 때 상대 출력이 높은 formant peak(에너지의 봉우리)가 고 주파수 영역으로 이동하였다. 이에 비해 유성자음인 “ㅁ”은 연결된 모음에 영향을 받지 않고 저음역에 분포하였다(Fig. 2).

고     찰

   1960년대 이후 우리 나라에서 표준말 소리의 청력 검사표의 설정과 검사 방법이 표준화되어야 하는 필요성이 줄곧 제기되었으나 이를 아직 해결하지 못하는 이유는 다음과 같다. 우선 소리의 음향 분석이 공학의 발전과 더불어 발전을 하였지만 어음 연구자가 이를 적절히 활용하지 못하고 있고 언어학의 측면에서는 표준어의 말의 빈도와 분포에 대한 기초 연구가 이루어지지 않고 있다. 청각학적 관점도 청각 기관이 말소리를 인지하는 과정과 원리에 대해 정확히 알려지지 않고 있으며 임상에서 자주 어음 검사를 하고 있으나 환자의 불편이나 장애 정도를 잘 반영하는지 확인하는데 소홀하고 있다. 이런 문제들로 어음표의 개선 작업에는 많은 어려움이 있고 이 문제를 해결하기 위해 현재 사용중인 어음표들의 음향 분석은 기초적인 작업의 하나라고 할 수 있다.
   본 연구에서 15~50%의 명료도를 보인 단어들은 80명의 정상인에서 조사된 자료에서 보면 대부분 명료도가 높은 단어들로 83.8~100%이었으며 “새”, “법”과 “밥”만이 각각 66.3%, 62.5%와 50%로 낮았다. 이는 정상인에서 낮은 명료도를 보인 단어들이 고음역 난청에서도 낮은 명료도를 보이는 것으로 생각된다.1) 그러나 정상인에서의 명료도는 연구자에 따라 차이가 있어2) 앞으로도 많은 수의 정상인을 대상으로 한 연구가 필요하다.
   한국어의 음성과 자음에 대한 음향적 분석은 Moon3)이 sonagraph를 이용하여 처음 시행하였으나 당시의 sound spectrum을 이용한 분석은 주파수, 소리 크기나 강도, formant를 알 수 있었지만 초성, 중성, 종성을 구분하여 분석하거나 일부구간의 주파수 영역을 분리하여 분석할 수는 없었다. 본 연구에서 사용한 음향 분석 프로그램은 단어의 초성, 중성, 종성별로 세기와 주파수를 분석하고 이들의 시간적 변화를 분석할 수 있도록 시간별 일정 구간을 분리하거나 필터를 이용하여 일부 주파수 소리를 제거한 후 소리를 들을 수 있고 음의 formant peak를 비교할 수 있도록 삼차원 영상을 얻어 formant 이동을 그림으로 볼 수 있게 만들어져 음의 분석이 용이하였다. 한국어 어음에 관한 음성 언어의학적 연구는 Kim 등4)이 1980년에 KAY-sonagraph을 이용하여 모음과 자음을 구분하여 분석하였으며 이 연구의 결과 값을 비교하면 formant의 위치(Hz)와 발성지속 시간이 상당 구간 일치하였다.
   고음역 난청의 오청률에 대한 연구는 Hahm5)이 귀꽂이(ear plug)을 이용하여 정상인에서 고음역을 차단시켜 검사한 결과 초성 자음은 “ㅅ, ㅆ, ㅎ, ㅍ, ㅌ”이, 중성 모음은 “ㅚ, ㅘ”가 높은 오청율을 보인다고 하였다.
   우리말의 오청 현상에 대해서 Hahm6)은 우리말의 초성 자음에서 “ㅈ”이 “ㄱ, ㄷ”으로 “ㅂ”이 “ㄷ, ㄱ”으로 “ㄷ”이 “ㅂ”으로 “ㄷ”이 “ㄴ”으로 “ㄴ”이 “ㄷ”으로 혼동을 일으키는 경향이 현저하다고 하였고, 전도성 난청에서는 낮은 오청율을 보인 “ㅆ, ㅅ, ㅎ, ㅌ, ㅋ” 등의 무성 자음이 감각 신경성 난청에서는 높은 오청률을 나타낸다고 하였다. 모음의 혼동 현상으로는 “ㅓ”가 “ㅗ”로 “ㅜ”가 “ㅗ”로 “ㅗ”가 “ㅓ” 혼동되는 율이 높지만 “ㅏ, ㅓ, ㅐ, ㅕ”의 오청율은 낮다고 보고하였다. 오청 현상을 음절구성 면에서 보면 Yoo7)는 모음으로 시작하는 단어보다는 자음으로, 특히 “ㅍ, ㅊ, ㅂ, ㄷ, ㅁ”을 초성 자음으로 한 경우에 오청율이 높았으며, Lee8)는 유의단음절 보다는 무의단음절의 오청율이 높고 유의단음절의 오청에 자음이 결정적인 역할을 한다는 것과 자음을 감각 신경난청에서 주로 오청된다는 것을 보고하였다. 그러므로 자음으로 시작하는 단어의 인식은 초성 자음이 그 실마리나 단서를 제공한다는 것을 의미한다.
  
고음역 난청은 마찰음과 초성의 파열음, 폐쇄음에 취약하고 자음의 최고점 주파수가 역치값 보다 높을 때와 “ i ” 모음과 연결되어 있을 때 단어의 구별이 어렵다고 알려져 있다.9) 이는 자모음전이 현상으로 설명하는데 초성 자음이 연이어 오는 모음에 의해 영향을 받는 현상으로 자음의 주파수영역이 변화하며 이런 현상은 “ㅣ” 모음에서 현저하다. 본 연구에서 확인이 가능했듯이 우선 “ㅣ” 모음의 주파수 영역중 F3이 3 kHz 이상에 분포하면서 초성 자음의 주파수 영역을 고음역으로 이동시켰다. 그러나 모음에 영향을 받지 않는 경우도 크게 두 가지가 있는데 “ㅅ”처럼 자음자체의 주파수 영역이 이미 고음역에 있는 경우와 “ㅂ”처럼 초성에 왔을 때 자음의 세기가 모음에 비해 크기가 작고 초성이 차지하는 시간이 짧은 경우이다. 난청에서 자극음의 지속 시간이 짧아지면 어음 인식의 장애가 오며10) 지속 시간이 짧은 단어를 인식할 때 중추 청각계는 짧은 시간안에 복잡한 정보를 분석해야 하므로 오류의 현상이 일어날 확률이 높다.11) 또 이때 영향을 미치는 다른 변수로서 피검자의 나이와 기억 체계의 차이가 작용한다.12)
   정보 전달 측면에서 자음과 모음의 차이는 자음이 짧은 시간내에 정보를 전달하며 특히 초성 자음의 경우는 단어의 실마리를(cue)를 제공하지만 소음환경속에서 모음에 비해 주변 소음에 의해 더 가리워지는 경향이 있다.13) 본 연구를 통해서는 종성 자음이 고음역 난청의 어음 분별력에 미치는 영향은 알 수가 없었는데 종성만의 영향을 알기 위해서는 초성과 중성이 일치하면서 종성만 달라지는 단어들로 구성된 어음표를 이용해야 하며 종성의 표기와 발음, 말의 빈도 등에 대해서도 기초적인 조사도 필요하다.
   실제로 말소리의 이해 정도는 단어의 음향적 분석 결과와 항상 일치하지 않는다. 이는 소리를 중추 신경계에서 분석하는 부호 체계가 어떻게 이루어지고 있는지는 잘 모르기 때문이다. 중추 신경계는 특히 시간적 부호를 더 비중 있게 분석하고14) 외부의 정보를 토대로 형성된 일정한 틀을 이용하여 소리를 일정한 부류로 분류하거나 통합하여 인지한다는 auditory scene analysis 등15)으로 설명을 하고는 있지만 소리의 음향적 특성과 그 인지와의 관계는 현재까지 확실하게 밝혀져 있지는 않아 지속적인 연구가 필요하다.

결     론

   고음역 난청에서 분별하기 어려운 단음절어의 음향적 분석을 통하여 추측만 하고 있던 알아듣기 어려운 단어들의 음향적 특성을 확인하였다. 이 단어들은 초성이 크기가 작고 시간이 짧거나 초성 자음의 최고점 주파수가 3 kHz 이상의 고음역에 분포하였다. 또한 자음과 연결된 중성 모음의 영향으로 일어난 초성의 자모음 전이주파수가 고음역에 분포하였다. 이 결과들을 통하여 고음역 난청환자의 언어 분별력 장애를 정확히 평가하는데 필요한 새 어음표 작성의 기초 자료를 얻을 수 있었다.


REFERENCES
>

  1. Park CI. Articulation scores and confusion patterns of Korean speech sounds. Korean J Otolaryngol 1971;14:9-22.

  2. Yoo BH. Articulation scores and confusion Pattetens of selected 100 Korean speech sounds. Korean J Otolaryngol 1972;15:19-27.

  3. Moon YI. The sonagraphic analysis of normal consonants in Korean-alphabet. Korean J Otolaryngol 1973;16:257-62.

  4. Kim HN, Park IY, Kim GR, Sim SY, Choi HS. The medico-sonagraphic study of Korean vowels and consonants. Korean J Otolaryngol 1980;23:53-74.

  5. Hahm TY. Effects of ear plug on the acoustic insulation. Korean J Otolaryngol 1963;6:33-42.

  6. Hahm TY. Articulation function on the Korean speech in patients with hearing impairment. Korean J Otolaryngol 1963;6:19-56.

  7. Yoo BH. Confusion tendency of selected 100 Korean speech sounds aroused by the arrangement of phonemes. Korean J Otolaryngol 1972;15:159-76.

  8. Lee JD. The basic study of the Korean word for the material of speech hearing test. Korean J Otolaryngol 1976;19:1-25.

  9. Turner CW, Cummings KJ. Speech audibility for listeners with high-frequency hearing loss. Am J Audiol 1998;8:1-10.

  10. Hedrick MS, Jesteadt W. Effect of relative amplitude, presentation level, and vowel duration on perception of voiceless stop consonants by normal and hearing-impaired listeners. Acost Soc Am 1996;100:3398-407.

  11. Frenger P. Nanocontrollers for biomedical applications. Biomed Sci Instrum 1996;32:313-22.

  12. Schneider BA, Daneman M, Murphy DR, See SK. Listening go discourse in distracting setting: the effect of aging. Psychol Aging 2000;15:110-25.

  13. Greenberg S. Auditory processing of speech. In Lass NJ editor. Principles of experimental phonetics. 1st ed. St. Louis: Mosby Year Book;1996. p.399.

  14. Moller AR. Review of the roles of temporal and place coding of frequency in speech discrimination. Acta Otolaryngol (Stockh) 1999;119:424-30.

  15. Bregman AS. Auditory scene analysis: the perceptual organization of sound. Cambridge: MIT Press;1990. p.1-773.

TOOLS
PDF Links  PDF Links
Full text via DOI  Full text via DOI
Download Citation  Download Citation
Share:      
METRICS
1,965
View
22
Download
Related article
Editorial Office
Korean Society of Otorhinolaryngology-Head and Neck Surgery
103-307 67 Seobinggo-ro, Yongsan-gu, Seoul 04385, Korea
TEL: +82-2-3487-6602    FAX: +82-2-3487-6603   E-mail: kjorl@korl.or.kr
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Korean Society of Otorhinolaryngology-Head and Neck Surgery.                 Developed in M2PI
Close layer
prev next