| Home | E-Submission | Sitemap | Editorial Office |  
top_img
Korean Journal of Otorhinolaryngology-Head and Neck Surgery > Volume 44(5); 2001 > Article
Korean Journal of Otorhinolaryngology-Head and Neck Surgery 2001;44(5): 485-489.
Frequencies of Korean Phonemes and Reliability of Korean Phonetically Balanced Word Lists.
Sung Wan Byun
Department of Otolaryngology, College of Medicine, Ewha Womans University, Seoul, Korea. byunsw@mm.ewha.ac.kr
한국어의 발음 음소별 빈도로 본 한국어 PB Word의 타당성
변성완
이화여자대학교 의과대학 이비인후과학교실
주제어: 한국어음소어음청력검사.
ABSTRACT
BACKGROUND AND OBJECTIVE: Recent advances in the computer technology and the explosive increase in the internet contents have made it possible for us to calculate the exact frequencies of phonemes in the everyday dialogue of the Korean language, which can provide the basic data for the standardization of Korean phonetically balanced (PB) word lists. This study was aimed to investigate the frequencies of Korean phonemes and to compare the results with the existing Korean PB words lists.
MATERIALS AND METHODS:
The author has developed a computer program that can convert words into written sentences as they are pronounced, and calculate the frequencies of the Korean phonemes. This study used 10 materials (total 171,824 syllables) collected from several TV dramas and news shows.
RESULTS:
All materials showed a similar trend in the frequency pattern. According to the results, the existing PB words lists had too many /m/,/b/,/o/,/u/'s and too few /n/,/d/,/r/,/e/,/eu/,/i/'s. The most prominent discrepancy existed in the final consonants.
CONCLUSION:
The present study showed that the existing PB words lists need to be modified to reflect actual frequencies of phonemes.
Keywords: Korean languagephonemespeech audiometry

교신저자:변성완, 158-710 서울 양천구 목동 911-1 이화여자대학교 의과대학 이비인후과학교실
                  전화:(02) 650-5650 · 전송:(02) 2648-5604 · E-mail:byunsw@mm.ewha.ac.kr

서     론


   임상적으로 사용되는 어음청력검사(speech audiometry)의 어음명료도(speech discrimination score)를 구할 때는 PB(Phonetically Balanced) word라는 음성학적으로 균형을 이룬 단음절어음(monosyllable)을 사용한다. 이 PB word는 친숙한 어음으로 일상 회화에서 사용하는 어음의 빈도와 같은 구성을 가져야 한다.1)2)3) 즉, 한국인의 PB word는 한국어의 일상 회화에서 사용하는 어음의 빈도와 같은 구성을 지니도록 만들어져야 한다. 영어권에서는 Harvard Pyscho-Acoustic Laboratories의 PAL PB-50 검사표와4) 이를 개량한 Central Institute for the Deaf의 CID W-22 검사표,5) Northwestern University의 NU Auditory test No. 4, No. 6등이6)7) 발표되어 사용되고 있다. 대부분 이 일상 회화 어음의 빈도는 Dewey8)와 French9)의 빈도 조사 보고를 근간으로 하고 있다.
   한국에서도 과거의 연구에10)11)12)13)14)15)16)17) 바탕을 두고 제작된 몇 개의 표가1)2)11) 사용되어 왔지만, 이는 수십년 전에 제작된 것으로, 대규모의 일상 회화 자료로 정확한 빈도 조사는 불가능하던 때의 자료였다. 최근 급속도로 증가한 인터넷의 게시물과 컴퓨터 기술의 발달로 이것이 가능해져 다음과 같은 조사를 할 수 있었다.
   이 연구에서는 (1) 발음 음소의 빈도를 구하는 컴퓨터 프로그램을 제작하고, (2) 인터넷에서 구할 수 있는 표준어로 된 일상 회화체의 한국어 문서 자료를 선정하여, (3) 기존에 사용되고 있는 한국어 PB word의 발음 음소 빈도와 비교하여 기존 PB word의 타당성에 대해서도 알아보고자 하였다.

재료 및 방법

컴퓨터 프로그램의 제작
  
한글 표기에서는 문교부 고시(1988)의 한글 맞춤법 제 1 장 제 1 항의 규정 ‘표준어를 소리 대로 적되 어법에 맞도록 함을 원칙으로 한다’에 의해, 표기되는 음소와 발음되는 음소사이에 차이가 발생한다.
   이런 차이의 대표적인 예가 연음법칙(사람이[사라미]), 구개음화(굳이[구지],같이[가치]), 경음화(국밥[국빱]), 격음화(밝히다[발키다]), 상호 자음동화(국립[궁닙]), 역행 자음동화(국민[궁민]), 순행 자음동화(칼날[칼랄]), 7종성 법칙(옷[옫], 부엌[부억]) 등 이다. 특히 7종성 법칙에 의해 한국어의 종성은 [ㄱ][ㄴ][ㄷ][ㄹ][ㅁ][ㅂ][ㅇ]의 7개로 한정된다.
   PB word는 발음 음소를 기준으로 하기 때문에, ‘불을 밝힙시다’라는 표기 대신, [부를 발킵씨다] 같은 발음 표기로 변환한 후 음소의 빈도를 구해야 한다. 따라서 본 연구에서 필요한 프로그램은 어음 재료 문서의 발음 표기로의 변환과 음소의 빈도 측정이라는 2단계의 작업을 하도록 제작하였다.
   이 프로그램에서는 완성형 한글코드(KS C5601-1987) 대신 음절을 음소로 분리하기가 쉽고, 표기 불가능한 문자가 없는 상용조합형 한글코드(KS C5601-1992)를 이용하였다.
   완성형 한글 코드의 HTML파일이나 텍스트 파일을 상용조합형의 텍스트 파일로 변환하는 것은 한글97기능강화판(한글과 컴퓨터사)을 사용하였다.

한국어 문서 자료의 선정
  
표준어, 일상 회화체, 많은 음절 수, 인터넷의 접근성 등의 조건에 가장 적합한 것은 공중파 TV의 극 대본 등이라고 생각하여 KBS와 MBC의 홈페이지(각각 http://www.kbs.co.kr, http://www.imbc.com)에서 구할 수 있는 현대극 대본 ‘가을 동화’, ‘학교’를 선정하였고, 사극 대본 ‘허준’과 ‘태조 왕건’도 선정하였다.
   각 대본 중에서는 음절 수가 가장 많은 두 회를 선정하여, 가을 동화의 6회, 8회(합 21495음절), 학교의 6회, 7회(합 56454 음절), 허준의 4월 11일, 4월 18일분(합 28633 음절), 태조 왕건의 1회, 18회(합 30252음절)를 조사하였다. 다른 자료로 임의의 날짜(KBS 2001년 1월 5일, MBC 2001년 1월 10일)의 9시 종합 뉴스 대본(합 34990음절)도 포함하여 총 171,824음절을 조사하였다. 자료의 내용 중 그림, 표, 각종 web page의 link 성분 등 본 조사의 목적에 부적합한 부분은 삭제, 교정 등 수정하여 사용하였다.

기존 한국어 PB word 표의1)2)11) 발음 음소 빈도
  
기존에 사용되는 PB word 표의 어음은 모두 같은 빈도를 보였다. 저자는 이 빈도와 상기 어음 재료 문서의 빈도를 비교하였다(Table 1).

결     과

   조사한 어음 재료 문서들끼리는 종류에 관계없이 초성, 중성, 종성의 모든 음소에서 서로 유사한 빈도를 보여주었다(Table 2). 이 자료의 값을 기준으로, 기존에 사용하던 PB word를 평가한 결과는 다음과 같다.
   1) 초성에서 [ㄴ][ㄷ][ㄹ][ㅇ-초성없음]음이 부족하였고, [ㅁ][ㅂ]음은 과다하였다(Table 1, Fig. 1).
   2) 중성에서 [][ㅡ][ㅣ]음이 부족하였고, [ㅗ][ㅜ]음은 과다하였다(Table 1, Fig. 2).
   3) 종성은 본 연구에서 구한 종성없는 음절의 빈도가 65%인데 비해 PB word 표에서는 12%로 대부분의 종성의 빈도 분포가 너무 많았으며, 상대적으로는 [ㄴ]음이 부족하고, [ㄹ][ㅁ]음은 너무 많았다(Table 1, Fig. 3).
   4) 현대극과 사극, 극 대본과 뉴스 대본 사이에도 빈도의 큰 차이는 없었다(Table 2).

고     찰

   한국어의 음운 구조에 맞는 어음 재료를 선택하여 표준화하려는 노력으로 과거로부터 여러 연구가 있었지만10)11)12)13)14)15)16)17) 대부분의 연구는 제시된 어음 재료를 임상에 적용한 결과를 보고하는 것이었다. 기초적인 회화 어음의 빈도 조사가 가장 선행되어야 했음에도 불구하고, 방대한 시간과 노력이 드는 일이었기 때문에 이에 대한 보고는 거의 없었다.
   한국어 회화 어음의 음소별 빈도에 대한 몇 만 음절 단위의 대규모 조사는 1971년에 Park13)이 보고하였는데, 일상 회화어를 사용하는 회화문의 일간신문 연재소설에서 회화 어음을 발췌하여, 당시로서는 불가능에 가까운 총 77,898음절에 대한 빈도를 조사하였다. 그 결과 10회이상 출현한 고빈도의 음절이 498음절이었고, 전체 음절의 98.2%를 차지한다고 보고하였다. 이 498음절에 대해 초성, 중성, 종성의 빈도를 조사하여 보고 하였으며, [ㄹ]음을 두음 법칙에 의해 초성에서 제외하고, 7 종성 법칙을 적용하여 각 음소별 빈도를 산출한 것이었다(Table 1). 음절, 정확하게는 문자 단위의 빈도를 먼저 구하고, 나중에 여기에서 음소의 빈도를 산출하는 방법은 수작업으로도 7만여 음절에 대한 분석을 가능하게 해주는 매우 효율적인 방법이었으나, 연구의 내용상 다음과 같은 문제점을 내포하게 된다.
   Park13)의 연구는 표기 문자를 기준으로 하였으므로, ‘불을 밝힙시다’와 같은 경우 ‘불/을/박(7 종성 규칙의 적용)/힙/시/다’처럼 표기 문자별로 분할한 후 음소에 대한 빈도를 조사하였다. 이 경우 종성에 [ㄹ][ㄹ][ㄱ][ㅂ]음이 출현하고, 초성에도 [ㅎ]음이 있는 것으로 결과가 나오지만, 실제로는 [부를 발킵씨다]로 발음되므로 종성에는 [ㄹ][ㄹ][ㅂ]음만이 출현하며, 초성에도 [ㅎ]음 대신 [ㅋ]음이 출현한다. 즉, 연음법칙이나 자음동화 같은 한국어의 음운 현상이 적용되지 않아, 결과적으로 특히 종성에 대한 빈도의 왜곡이 심해졌을 것으로 추정된다. 저자의 연구에서 종성없는 음절의 비율이 65%로 산출된 것에 비하여, Park13)의 연구에서는 32%로 산출되었음도 연음법칙이 고려되지 않았음을 시사하고 있다(Table 1). 그러나, 상대적으로 과다평가 되었음을 고려한 종성의 빈도 분포 유형은 PB word의 빈도보다는 훨씬 본 연구 결과와 잘 부합하여, 당시로서는 상당히 정확한 조사였음을 시사하고 있다(Fig. 3). 초성과 중성에서도 의도적으로 배제시킨 초성 [ㄹ]음을 제외하면, [ㅂ][ㅊ][ㅕ][ㅜ]음이 다소 많고, [ㅏ]음이 다소 적은 정도의 차이만을 보였을 뿐으로 전반적으로 본 연구의 결과와 유사하였다(Figs. 1 and 2). 연음법칙에 의해 초성이 [ㄹ]음인 음절이 엄연히(저자의 연구에 의하면 8.2%) 존재하고, 외래어에서 유래한, ‘라면’, ‘라디오’, ‘로켓’, ‘로봇’ 등 [ㄹ]음으로 시작하는 많은 단어들이 이미 우리말의 일상 회화에서 많이 사용되고 있으므로 초성의 [ㄹ]음을 배제하는 것은 시대 감각에 맞지 않아 보인다.
   저자의 연구에서 조사한 어음 재료들끼리는 현대극 대본, 사극 대본, 뉴스 대본 등에 관계 없이 초성, 중성, 종성의 모든 음소에서 서로 유사한 빈도를 보여주었고, 모두 1만음절이 넘는 큰 자료들이라 이를 한국의 표준어 일상 회화체의 빈도로 간주해도 별 무리가 없을 것으로 생각된다.
   본 연구에서 조사한 빈도에 근거하여 고찰할 때, 기존의 PB word 표는 본 결과에서 지적한 대로 다소의 수정이 필요할 것으로 생각된다. 특히 종성에 대해서는 대폭적인 수정이 필요할 것으로 보인다. 종성 자음이 있는 음절의 빈도는 35%이지만 기존에 사용하던 PB word에서는 이 빈도를 88%로 잡아 너무 많은 종성이 PB word에 출현하는 결과를 낳았다. 이런 차이는 역시 과거의 수작업으로 이루어진 빈도 조사에서 연음법칙을 고려하지 않았을 때 출현하는 종성의 빈도로 계산하였기 때문으로 추정된다. 가령 ‘울음을 터뜨렸다’[우르믈 터뜨렫따]의 경우 표기 상으로는 종성이 4개 [ㄹ][ㅁ][ㄹ][ㅆ] 출현하나 발음 상으로는 2개 [ㄹ][ㄷ]로 줄어든다. 따라서 이를 고려하여 종성의 비율 및 빈도는 재고해야 할 것이다.
   참고적으로 일상회화체 대신 문어체인 본지의 일부 논문(2000~3000음절)으로 같은 조사를 하였을 때, 중성에서 [ㅘ][ㅢ]의 빈도가 일상회화체 보다 각각 2~3, 3~4배 높은 차이가 있었고, 초성과 종성의 분포가 일상 회화체보다 변동폭이 컸음을 밝혀둔다. 전자는 논문체에서 조사 ‘과/와,의’를 회화체보다 빈번하게 사용하기 때문일 것이고, 후자는 논문에서 다루는 주제 관련 단어들이 집중적으로 출현하여 생기기 때문일 것으로 보인다.

결     론

   저자는 개발한 프로그램을 통해 연음법칙, 자음동화 등 한국어의 음운 현상을 고려하여 음소의 빈도를 회화체의 극 및 뉴스 대본17만여 음절에 대해 구하였다. 모두 대본의 종류에 관계없이 유사한 빈도 분포를 보였으며, 현재 사용되고 있는 PB word 표에는 초성과 종성에서 [ㄴ][ㄷ][ㄹ][ㅇ-초성없음] [][ㅡ][ㅣ]음이 부족하였고, [ㅁ][ㅂ][ㅗ][ㅜ]음은 과다하였다. 종성은 과거의 조사 결과에서 연음법칙이 실현되지 않은 상태의 음소 빈도를 구한 관계로 실제의 빈도와 큰 차이가 있으므로, 대폭적인 수정이 필요할 것으로 보인다.


REFERENCES

  1. 백만기. 최신이비인후과학. 서울: 일조각;1987. p.38.

  2. 노관택. 이비인후과학. 서울: 일조각;1996. p.79-80.

  3. Pendrod JP. Speech threshold and word recognition/discrimination testing. In: Katz J. Handbook of clinical Audiology. 4th ed. Baltimore: Williams & Wilkins;1994. p.147-64.

  4. Egan JP. Articulation testing methods. Laryngoscope 1948;58:955-91.

  5. Hirsh IJ, Davis H, Silverman SR, Reynolds EG, Eldert E, Benson RW. Development of materials for speech audiometry. J Speech Hear Disord 1952;17:321-37.

  6. Tillman TW, Carhart R, Wilber L. A test for speech discrimination composed of CNC monosyllabic words: Northwestern University Test No. 4. Technical report no. SAM-TDR-62-135. USAF School of Aerospace Medicine, Brooks Air Force Base, Texas;1963.

  7. Tillman TW, Carhart R. An expanded test for speech discrimination utilizing CNC monosyllable words: Northwestern University Test No. 6. Technical report no. SAM-TR-66-55. USAF School of Aerospace Medicine, Brooks Air Force Base, Texas;1966.

  8. Dewey G. Relative frequency of English speech sounds. Cambridge, MA: Harvard University Press;1923.

  9. French NR, Carter CW, Koenig W. The words and sounds of telephone conversations. Bell Sys Tech J 1930;9:290-324.

  10. 신규식. 한국 정상인에 대한 Speech Audiometry에 관하여. 한이인지 1960;3:1-3.

  11. 함태영. 한국어음청력검사표와 명료도검사 성적에 관한 연구. 가톨릭의대논문집 1962;5:31-8.

  12. Soh JM, Park SJ, Eun JH. Statistical review of spondee and PB words. Kor J Otolaryngol 1970;13:113-6.

  13. Park CI. Audiologic studies of Korean speech sounds part I: Analysis of frequencies and structures of Korean speech sounds. Kor J Otolaryngol 1971;14:1-8.

  14. Park CI. Audiologic studies of Korean speech sounds part II: Articulation scores and confusion patterns of Korean speech sounds. Kor J Otolaryngol 1971;14:9-22.

  15. Kim YM, Choi SE, Kang DH, Shim YJ, Kim GR. The Study on Method of Speech Audiometry and the Korean Word Lists Part 1: Normal Hearing Group. Kor J Otolaryngol 1978;21:831-6.

  16. Han TH, Park CI. A study on standardization of Korean PB word list for speech audiometry. Kor J Otolaryngol 1981;24:265-78.

  17. Park CI, Han TH. A study on standardization of Korean PB word list for speech audiometry. Kor J Otolaryngol 1985;28:269-78.

TOOLS
PDF Links  PDF Links
Full text via DOI  Full text via DOI
Download Citation  Download Citation
Share:      
METRICS
2,477
View
45
Download
Related articles
Frequencies of Korean Syllables and the Distribution of Syllables of PB Word List.  2003 September;46(9)
Frequencies of Tinnitus and Noise of the Factory in Noise-induced Hearing Loss.  2005 February;48(2)
Editorial Office
Korean Society of Otorhinolaryngology-Head and Neck Surgery
103-307 67 Seobinggo-ro, Yongsan-gu, Seoul 04385, Korea
TEL: +82-2-3487-6602    FAX: +82-2-3487-6603   E-mail: kjorl@korl.or.kr
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Korean Society of Otorhinolaryngology-Head and Neck Surgery.                 Developed in M2PI
Close layer
prev next