Archives of Design Research
[ Article ]
Archives of Design Research - Vol. 30, No. 1, pp.131-143
ISSN: 1226-8046 (Print) 2288-2987 (Online)
Print publication date 28 Feb 2017
Received 09 Sep 2016 Revised 29 Dec 2016 Accepted 22 Jan 2017
DOI: https://doi.org/10.15187/adr.2017.02.30.1.131

UX Guidelines for Designing Audio Guidance of Multimedia Contents for Low-Vision : With a Focus on Sound Level Difference and Amount of Auditory Information

KimYoojin ; 김유진 ; AhnSeungjoon ; 안승준 ; LeeTaeil ; 이태일
Department of Art and Design, Korea University, Seoul, Korea 고려대학교 디자인조형학과, 서울, 대한민국 Department of Art and Design, Korea University, Seoul, Korea 고려대학교 디자인조형학과, 서울, 대한민국 Department of Art and Design, Korea University, Seoul, Korea 고려대학교 디자인조형학과, 서울, 대한민국
저시력자를 위한 멀티미디어 콘텐츠용 음성 안내의 UX 디자인 가이드라인 : 적정 음량 차이 및 정보의 양을 중심으로

Correspondence to: Taeil Lee mimicry@korea.ac.kr

Background Because of the recent popularization of smart devices, it is common for people with low-vision to enjoy multimedia contents on an everyday basis. Although auditory guidance is an essential function in those situations, it is not carefully considered in designing the UX of it for better accessibility. The study especially focuses on finding out how many differences are required in sound levels and what amount of information is possibly acceptable for people with lowvision when enjoying multimedia contents.

Methods The study conducted user tests providing 4 sets of multimedia contents(verbal/nonverbal) and auditory guides (verbal/non-verbal) for one, and a maximum of 9 chunks of words for the other. 30 people with low-vision aged 18~50 were tested and interviewed afterwards.

Results 1) Voice guidance showed that more than 80% accuracy was provided in contrast to +45dB(unrelated contents type), and the recognition of non-verbal content was +15dB or more with verbal contents, while non-verbal contents were highly recognized in the equal volume. 2) When provided from 3 to 8 chunks, the accuracy was more than 80%. In case be to provide 3 to 8 chunks, but users preferred to provide less than 6 chunks. This is related to the analysis of two groups(students/normal), which is similar until 5 chunks, but the difference occurs at 6 chunks.

Conclusions The results showed that different level differences (verbal contents: 45dB(verbal)-15dB(non-verbal)/nonverbal contents: 45dB(verbal)-0dB(non-verbal)) are required, and that more than 5 chunks are optimal, among other findings. The study also summarizes the findings and converts them into UX design guidelines for designing audio guidance for people with low-vision.

초록

연구배경 최근 스마트 기기의 대중화로 인하여 저시력자의 멀티미디어 감상 또한 보편화 되어 있다. 이들에게는 콘텐츠 시청을 도와주는 음성 안내(TTS;Text to Speech) 기능이 필수적이라 할 수 있다. 그러나 국내 상황에서는 동시 제공하는 음성 안내 소리 크기 값과 적정 안내 음성의 길이에 대한 기준이 미비하다. 본 연구에서는 멀티미디어 감상 시에 실질적으로 필요한 음성 안내의 적정 음량 차이를 측정하고, 음성 안내의 적정한 정보의 양을 평가하고자 하였다.

연구방법 실험 진행에 앞서, 각 정보의 특성과 형태에 따라 제공해야 하는 음성 안내의 크기 또한 다르며, 저시력자와 비시각장애인이 습득하는 정보의 양은 다를 것이라는 가설을 세웠다. 실험은 크게 두 가지로, 1) 콘텐츠 형태(음성 5자리 숫자 / 비음성 신호알림음)에 따라 제공하는 안내 음성의 최적의 상대음량 크기를 측정하였고, 2) 들려주는 정보 길이에 따라 인지율이 어떻게 변하는지 측정하였다.

연구결과 1) 음성 안내는 콘텐츠(형태 무관) 대비 +45dB 이상으로 제공했을 때 80% 이상의 정확도를 보였고, 비음성 안내는 음성 콘텐츠 대비 +15dB 이상, 비음성 콘텐츠에서는 동일하게 제공해도 인지율이 높았다. 2) 정보 길이에 따른 인지율은 청크3~8로 제공했을 때 80% 이상이었으나, 대부분 청크6 이하로 제공하기를 선호하였다. 이는 대학생/ 비대학생으로 나누어 분석한 것과 연관되는데, 청크5 까지는 인지율이 비슷하나 청크6 이상부터 두 그룹간 차이가 발생하였다.

결론 최종적으로 음성 안내를 제공할 때, 음성/비음성 콘텐츠에 따라서 저시력자가 인지하는 음성 안내의 데시벨(Decibel, dB)크기에도 차이가 있으므로 콘텐츠 형태에 따라서 다른 크기로 음성안내를 제공해야 하며, 적정 정보의 양인 청크5 이하로 제공을 준수해야 한다는 UX 디자인 가이드라인을 도출하였다.

Keywords:

Low-Vision, Multimedia Sound, Voice Guidance, Auditory Information, 저시력, 다중 음성 출력, 음성 안내, 적정 음량, 적정 정보의 양

1. 서론

1. 1. 연구 배경

접근성은 시설, 제품, 서비스, 정보통신망 등의 환경을 불편함 없이 이용할 수 있는 정도를 말하는데, 주로 장애인, 노인 등의 취약계층이 어떤 시스템과 사물의 기능 및 혜택에 접근할 수 있는 가능성으로 이해된다(Oliveira, et al., 2014). 주요 선진국에서는 정보 소외계층의 접근성 확보를 위해 정보기기의 기능과 디자인에 접근성 기능을 의무적으로 포함하도록 제도화하고 있으며, 실제로 iOS, 안드로이드 등 주요 정보기기 플랫폼에는 접근성 기능이 포함되어 있고 그에 상응하는 가이드라인을 갖추고 있다. 국내 동향도 국제적인 흐름에 맞추어 접근성에 대한 법제화의 움직임이 있으며, 이에 따라 접근성을 위한 가이드라인을 위한 세부적이고 체계적인 연구의 필요성이 강조되고 있다.

한편, 국내 장애인들의 문화 및 여가활동에 대한 조사 결과를 보면, 장애 유형에 관계없이 TV시청의 비율이 가장 높게 나타나는 것을 알 수 있다(이민경, 2015). 특히 시각장애인의 TV시청 시간은 주중 하루 평균 3시간 25분, 주말 하루 평균 4시간으로 주 미디어 매체로서의 소비 비율이 높다(송종길 외, 2010). 이렇게 시각장애인의 멀티미디어 소비 비율이 높음에도 불구하고, TV 시청 시 기본적으로 혼자서 사용하지 못하여 도움을 받아야 하며, 현재 채널의 위치를 알기 어렵거나 음성안내가 없는 것이 주요한 불편 요소로 나타났다(황인욱 외, 2014).

시각장애인은 멀티미디어 감상 시 필요한 정보에 접근하기 위해서 음성 안내(이하 TTS; Text to Speech)에 의존하는 경향이 크다. TTS란 글자, 문장, 숫자 등의 정보를 음성합성을 통해 사람의 발성과 유사하게 재생시켜 주는 기능을 말한다. TTS 기술은 청각으로 정보를 전달하므로 정보에 대한 이해가 빠르지만, 다른 청각적 요소와 중복된다면 주의가 분산되어 정보를 인지하는데 어려움을 겪는다고 알려져 있다(장수민 외, 2012). 그러나 이러한 멀티미디어 감상 시에 보조적으로 도와주는 안내 음성에 대한 UX 디자인 가이드라인이 미비한 실정이다. 더 구체적으로, 멀티미디어 콘텐츠를 재생하고 있는 도중 접근성(Accessibility) 기능을 실행할 때 필요한 안내 음성의 적정 소리 크기 값이나, 안내 음성이 재생될 때 얼마만큼의 문장 단위가 가장 인지하기 쉬운지에 대한 연구가 드문 실정이다.

1. 2. 연구 목적 및 개요

시각장애인의 인지적 구조나 기능은 비장애인과 상이하여, 시각적인 크기나 형태의 인지가 어려운 대신 청각을 통해서 필요한 정보에 접근한다. Figure 1에서 볼 수 있듯 국내 시각장애인들의 디바이스를 이용한 멀티미디어 콘텐츠 소비활동이 다른 여가활동보다 높은 것을 감안하면 이들의 시청을 도와줄 음성 안내의 UX 디자인이 보다 면밀하게 고려되어야 할 것이다. 따라서 본 연구는 시각장애인 중 전맹을 제외한 저시력자를 대상으로 멀티미디어 콘텐츠 재생 중 음성 안내의 적정 음량 차이와 적정 정보의 양을 측정하고 평가하여 이와 관련된 UX 디자인 가이드라인을 제시하고자 하였다. 이를 위해 다음과 같은 내용의 연구를 진행하였다.

Figure 1

Cultural and leisure activities of Disabled persons

첫째, TTS 혹은 멀티미디어 사운드의 다중 출력 관련 국내외의 선행 연구와 음성 접근성 가이드의 국내외 적용 사례를 통해 구체적인 가이드라인을 조사하여 문제점을 파악하고 실험의 범위를 한정하고자 하였다.

둘째, 음성 안내의 상대 크기와 적정한 정보의 양을 알아보기 위하여 청각 장애를 가지지 않은 저시력자를 대상으로 한 평가 실험을 진행하고 결과를 분석하였다.

셋째, 실험 결과 및 분석을 바탕으로 하여 시각장애인을 위한 음성안내 관련 접근성 UX 디자인 가이드라인을 도출하여 제시하였다.


2. 연구 사례

2. 1. 문헌 조사

음성 안내의 청취 속도에 관한 선행 연구 사례는 Asakawa(2003)와 이희연(2014)의 연구에서 볼 수 있다. 스크린 상 음성 안내가 나올 경우, 정보 인지에 영향이 없는 선에서 얼마만큼의 적정 속도로 음성 안내를 들려주어야 하는지 그 속도를 측정한 바 있으며(Asakawa, et al., 2003), 국내에서는 스크린 리더를 사용하는 시각장애인의 한국어 청취 속도를 연구한 바 있다(이희연 외, 2014).

또한 멀티미디어 환경 내에서 시각장애인이 음성 합성기를 사용할 때, 이에 대한 사용자 요구 분석을 연구하기도 하였는데, 국내 시각장애인들은 자연스럽고 일관된 합성음과 저음의 여성음색이나 남성음색에 대한 욕구가 높았다(이희연 외, 2012). Amanda(2011)의 연구 결과에서도 여러 합성음 중 저음의 남성음성이 음성인식에 더욱 효과적이라는 결과가 있었다.

Hisashi(2007)는 스크린 리더 사용 중 시각장애인의 주요 특징을 연구하였는데, 오디오 시스템이 재생 중일 때 스크린 리더를 청취하기 힘든 이유는 기계적으로 하나의 소리 크기로만 출력하기 때문에 재생 중인 멀티미디어 콘텐츠와 분리되지 않아 인지가 어렵다고 하였다.

시각장애인 대상의 음성안내 외에도, 차량 주행 중 운전자의 주의 분산 수준에 따른 음성 인터페이스의 사용성 및 사용자 선호도를 연구하기도 하였다(서나경, 2014). 운전자의 주의 분산 정도가 높은, 특히 다중의 청각 정보에 노출된 상황에서 지속적인 음성 안내를 제공하면 사용자의 피로도가 증가하며 인지 능력 또한 낮아진다고 했다. 그렇지만 신뢰도나 만족도는 높은 경향을 보였고, 이는 주행 상황에서 시각의 단독 사용보다는 청각을 통한 정보 전달이 유용할 것이라는 결론으로 도출되었다. 그러나 효과적인 상황 안내를 위한 음성 인터페이스의 구체적인 정보를 얻을 수는 없었다.

2. 2. 국내외 사례 조사

시청각 장애인 사용자를 위한 미디어 채널인 NCAM의 접근성 가이드에는 음성 지원을 활성화 하기 위해 오디오 네비게이션 기능을 필수 가이드로 두고 있다. 국내 전자제품의 경우 대표 업체 2곳의 TV 접근성 메뉴 중 시각 장애인용 접근성 기능을 살펴보면 Table 1과 같다.

Samsung / LG Smart TV accessibility features voice guidance

삼성전자는 2014년부터 본격적으로 시각장애인을 위한 접근성 기능을 적용했다. 그 중 음성 안내 기능은 시각 장애인을 위해 스마트 TV 내 정보(방송, 서비스 등)을 음성으로 알려주고, 메뉴 위치와 기능 실행 과정을 음성으로 안내해 주는 기능이다. 이 기능은 시각 장애인이 스마트 TV를 사용하기 위한 음성 네비게이션 역할을 해준다(정범택 외, 2015).

하지만 위와 같은 기존의 연구 사례에서는 구체적으로 음성 안내를 출력해야 하는 크기나, 기존에 콘텐츠가 나오고 있을 때 제공해야 하는 상대적인 크기를 알기는 어렵다.


3. 가설 설정

저시력자는 하나의 소리에 노출되기 보다는 다중 사운드에 노출되는 일이 빈번함에도 불구하고, 현재의 멀티미디어 콘텐츠를 재생하는 제품 대표적으로 TV, 태블릿 등 에는 저시력자를 위한 음성 안내를 적정한 크기로 조절하여 재생해 주는 기능을 포함하고 있지 않다. 또한, 기존 국내 기업의 관련 접근성 UX 디자인 가이드라인에 따르면 전체 시스템의 볼륨 레벨에 의존적으로 소리 크기를 조절하는 기능의 필요성과 전체 반복 재생의 필요성에 대해서 언급하는 정도에서 그치고 있다. 콘텐츠 시청을 방해하지 않도록 하는 청각 정보의 적정 소리 크기 값과 정보의 양에 대한 구체적인 가이드가 없는 것이다. 이는 앞서 문헌 및 사례 조사에서도 유사한 연구 결과를 찾을 수 없었던 부분이다. 본 연구는 이와 같은 문제 인식 하에 다음과 같은 가설을 세웠다.

가설1. 멀티미디어 콘텐츠 감상 중 음성 안내를 인지하기 위해서는 적정한 음량 차이가 존재하며, 각 소리의 특성(음성/비음성)에 따라 차이가 다르게 나타날 것이다.

가설2. 음성 안내에 제공되는 정보의 양이 증가할수록 인지율이 감소할 것이며, 따라서 인지율 확보를 위해서는 적정한 정보의 양이 존재할 것이다.

가설3. 정보 습득 능력에 따라 개개인이 인지하는 정보의 양에 차이가 있을 것이다.


4. 실험

4. 1. 실험 개요

앞서 설정한 가설 아래, 음성안내의 적정한 상대적 크기를 측정하기 위한 실험과 음성안내의 적정한 정보량을 측정하기 위한 실험 등 2가지로 나누어 진행하였다. 실험은 청각 장애를 가지지 않은 3-6등급의 시각장애인으로서 서울 소재의 시각장애 교육기관 및 대학교에 재학 중인 18세 이상 50세 이하 남, 여 30명을 대상으로 진행하였고, 실험 기간은 2015년 6월 16일~7월 6일 사이에 진행되었다.

4. 2. 적정 상대음량 측정 실험

음성 안내의 상대음량 측정 실험은 각기 다른 형태(음성/비음성)의 멀티미디어 감상 시, 제공되는 음성 안내를 인지하는 최적의 소리 크기 사이의 차이를 도출하고자 하였다. 앞서 설정한 가설1 아래 Table 2과 같이 4가지의 경우로 세분화하여 콘텐츠와 음성안내를 조합 제공하여 실험을 진행하였다. 또한 실험 이후에 실험 결과와 진행 시 느꼈던 점에 대하여 질의응답 형식의 사후 인터뷰를 실시하였다.

Combination of Content and Voice guidance

세부적인 실험 자료는 Figure 2에서 보는 바와 같이 제공되었는데, 제공된 음성 안내의 속도와 음색은 기존 연구된 사례를 참고하였다. 음성 안내의 속도는 기본 문장 배속(1배속)으로 285.96 분당음절수 (SPM : Syllables per Minutes)를 기반으로 제공하였으며 (이희연 외, 2014), 일반적인 저시력자의 경우 정보변환 (TTS) 청취 시 남성 음성, 혹은 저음의 여성 음색을 더욱 선호하는 것으로 나타났기 때문에, 남성 음성으로 제공하였다 (이희연 외, 2012).

Figure 2

Combination of Content and Voice guidance for each Task

비음성 멀티미디어 콘텐츠는 사람의 목소리가 포함되지 않은 배경음악 으로 삼성전자의 브랜드송인 Over the Horizon을 사용하였고, 음성 멀티미디어 콘텐츠는 남성 성우가 더빙한 애니메이션 인어공주의 o.s.t.인 Under the Sea를 사용하였다. 남성 음성은 Oddcast사에서 제공하는 샘플 문장 청취 기능을 사용하여 녹취하였다 http://www.oddcast.com/home/demos/tts/tts_example.php(Korean, Junwoo로 설정). 동시에 제공한 비음성 형태의 소리는 Beep 형태의 알림소리를 사용하여 소리가 들렸을 때 손을 들어 즉각 반응하게 하였고, 음성 형태의 안내는 5자리의 숫자를 들려주고 들은 대로 말하게 하였다. 들려준 소리의 크기의 순서는 무작위로 들려주어 학습 효과를 없애고자 하였다.

실험 장소는 대학원 연구실과 특수학교의 상담실에서 진행 되었으며, 실험 참가자 외의 인원은 배제되었고 소음은 적절히 통제되었다.

Figure 3

Experimental environment and scene

4. 3. 적정 정보의 양 측정 실험

실험에 제공된 문장은 Figure 4와 같이 문장을 청크 단위로 나누어 3개 청크부터 9개 청크까지 7단위로 나누어 들려주었고, 문장의 종류는 실제 생활에서 가전제품을 사용할 때에 대표적으로 안내될 수 있는 문구를 길이별로 선정하였다. 앞서 진행한 실험에서와 같이 남성음성으로 제공하였다. 문장의 길이는 순차적으로 제공하여 어느 지점에서 인지가 가장 어려웠는지 사후 인터뷰를 통하여 정성적 응답을 수집하였다.

Figure 4

Examples of Sentence for each Task


5. 실험 결과 분석

5. 1. 적정 상대음량 측정 실험 결과

음성 안내를 제공한 경우는 5자리 숫자로 제공하였으므로 피실험자가 정확히 대답한 숫자의 개수만 체크하여 정답률을 계산하였고 (Figure 5), 반면, 비음성 안내를 제공한 경우는 Beep 형태의 알림소리에 반응하도록 하였기 때문에 성공 실패 여부로 파악하여 성공한 인원수를 계산하였다 (Figure 6). 적정 음량을 도출하기 위하여 성공률 혹은 성공 인원의 80%를 임계치로 상정하였다.

Figure 5

A case provides contents(verbal/non-verbal) during voice guidance

Figure 5의 그래프에서 보는 바와 같이 음성 안내를 제공할 경우, 콘텐츠의 음성/비음성 여부에 상관없이 최소 +45dB(데시벨) 이상으로 제공했을 때 80% 이상의 정확도를 보이는 것을 알 수 있다. 같은 음성안내를 제공하더라도 배경 콘텐츠의 음성/비음성 여부에 따라 정확도는 조금씩 달라졌는데, 비음성 콘텐츠에서 음성 콘텐츠보다 평균적으로 더 높은 정확도를 보였다. 이는 피실험자에게 음성으로 제공된 정보와 콘텐츠 간의 정보 간 간섭효과가 발생하여 정확도가 더 낮게 나온 것으로 파악된다.

Figure 6

A case provides contents(verbal/non-verbal) during non-voice guidance

반면, 비음성 안내를 제공하는 경우에는 음성 안내 제공 실험과는 다른 양상을 보였는데, 음성 콘텐츠의 경우 비음성 안내 간 dB 차이값이 작아질수록 성공률이 급격하게 떨어지는 것을 발견할 수 있었다.

Figure 6의 그래프에서 보는 바와 같이 비음성 안내를 음성 콘텐츠 대비 +15dB차 이상으로 제공했을 경우에는 80%이상의 피실험자가 성공률을 보이는 데에 반해, 음성 콘텐츠 대비 0dB차 즉, 동일한 소리크기로 제공했을 때에는 50%의 피실험자 만이 비음성 안내를 인지하였다. 비음성 콘텐츠에서는 0dB차의 소리크기에서도 80%가 넘는 피실험자가 비음성 안내를 인지하였다. 이에 대하여 피실험자들은 주의해서 들어야 할 음성 정보가 없었고, 콘텐츠 또한 음성 정보가 포함되어 있지 않아서 안내를 인지하기 쉬웠다는 공통된 의견들을 나타냈다.

5. 2. 적정 정보의 양 측정 실험 결과 (모든 피실험자)

모든 피실험자를 대상으로 분석한 결과는 정보의 양이 청크3~8로 제공될 때 정확도가 80%이상인 것으로 나타났다.

그러나 청크3~5와 청크6~8에서 보이는 각 평균정확도는 차이가 있다 (Figure 7). 이는 실험 시에도 확연한 차이를 보였는데, 청크3~청크5 단위의 문장을 들려주었을 때는 대부분의 피실험자가 어려움 없이 문장을 말했으나, 청크6 이상에서는 개인차가 다소 발생했다. 이는 다음 Figure 8의 선호도 조사에서도 볼 수 있다.

Figure 7

Accuracy based on Amount of information

Figure 8

Preference based on Amount of information

사후 인터뷰를 통한 선호도 응답에서도 대부분의 응답자가 청크6 이상 제공은 선호하지 않는다고 답하였다. 그러므로 정확도 및 선호도를 종합적으로 고려할 때 청크5가 가장 적정한 청크 단위인 것을 확인할 수 있다.

5. 3. 적정 정보의 양 측정 실험 결과 (대학생/비대학생)

앞서 진행한 분석에서 청크6 이상에서의 정확도와 선호도 차이를 확인하였는데, 이는 문장의 길이에 따라 쉽고 어려움을 생각하는 개인차가 크다는 것을 의미한다. 따라서 나이와 간접적인 지식 습득 능력에 준하여 피실험자를 2그룹(대학생 11명, 비대학생19명)으로 다시 나누어 분석을 진행하고자 하였다.

Figure 9

Accuracy difference between two groups(students/normal)

그 결과 청크5까지는 대학생과 비대학생 모두 정확도가 비슷하지만 청크6~8에 걸쳐 대학생과 비대학생의 정확도에서 차이가 발생하였다.

이는 선호도 응답에서도 차이가 확연했는데, 대학생이 비대학생보다 정답률 및 선호도에서 더 높은 값을 보이는 원인은 TTS 등의 기존 음성을 통한 학습에 더 친숙하여 선호도가 높은 것으로 추정된다.

Figure 10

Preference difference between two groups(students/normal)


6. UX 디자인 가이드라인 제안

앞서 분석결과에서 볼 수 있듯이, 저시력자가 멀티미디어 감상 시에 음성 안내를 제공할 경우에는 단순히 크거나 동일한 소리 크기가 아닌 적정한 음량 차이를 주어야 인지할 수 있으며, 콘텐츠의 특성 즉, 음성/비음성 여부에 따라 저시력자가 인지하는 dB크기에도 각각 차이가 있음을 발견하였다. 특히, 음성 안내 제공 시에 비음성 안내보다 더 큰 음량 차이가 필요하다. 사후 진행한 인터뷰에서는 음성 안내의 인식의 어려움이 단지 음성이기 때문이 아니라, 문장 단위가 아닌 숫자로만 제공한 것과 관련이 있다는 의견들이 다수 제시되었다. 이를 보완하기 위해서는 실제 스마트 기기에서 사용될 수 있는 특정 문장을 선별하여 자연스러운 상황 속에서 실험을 진행할 필요가 있다.

또한 제시되는 문장의 청크의 단위는 개인의 정보 습득 능력과 음성 합성기의 사용 경험에 따라 기준이 상이하며, 실험 환경 특성상 피실험자들의 집중도가 높았다는 점을 고려해야 한다. 정보 습득 능력이 보다 낮다고 판단되는 그룹에 적정한 청크 단위는 최소기준 청크5로 선정하고, 높다고 판단되는 그룹의 적정 기준은 청크6으로 선정할 수 있다. 따라서 저시력자 및 비시각장애인이 선호했던 5개의 청크가 적정하며, 6개 이상의 청크가 포함된 문장을 제공할 시, 두 문장으로 나누어 제공해야 한다. 해당 가이드라인을 요약하면 다음 Table 3, 4와 같다.

Recommended Optimum volume of voice guidance

Recommended Optimum Chunk of Information of voice guidance

이를 바탕으로 멀티미디어 콘텐츠용 음성 안내에서의 UX 디자인 가이드라인으로 요약하여 제시하면 다음과 같다.

·멀티미디어 감상 시에 음성 안내를 제공할 경우, 적정하게 차이가 있는 음량을 제공해야 한다.
·콘텐츠의 특성(음성/비음성)과 음성 안내의 특성(음성/비음성)에 따라 적정 음량 크기를 다르게 제공해야 한다.
·음성 콘텐츠 시청시, 음성 정보 제공일 경우 45dB 이상 / 비음성 정보 제공일 경우 15dB이상 차이가 나도록 제공한다.
·비음성 콘텐츠 시청시, 음성 정보 제공일 경우 45dB 이상 / 비음성 정보 제공일 경우 0dB이상 차이가 나도록 제공한다. (정확도 80% 기준)
·음성 안내로 제공되는 문장의 길이는 개인의 정보 습득 능력에 따라 기준이 상이하다.
·음성 안내는 최소기준 청크5 이하를 기준으로 제공한다.
·청크6 이상의 문장을 제공할 시, 두 문장 이상으로 나누어 제공한다.

7. 결론 및 향후 연구 과제

본 연구에서는 비시각장애인과 저시력자와 같은 정보 소외계층 간에 존재하는 격차를 줄이고, 콘텐츠 이용 기회를 능동적으로 높이고자 멀티미디어 콘텐츠용 음성 안내 가이드라인을 제안하였다. 또한 일상 생활의 다중으로 출력되는 소리에 노출되는 상황에서도 잘 인지할 수 있는 적정한 크기의 음성 안내를 구체적으로 제안하였고, 이것은 저시력자 뿐만 아니라 비시각장애인도 아우를 수 있는 UX 디자인 가이드라인이 될 수 있다고 생각한다.

저시력자의 멀티미디어 감상 니즈가 높아지고 있으며, 필수적으로 음성 안내에 의존해야 한다는 것을 생각해 볼 때, 향후에는 단순한 가이드가 아닌 UX적 관점에서의 세분화된 연구가 필요하다. 특히 그 때에 저시력자의 감성, 불편함, 니즈 등 경험적 측면의 요소들을 수집하여 만족감도 높일 수 있는 연구가 필요할 것이다. 구체적으로, 제공하는 콘텐츠의 종류와 구성에 따른 음성 크기의 차이, 제공받는 이의 상황 내에서 적합한 음성의 특성 및 요소 또한 추후 함께 연구해보아야 할 문제로 고려할 수 있다. 본 연구에서 도출된 구체적인 UX 디자인 가이드라인으로 관련 제품 생산자 혹은 정보 제공자가 참고하길 바라며 향후에도 지속적인 연구와 제품 개발이 필요할 것이다.

Acknowledgments

This work was done by 2015 Samsung Electronic Research Fund.

Notes

Citation : Kim, Y., Ahn, S., & Lee, T. (2017). UX Guidelines for Designing Audio Guidance of Multimedia Contents for Low-Vision - With a Focus on Sound Level Difference and Amount of Auditory Information. Archives of Design Research, 30(1), 131-143.

Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.

References

  • Asakawa, C., Takagi, H., Ino, S., & Ifukube, T. (2003). Maximum listening speeds for the blind. Proceedings of the 9th International Conference on Auditory Display (ICAD) , Boston, MA.
  • Hwang, I., Kim, H., Kang, W., & Ahn, C. (2014). Design of TV Control Gesture Commands for Visually Impaired People. The Korean Society Of Broad Engineers, 12-14.
  • Jang, S., et al. (2012). Design and Implementation of a Navigation System for Visually Impaired Persons. Journal of The Korea Contents Association, 12(1), 38-47, [https://doi.org/10.5392/JKCA.2012.12.01.038] .
  • Jung, B., & Cho, J. (2015). Design a Remote Control and UX of Smart TV to Enhance Accessibility for Visually Impaired. KSDS Conference Proceeding, 72-73.
  • Lee. M. (2015). Social, Cultural and Leisure Activities of People with Disabilities: Current State and Policy Implications. Health and Welfare Policy Forum, 61-73.
  • Lee, H., & Hong, K. (2012). A Study on Usability and Needs of Speech Synthesizer for the Blind. Special Education Research 11, (2), 55-75, [https://doi.org/10.18541/ser.2012.06.11.2.55] .
  • Lee, H., Jang, Y., & Hong, K. H. (2014, July). A Comparison of the Listening Speed of the Korean TTS For the Blind: Based on their Screen Reader Experiences. In International Conference on Computers for Handicapped Persons (pp. 49-52). Springer International Publishing.
  • Miyashita, H., Sato, D., Takagi, H., & Asakawa, C. (2007, May). Making multimedia content accessible for screen reader users. In Proceedings of the 2007 international cross-disciplinary conference on Web accessibility (W4A) (pp. 126-127). ACM.
  • Oliveira, R., de Abreu, J. F., & Almeida, A. M. (2014). Promoting iptv accessibility for visually impaired users: implementation of an adapted service. Procedia Computer Science, 27, 113-122, [https://doi.org/10.1016/j.procs.2014.02.014] .
  • Seo, N. (2014). Design of Voice Guidance Interface to Provide Situational Information under Adaptive Cruise Control System. Graduate School of Culture Technology, KAIST.
  • Stand-alone Web document. (no author, no date). Invent + Build Guidelines.(n.d.). National Center for Accessible Media . Retrieved 1993, from http://ncam.wgbh.org/invent_build.
  • Stent, A., Syrdal, A., & Mishra, T. (2011, October). On the intelligibility of fast synthesized speech for individuals with early-onset blindness. In The proceedings of the 13th international ACM SIGACCESS conference on Computers and accessibility (pp. 211-218). ACM.

Figure 1

Figure 1
Cultural and leisure activities of Disabled persons

Figure 2

Figure 2
Combination of Content and Voice guidance for each Task

Figure 3

Figure 3
Experimental environment and scene

Figure 4

Figure 4
Examples of Sentence for each Task

Figure 5

Figure 5
A case provides contents(verbal/non-verbal) during voice guidance

Figure 6

Figure 6
A case provides contents(verbal/non-verbal) during non-voice guidance

Figure 7

Figure 7
Accuracy based on Amount of information

Figure 8

Figure 8
Preference based on Amount of information

Figure 9

Figure 9
Accuracy difference between two groups(students/normal)

Figure 10

Figure 10
Preference difference between two groups(students/normal)

Table 1

Samsung / LG Smart TV accessibility features voice guidance

구 분 기능 설명
삼성 스마트 TV
(모델명 : 65JS9500)
음성안내
(TTS 기반)
현재 방송, 방송 정보 음성 안내, 시청 예약 안내, 실행 가능 인터넷, 검색, 마이 콘텐츠 등의 서비스를 음성으로 안내
화면 해설 방송 방송 표준 항목
LG 스마트 TV
(모델명 : 60LF6500)
화면 해설 방송 방송 표준 항목

Table 2

Combination of Content and Voice guidance

콘텐츠/음성 안내 음성 비음성
음성 Task 1 Task 2
비음성 Task 3 Task 4

Table 3

Recommended Optimum volume of voice guidance

콘텐츠/정보 형태 음성 비음성
음성 45dB 15dB
비음성 45dB 0dB

Table 4

Recommended Optimum Chunk of Information of voice guidance

청크 5 이하 권장
청크 6 이상 두 문장 이상으로 나누어 제공 권장