[ Article ]

Archives of Design Research - Vol. 34, No. 3, pp.211-227

ISSN: 1226-8046 (Print) 2288-2987 (Online)

Print publication date 31 Aug 2021

Received 22 Jan 2021 Revised 20 Mar 2021 Accepted 03 May 2021

DOI: https://doi.org/10.15187/adr.2021.08.34.3.211

빅 데이터 기반 디자인 평가 매트릭스 제안 : 현대자동차와 메르세데스 벤츠를 중심으로

Yonghyuck Lee이용혁Daemyung Youn윤대명Senhyun Hwang황세현Joomyung Rhi이주명

Master of Science in Design Management, Master Student, Yonsei University, Wonju, Korea 연세대학교 디자인경영학협동과정, 석사과정, 원주, 대한민국 Management of Technology, Doctoral Student, Yonsei University, Seoul, Korea 연세대학교 기술경영학협동과정, 박사과정, 서울, 대한민국 Mechanical Enginnering, Master Student, Yonsei University, Seoul, Korea 연세대학교 기계공학부, 석사과정, 서울, 대한민국 Division of Design & Arts, Associate Professor, Yonsei University, Wonju, Korea 연세대학교 디자인예술학부, 교수, 원주, 대한민국

Suggestion of a Big Data-Driven Design Evaluation Matrix: Hyundai Motors and Mercedes Benz

Correspondence to: Joomyung Rhi jmrhi@yonsei.ac.kr

초록

연구배경 빅 데이터는 4차 산업혁명의 가장 핵심적인 요소 중 하나로서 다양한 기업과 산업군뿐만 아니라, 국가 주도적으로 혁신적인 비즈니스 모델을 만들고자 노력하고 있다. 하지만 이는 데이터 관련 학문과 해당 산업의 전문가들이 주도하는 역할에 국한되고 있다. 본 연구는 디자이너가 주도할 수 있는 빅 데이터를 이용한 디자인의 평가 방법론을 제안하여, 현업에서도 실무자들이 쉽고 빠르게 데이터를 수집하고 오픈 플랫폼을 활용한 데이터 분석이 가능하도록 하는 것을 목표로 하였다.

연구방법 본 연구의 방법론으로는, 학술적 설문 방식을 대신하여 웹 크롤링을 통한 사용자와 미디어의 평가 데이터 수집을 선택하였다. 현대자동차와 메르세데스 벤츠를 주제로 하여 언급되는 사이트의 2년 치 데이터를 수집하였으며, 빅 데이터 오픈 플랫폼인 아마존 웹 서비스(AWS)의 Amazon Lex를 이용하여 데이터를 처리, 감성별로 분류하였다. 또한 언급되는 자동차 요소별의 좌표에 파이썬을 이용한 시각화된 평가 맵을 구현하였다.

연구결과 소비자 댓글과 미디어 평가는 현대자동차의 긍정 언급이 2,149개, 부정 언급이 1,056개로 긍정이 높았으며, 메르세데스 벤츠는 긍정 언급이 1,581개, 부정 언급이 1,056개로 도출되었다. 측면부 전체, 후면부 전체를 포괄하는 언급이 많았으며, 긍정과 부정 모두 측면부 전체에 대한 디자인 언급이 높게 나타나는 것을 알 수 있었다.

결론 연구를 통해 제안하고자 하는 2X2 매트릭스로 브랜드 간의 디자인 언급 차이를 한눈에 알 수 있었으며, 디자인 부위별로 히트 맵을 사용하여 언급 빈도수를 다각도로 전달할 수 있게 되었다. 이 같은 빅 데이터를 활용한 평가맵이 디자이너 주도적으로 진행될 수 있다면, 각 산업 분야에서의 디자인 역할의 중요도가 새롭게 평가받을 것으로 기대한다.

Abstract

Background Big data is one of the most important components of the next industrial revolution, which is propelled by private companies and government in an effort to create innovative business models. However, such movement is oriented from only the data discipline and industry-led professionals, having limited participation of experts from various fields. In this sense, this study proposes a designer-led evaluation methodology for design, based on big data so that practitioners can easily and quickly apply gathered data in the field. The aim is to enable data analysis using open platforms and collection.

Methods For the research method, evaluation data is collected from users and media choosing web crawling over academic surveys. The web crawling technique collected two years of data from websites under the theme of Hyundai Motors and Mercedes-Benz, and classified data by processing sensitivity using Amazon Lex from Amazon Web Services(AWS), an open platform for big data. In addition, the study implemented a visualized evaluation map using Python in the coordination of each motor vehicle element.

Results Consumer comments and media evaluations show that the number of positive comments regarding Hyundai Motors was recorded 2149, contrary to 1056 negative comments. Meanwhile, Mercedes-Benz had 1,581 positive and 1056 negative comments respectively. The most frequent comments centered around the entire side and the rear, while either positive or negative remarks about design reference focused on the entire side.

Conclusions The proposed 2X2 matrix in the study provided a glimpse of the different frequency of comments in design contingent on brands. Also, the heat map enabled the delivery of comment frequency of each design and component area at multiple angles. The importance of industrial design will be newly recognized once the evaluation map based on big data can be carried out by designers.

Keywords:

Big Data, Amazon Lex, Text Minning, Design Evaluation Matrix, Data Visualization, 빅 데이터, Amazon Lex, 텍스트 마이닝, 디자인 평가맵, 데이터 시각화

1. 서론

1. 1. 연구의 배경 및 목적

빅 데이터는 4차 산업혁명의 가장 핵심적인 요소 중 하나로서 이미 전 산업 군에서 활발히 사용되고 있다(Yoon, 2013). 최근에는 거대 기업의 빅 데이터 활용을 넘어 공공분야, 그리고 소규모의 중소기업과 개인 사업자의 단위까지도 빅 데이터를 비즈니스 분야에 활용하고 있지만, 적절하게 활용되고 있다고 말하기는 힘들다(Kim, 2017). 실제 활용되는 사례는 데이터 전후 처리가 가능한 전문 분야에 국한되고 있으며, 규모의 경제(Economy of Scale) 논리로 데이터를 활용하는 기업과 특정 분야만이 빅 데이터를 활용하는 것이 일반적인 경향이다.(Yoon, 2017). 따라서 소규모의 중소기업과 개인 사업자 단위의 빅 데이터 활용이 대중화되었다고 말하기는 어렵다고 할 수 있다. 김동완(Kim, 2013)에 따르면, 정치, 사회, 경제, 문화, 의료와 같은 분야에 빅 데이터가 활용되고 있지만, 데이터를 다룰 수 있는 인적 환경에 따라 적용 여부가 결정된다고 정의하고 있다. 디자인 산업 역시 적극적인 빅 데이터의 활용과 디지털 트랜스 포메이션(Digital Transformation) 시대의 변화를 직시하고 적절한 준비를 통해 빅 데이터 활용에 적합한 새로운 방법론 구축이 필요하며 이를 통해 뉴 노멀(New Normal) 시대를 선도할 수 있는 산업으로 발전해야 한다. 하지만 2019 산업디자인통계조사(Ministry of Trade, Industry and Energy, 2019)에 따르면 디자인은 필수적임에도 체계적으로 활용되지 않고 있어 변화의 모색이 필요하다는 것을 알 수 있다. 이런 배경을 바탕으로 본 연구는 빅 데이터 시대에 디자인적 사고(思考)를 통한 주도적인 활용과 새로운 접근법으로서 데이터 활용의 필요성과 데이터 전문가(Data Scientist)의 특징을 겸비하는 디자이너의 새로운 방향성을 제시하는 데 그 의의가 있다. (Figure 1)

Figure 1

Top 3 Factors for Leveraging Big Data(source: NATIONAL INFORMATION SOCIETY AGENCY)

본 연구는 내부 DB로부터 데이터를 수집·활용하는 방식이나 학술적 통계자료를 이용한 연구 방식이 아닌, 현업에서 신속하게 수집 가능하고 오픈 플랫폼을 이용하여 분석하는 데이터 활용 방식을 제안하고자 한다. 또한 분석된 데이터를 히트맵(Heat-map)을 통해 시각화시켜 사용자의 위치별 디자인 평가 빈도를 확인할 수 있고, 2X2 매트릭스로 전략적 의사결정을 지원하는 것이 가능하도록 구현하는 것이 본 연구의 목표이다.

1. 2. 연구의 대상과 방법

연구의 대상은 디자인으로 소구하는 대표적 제품이면서 4차 산업혁명의 대표적 산업으로 평가되는 자동차로 선정하였다(Shin, 2021). 자동차 특히 전기자동차, 자율주행자동차가 새로운 산업 패러다임의 중심에 있다는 이미 잘 알려져 있는 사실이다. (Kim, 2016, Kang, Won, Kim, & Ji, 2018). 그런 면에서 자동차는 대상에 대한 소비자 반응을 빅 데이터를 활용해 살펴보고 디자인에 반영하는 방법을 제시하고자 하는 본 연구의 주제에 부합한다. 또한 자동차 소비자의 별점과 댓글이 이후 구매에 영향을 미치는 것으로 알려져 있으며(Chin, Yi, 2017, Zhang, Park, 2015, Godes, Mayzlin, 2004) 빅 데이터 측면에서 관련 데이터의 광범위한 수집이 가능하다는 점 또한 본 연구를 실행하는 대상으로서 적합하다고 할 수 있다. 구체적으로 2019년 국내 국산차, 수입차 판매순위 1위인 현대 자동차와 메르세데스 벤츠 브랜드를 선정하였다(South Korea Ministry of Trade, Industry and Energy, 2020). 해당 브랜드를 대상으로 텍스트 마이닝(Text mining)을 진행하고, 아마존의 AWS(Amazon Web Services)를 이용한 감성 분석과 빈도수 분석을 통해 브랜드별 언급 좌표를 확인하였다. 확인된 자동차 브랜드별 좌표에서 브랜드별 긍정과 부정 언급 빈도를 표시하여 디자이너가 향후 디자인을 위한 디자인 요소의 계승 요소(강점)와 개선 요소(보완)에 대한 시각적 분석이 가능하도록 구성하였다. 본 연구는 2020년 한국IT서비스 학회지에 게재된 ‘빅 데이터를 통한 브랜드 평가 맵 제안’에 대한 후속 연구로서(Youn, 2020), 기존의 사용자 댓글을 통한 마케팅 4P(Product, Place, Promotion, Price)를 도출한 연구 결과를 디자인 중심의 사용자 감성과 언급 빈도수를 간편하게 도출하여 활용할 수 있는 방법으로 발전시킨 보완 연구라고 할 수 있다. 이를 위해 기존의 자동차 품질 평가 방법인 소비자 지각 품질(CPQ:Consumer Perceived Quality)의 설문 기준을 적용하고 빅 데이터를 활용하기 위한 텍스트 마이닝을 실행한 후, 해당 값들을 대상으로 아마존 웹 서비스(AWS)에서 감성 분석을 실시한다.

2. 연구의 이론적 배경

2. 1. 빅 데이터를 통한 브랜드 평가 맵 제안(Proposal of Brand Evaluation Map through Big Data)

선행 연구인 빅 데이터를 통한 브랜드 평가 맵을 통해 현대자동차의 브랜드를 소비자 댓글들을 마케팅 4P(Product, Price, Place, Promotion)로 변환하여 맵으로 구현하였다. 해당 연구는 고객의 생각을 인지하고 제품에 고려해야 하는 요소를 반영하여 해당 회사와 기존 구매자 및 구매 예정자 간의 브랜드 이미지 및 디자인 소통을 이뤄내는 것이 주요한 목적이었다. 하지만 오브제의 신화분석 및 소비가치 모델을 마케팅 4P 전략과 융합하여 맵(Map)을 제안하는 과정에서 연구자의 직접적인 판단으로 분류했기 때문에 현업에서 사용하기에는 객관성 부족과 시간적 효율성이 떨어지는 문제점을 발견하였다. 이번 연구는 디자이너가 데이터 전문가로서 활용할 수 있는 데이터 수집의 시간 단축, 그리고 분류 자동화로 디자인의 평가 내용으로 개발하는 것에서 기존 연구를 보완한다.

2. 2. 소비자 지각 품질(CPQ: Consumer Perceived Quality)과 사용자 경험 품질(XQI: User Experience Quality Index)

Zeithaml(1988)에 따르면, 소비자 지각 품질은 제품 혹은 서비스의 전반적 우월성(superiority) 혹은 우수성(excellence)에 대한 총체적 평가이다. 지각 품질은 소비자가 브랜드를 대상으로 느끼는 가치로 평가되며, 같은 기능과 품질을 갖고 있는 제품이라도 브랜드 여하에 따라 가격과 판매의 차이를 보인다. 또한 브랜드와 디자인은 소비자가 특정한 제품에 호감을 갖게 됨으로써 가치가 부여된 부분을 브랜드 가치(Brand equity)라 정의하는데, 이는 심미적 요소에 반응하는 디자인적 요소의 가치기준으로도 평가할 수 있다(Farquhar, 1989). 이러한 소비자 지각 품질의 개념을 정리하면 아래 Table.1과 같다.

Table 1

CPQ: Consumer Perceived Quality

본 연구는 선행된 소비자 지각 품질의 연구사례에서 브랜드와 디자인을 평가하는 소비자 평가로서 측정된 선행 연구사례, Kim(2012)과 Park(2008), 그리고 JIANG QIYU(2019)를 검토한 후 기존의 데이터 수집을 위한 설문 과정 대신에 소비자 댓글과 주제를 다룬 기사 매체를 텍스트 마이닝 하여 평가할 수 있다고 판단하였다. 특히, 소비자의 자동차 디자인을 평가하는 연구 척도로서 소비자 지각 품질을 활용하여 유의미한 연구결과가 있었다는 Kim(2012)의 연구를 토대로 본 연구 또한 소비자 지각 품질을 중심으로 접근하였다. 다만, 기존의 선행 연구에서는 설문을 통한 브랜드의 디자인 요소 외의 기능과 가격에 따른 질문 항목 요소가 포함되어 있기 때문에, 디자인 평가를 위한 주제에 집중하기 위해 제외하도록 하였다. 연구를 위해 자동차 품질평가 방법 중 하나로 활용되는 소비자 지각 품질(CPQ: Consumer Perceived Quality)과 디자인산업 중심으로 개량한 한국디자인진흥원의 사용자 경험품질(XQI: User Experience Quality Index)의 기준을 참고하여 본 연구의 참고 척도로 설정하였다(KOREA INSTITUTE OF DESIGN PROMOTION, 2019). 척도의 구성은 Figure 2와 같다.

Figure 2

XQI: User Experience Quality Index(source: KOREA INSTITUTE OF DESIGN PROMOTION)

본 연구는 사용자 경험 품질을 구성하는 3가지 핵심가치 중에서 미적 가치(Aesthetic Value) 평가를 중점으로 진행한다. An, Park(2018)에 따르면 사용자의 언급 빈도가 미학적 어휘들과 연결되어 있다는 연구 결과를 토대로 자동차 사이트의 소비자 댓글의 긍, 부정 언급 빈도는 디자인의 평가와 관계가 있다고 사료되었다. 또한 Petty, Cacioppo(1981)의 고관여 소비자들의 반응 이론을 지지하는 맥락에서 본 연구에서 다루고 있는 사용자 댓글의 감성 빈도는 자동차 디자인 평가에 유의미한 영향이 있을 것이라 사료되었다. 따라서 본 연구는 사용자 경험 품질의 연구 척도에서 심미성만을 언급하는 소비자와 매체 언급의 긍정, 부정 데이터와 구체적인 디자인 요소 언급에 대한 빈도수로 디자인 평가 맵을 구축하는 것에 목적을 둔다. 사용자 경험 품질 핵심가치요소 중, 심미적인 측면은 아래 Figure 3과 같이 하위 항목 10가지로 분류되어 있는데, 해당 항목들은 인터넷상에서 소비자의 자동차 디자인 관련 의견들이 대부분 포함된다고 판단하였다.

Figure 3

Definition of Aesthetic Value(source: KOREA INSTITUTE OF DESIGN PROMOTION)

2. 3. 웹 크롤링

웹 크롤러는 웹 로봇, 웹 스파이더 등의 이름으로 불리기도 하며, 방대한 양의 웹 문서를 자동으로 돌아다니며 각종 정보를 수집하는 프로그램이다. 수집된 웹 문서 내 포함된 URL(Uniform Resource Locator)을 기반으로 다른 웹 문서들을 돌아다니며 정보를 수집하는 기능을 수행하기 때문에 이러한 이름이 붙여졌다(Kim, 2017). 웹 크롤러는 머신의 개수와 동작 방식에 따라 일반 웹 크롤러와 분산 웹 크롤러로 나눌 수 있다. 분산 웹 크롤러는 멀티-스레드 크롤러와 서버-클라이언트 크롤러로 나뉘는데, 본 연구에서는 분산 웹 크롤링 방식으로 진행하였다. 다수의 머신을 사용하는 분산 웹 크롤링 방식은 데이터 수집시간을 줄이기 위해 서버-클라이언트 구조를 이용한다(J.Cho et al, 2006). 이 방식은 서버에서 시드 URL을 관리하고, 각 클라이언트에 시드 URL을 분배한다. 클라이언트는 시드 URL의 대상이 되는 데이터에 접속하여 필요한 내용을 추출하고 다시 서버로 전송하거나 직접 데이터베이스에 저장하는 구조로 이루어져 있다.

2. 4. AWS(Amazon Web Service)

AWS는 Amazon.com에서 제공하는 클라우드 서비스 플랫폼이며, 각종 컴퓨팅, 데이터베이스 스토리지, 콘텐츠 전송 및 기타 빅 데이터 분석 등을 제공하는 서비스이다(AWS, Dec 12, 2020). 최근 빅 데이터의 중요성이 대두됨에 따라, IBM, Microsoft, Google이 각각 Big Insight, Azure, Google Cloud Platform을 개발하여 서비스하고 있다. 데이터 활용과 점유율 면에서는 AWS가 33%를 차지하여 선도하고 있는 실정이다(eWEEK, Dec 12, 2020). AWS는 더 많은 사용자들의 데이터를 수집, 딥러닝을 통해 제공되고 다른 클라우드 공급 서비스보다 인공지능과 분석 결과가 우수한 특징이 있다(Park,2018). 그렇기 때문에, 기존의 파이썬과 R을 이용한 데이터 처리보다 더 많은 데이터를 처리할 수 있으며, 개인의 컴퓨터 사양과 상관없이 빅 데이터 처리를 할 수 있다는 점에서 현업에서 활용 가능하다고 판단하였다. 본 연구에서는 대규모 전산 시스템의 조건이나, 연구기관 등의 고도화된 컴퓨터 없이 빅 데이터를 처리할 수 있다는 면에서 실제적인 디자인 평가가 가능하다고 판단하였다(Park,2018). 연구에는 AWS 서비스 중, 딥러닝 기반의 AI 서비스인 Amazon Lex를 이용하여 감성 분석을 진행한다.

3. 개발과정

3. 1. 연구 설계

본 연구에서는 앞서 서론에서 언급한 ‘빅 데이터를 통한 브랜드 평가 맵 제안’을 현업에서 활용 가능하도록 빅 데이터의 처리를 간편하게 보완하는 것과 동시에 다각화로 디자인 평가 측정을 가능하도록 심화하고자 한다. 더불어 사용자 경험 품질(XQI) 중, 미적가치 척도 부분에 집중하기로 하였다. 연구를 위한 사용자 평가와 정보 데이터 수집은 웹 크롤링을 이용하여 자동차 평가 데이터가 존재하는 사이트를 선택하여 아마존의 오픈 플랫폼인 AWS(Amazon Web Service)의 Amazon Lex를 이용하고, 파이썬의 코딩 비율을 줄이면서 빅 데이터 분석이 가능하도록 설계하였다. 다만, Amazon Lex는 딥러닝이 포함된 자체 분석 엔진으로 인해 데이터 결과의 이유와 경로를 설명하지 못한다. 이것은 학술적인 용도와 데이터 전문가를 통해 구성 별로 수집 데이터를 분류, 처리하는 기존 방식과는 다른, 전 세계의 데이터를 기반으로 딥러닝되어 있는 학습 데이터를 이용한다는 점에서 더 신속하고 정확한 성과를 낼 수 있다. 이는 Yun(2019)의 연구에서도 데이터 분석 결과로 증명된 바 있다. 연구의 설계 도식은 Figure 4와 같다.

Figure 4

Research framework

본 연구의 설계에 따른 작업 순서는 다음과 같다.

첫째, 자동차 관련 기사와 사용자의 댓글을 수집을 웹 크롤링을 통해 진행한다.

둘째, 수집된 데이터를 AWS의 딥러닝 기술인 Amazon Lex로 긍·부정의 텍스트를 분류한다.

셋째, 연구 주제인 현대자동차와 메르세데스 벤츠의 자동차 디자인 요소의 위치 좌표를 설정한다.

넷째, Amazon Lex를 이용하여 자동차의 디자인 요소 좌표와 감성별 언급 빈도수를 히트 맵으로 표시한다.

마지막으로 도출된 감성 별 언급 내용을 Figure 5와 같은 디자인 평가 매트릭스에 대입하여 사용자의 디자인 강점 요소와 보완 요소를 표시한다.

Figure 5

Design Evaluation Matrix

3. 2. 선정 브랜드의 미디어 웹 크롤링

본 연구는 사용자 경험 품질의 하위 척도인 미적가치 기준으로 오피니언 데이터를 수집하였다. Lee(2018)에 따르면 포털 사이트 내에서 사용자의 관심도는 자동차의 판매 대수와 유사한 패턴을 띄고 있다는 점에서 웹 크롤링으로 인한 소비자 댓글 데이터가 연구에 유효하다고 사료되었다. 본 연구에서는 사용자 댓글 외에 자동차의 뉴스 기사를 병행 수집하였는데, Hwang(2016)에 따르면 사용자 리뷰와 댓글 데이터는 편중적인 경향을 보인다는 내용을 보완하기 위하여 뉴스 기사와 사용자 댓글을 수집하여 데이터 수를 보강하였다. 현대자동차와 메르세데스 벤츠 뉴스 기사는 네이버, 다음, SK 엔카, 다나와 등에서 수집하였으나, 사회 뉴스와 함께 주제로 삼고 있는 현대자동차의 홍보기사가 반복적으로 표시되고 있는 네이버는 수집 대상에서 제외하였다. 사용자 댓글을 기반으로 감성 분석을 진행할 경우, Jo(2015)가 연구한 내용과 같이 평가자의 극성(Polarity)이 필요한데, 다음 자동차와 SK 엔카의 자동차 리뷰 페이지에 별점과 함께 사용자 리뷰 데이터가 존재하여 데이터 수집 사이트로 선정하게 되었다. 다나와 자동차의 경우 자동차 뉴스 기사가 중복되지 않고, 호평 기사와 비판 기사가 주제별로 선별되어 있어 해당 사이트를 선정하였다. 연구 데이터 수집을 위한 내용은 Table.2와 같다.

Table 2

The contents of the data collection

웹 크롤링은 1) 게시글의 목록을 수집하는 단계 2) 게시글의 내용을 수집하는 단계 3) 게시글에서 내용을 뽑아내는 단계로 나누어 진행되었다. Figure 6의 화면과 같이 1)단계에서는 브라우저에서 동작하는 JavaScript를 이용해 게시판의 다음 페이지로 이동하는 버튼을 누르고 게시글의 고유한 ID들을 수집하는 동작을 반복했다.

Figure 6

example of Web Crawling

이러한 데이터는 Local Storage API에 저장된 후 다음 단계에서 읽을 수 있도록 서버에 파일로 저장되었다. 2)단계에서는 Server-side JavaScript Node.JS를 이용하여 목록에 있는 게시글들의 내용을 불러올 수 있는 API를 호출했으며, 바로 이어서 구글이 개발한 Boiler pipe content extractor에 입력하였다. Yatskov(2018)에 따르면 Boiler Pipe은 방대한 데이터를 효율적으로 분류한다는 연구결과를 발표하였고, Jiménez et al.(2018)의 연구에서도 불필요한 데이터 분류 기능과 주제의 선별기능은 최고의 성능이라고 평가한 내용을 토대로 수집된 텍스트 데이터를 현대자동차와 벤츠사의 관련된 내용으로 분류하였다. 그리고 그 결과를 AWS Relational Database Service에 존재하는 Aurora 데이터베이스에 저장하여 추후 쉽게 가공하고 불러올 수 있도록 하였다.

3. 3. Amazon Lex를 이용한 감성분석

Boiler pipe content extractor에서 가져온 기사 본문에 대해서 문장 단위로 Amazon Lex를 이용하여 감성 분석을 실시하였다. Amazon Lex는 딥러닝 기반의 AI 서비스로, Amazon Comprehend와 통합하여 데이터의 감정을 감지한다(AWS-Sentiment Analysis, Apr 5, 2021). 분석된 데이터는 기사 본문에 포함된 문장들에 대해 같은 자동차 부위를 의미하는 명사가 언급되었는지를 기준으로 데이터 군집(Clustering)을 진행하였고, Nested loop, Hash table algorithm 등을 사용하는 SQL의 JOIN 문법을 사용하였다. 데이터를 처리 구조는 Figure 7과 같다.

Figure 7

Data Collection Processing Diagram

3. 4. 자동차 브랜드별 요소 분류

자동차를 구성하는 하드웨어적 디자인 아이덴티티 형성에 기여하는 구성요소의 기준으로 선행 연구를 진행한 Kim(2015)의 연구에 따르면, 자동차 디자인의 구성요소는 전면부, 측면부, 후면부로 나뉘며 세부적 분류 내용은 아래 Figure 8과 같다.

Figure 8

Automotive design components by brand 1

자동차 디자인 구성요소 기준으로 전면부는 전면부 전체, 프런트 에어댐, 라디에이터 그릴, 엔진후드, 프런트 디퓨저, 전면부의 로고, 헤드라이트로 분류하였고, 측면부는 측면부 전체, 오버 펜더, 알로이 휠, 에어 벤트, 사이드 스커트, 그리고 앞뒤의 차체 문으로 분류하였다. 마지막 후면부는 후면부 전체, 리어 에어댐, 머플러, 리어 디퓨저, 리어 스포일러, 글라스 스포일러, 후면부의 로고, 그리고 테일램프로 분류하였다. 언급된 자동차의 부위별 명칭 외에 사용자가 통상적으로 언급하는 동의를 포함한 내용은 Table.3과 같이 정리하여 뉴스 언급 및 사용자 댓글 데이터 분류가 가능하도록 설정하였다.

Table 3

Synonyms for automotive design components

도표에서 언급되는 자동차 구성요소가 이미지 맵으로 측정될 수 있도록 Figure 9와 같이 각 요소별 좌표를 지정하여, 자동차 디자인 요소의 위치별 언급 빈도수가 히트 맵으로 출력될 수 있도록 하였다.

Figure 9

Automotive design components by brand 2

3. 5. AWS의 Amazon Lex를 이용한 히트 맵 표현

위와 같이 구성된 문장들을 아마존이 개발한 인공지능 서비스인 Amazon Lex를 이용하여 데이터 처리를 하였다. Amazon Lex는 자연어로부터 정형화된 데이터를 얻어내는 등의 용도를 가지고 있는 딥러닝형 챗봇 API이다(Figure 10). 때문에 위에서 설정된 데이터를 API의 부가적인 기능을 이용하여 감성 분석을 수행하였다. Lex의 Post Text method를 사용하면 Positive, Negative, Neutral, Mixed 점수를 0~1 사이의 값으로 Return한다. 이중 Positive, Negative, Positive - Negative 값을 이용했다.

Figure 10

Web page of Amazon Lex

데이터를 시각화하기 위해 파이썬의 numpy, matplotlib 라이브러리를 이용하였다. 파이썬을 Aurora 데이터베이스와 연동해 적절한 Query로 데이터 처리 후, Figure 11과 같이 numpy와 matplotlib를 이용해 Amazon Lex가 제공한 데이터를 시각화하였다.

Figure 11

Example of Data Visualization Coding Screen

4. 연구 결과

시각화 코딩에 대한 연구결과는 다음과 같다. 연구 주제인 현대자동차와 벤츠의 사용자 댓글의 자동차 요소 언급의 감성 유형에 따라 자동차 도면에 표시하여 직관적이고 용이하게 파악할 수 있게 하였다. 또한 2X2 매트릭스를 활용, 해당 회사의 디자인 평가와 디자인 홍보 측면에서 계승해야 할 부분과 개선해야 할 부분을 표시하여 구체적이고 세분화하였다. Sun(2016)은 텍스트 마이닝 연구 결과를 전달하기 위해 2X2 매트릭스를 활용한 사례가 있으며, UX 디자인 연구에서도 Park et al.(2019)의 데이터 기반 연구에 사용된 점을 비추어 볼 때, 본 연구의 사용자 긍, 부정의 빈도수를 보여주기에 적합하다 사료되었으며 해당 내용은 Figure 12, 13에서 브랜드 별 결과를 확인할 수 있다.

Figure 12

The results of design evaluation matrix (Hyundai Motors)

Figure 13

The results of design evaluation matrix (Mercedes Benz)

그 결과 현대자동차의 긍정 언급은 2,149개, 부정 언급은 1,056개로 도출되었으며, 메르세데스 벤츠는 긍정 언급 1,581개, 부정 언급은 1,056개로 도출되었다. 본 연구를 통해 알 수 있는 점은 사용자 댓글과 뉴스 기사에서 언급되는 디자인 평가는 세부적인 요소의 평가보다는 측면부 전체, 후면부 전체에 해당하는 포괄적인 범주로 평가하는 것을 알 수 있었다. 디자인 부위에 대한 언급으로는 현대자동차(긍정25.4% / 부정27.1%)와 벤츠(긍정24.2% / 부정25.8%) 모두 자동차의 측면부에 대한 긍정과 부정에 대한 언급이 모두 높았다. 두 브랜드의 차이로는 현대자동차의 경우, 자동차 후면부에 대한 긍정 언급 빈도가 18.9%를 차지하는 반면, 벤츠사의 경우에는 6.6%로 중요한 비중을 차지하지 않았다. 또한 벤츠사의 휠 디자인에 대한 긍정 언급은 33.3%로 가장 높게 나타나, 현대자동차에서 17.9%를 차지한 언급 비율과 차이를 보였다. 이로써 2X2 매트릭스로 브랜드 간의 긍정 요소와 부정 요소를 확연히 판단할 수 있는데, 현대자동차의 ‘반드시 계승’해야 하는 디자인 요소로는 측면부, 후면부, 그리고 휠 디자인 요소가 꼽힌 반면, 메르세데스 벤츠의 경우에는 휠 디자인, 후면부 디자인으로 평가되었다. 하지만 ‘반드시 개선’되어야 하는 부정 언급이 많은 부분에서도 두 브랜드 모두 측면부 전체라는 동일한 요소가 꼽히는데, 이는 자동차 디자인을 평가할 때, 사용자가 측면부의 형태를 중요하게 생각한다는 것으로 해석될 수 있다. 높은 존재감으로 긍, 부정의 언급 빈도가 동시에 나타나는 것으로 판단된다.

5. 결론 및 제언

본 연구는 빅 데이터를 활용한 디자인 평가 매트릭스를 제안하기 위해 진행되었다. 사용자의 평가 항목이 댓글과 브랜드 뉴스 미디어에 의해 영향을 받고 있다는 것에 착안하여 일반적으로 설문 등을 통해 수집하는 사용자 경험 품질의 심미적 요소 관련 사항을 온라인의 관련 언급에 대한 데이터 수집을 통해서도 가능하다는 것을 확인하였다. 웹 크롤링과 Amazon Lex를 통한 AI의 감성 평가로 2년 동안 축적된 사용자 감성 데이터를 하루 정도의 시간에 수집, 분석하는 것이 가능하였다.

또한 기존 R과 파이썬의 데이터 기술자 중심의 코딩 언어 중심으로 처리되는 것과 다르게 아마존 웹 서비스(AWS)의 딥러닝 AI인 Amazon Lex를 활용하여 데이터의 수집과 처리가 간편해졌고 긍, 부정의 빈도와 좌표를 디자인 평가 매트릭스로 구현하여 결과의 활용성을 높였다. 제안된 디자인 평가 매트릭스를 통해 브랜드 간의 선호 디자인 요소와 비선호 디자인 요소를 한눈에 확인할 수 있었던 점도 주목된다. 디자이너가 주도할 수 있는 빅 데이터 분석 방법으로 오픈 플랫폼을 경유하여 시각화된 평가 맵을 개발·활용한다면, 자동차 차기 모델을 위한 디자인 보완과 강점을 살린 디자인 계획 수립이 가능할 것으로 보인다. 이런 방법은 디자인 분야를 넘어서서 브랜드 광고·마케팅의 분야에까지 활용 분야를 넓힐 수 있을 것이다. 현업에서의 활용 예시를 들자면, 프로젝트 입찰 및 기획 방안으로 평가받는 고객사에 유용한 효과적인 분석 방법으로 사용 가능할 것으로 추정된다. 데이터 경제 시대에 적합한 데이터 주도(Data-Driven) 디자인 방법론을 활용하는 것이 새로운 디지털 디자이너의 역량으로서 평가받는다면, 각 산업 분야에서의 디자인 역할의 중요성이 더 높아지는 계기가 될 것으로 기대한다.

6. 연구의 한계점

본 연구를 진행함에 있어 한계점은 다음과 같다. 첫째, 디자인 산업 주도의 데이터 기반 분석 맵을 제안하는 과정에서 개괄적 대상 범위의 한계가 있다. 다시 말해, 자동차의 주제 범위는 세단, 해치백, SUV 등 유형의 범주로 분류되어 후속 연구 되어야 할 필요성이 있으며, CMF(Color, Material, Finish)의 분류로 나누어 사용자별 언급 내용과 감성 빈도수에 대한 연구 분석이 필요하다고 사료된다. 하지만 본 연구에서 제안하고자 하는 주제는 데이터를 활용한 디자인 평가 맵에 대한 방법론 제안이라는 맥락에서, 주제의 범주는 브랜드 단위로 단순화하고 사용자 댓글 데이터를 확보하고자 하였다. 위에서 언급한 세부적인 주제는 후속 연구로써 연구의 논리를 보완해야 할 필요가 있다. 둘째, 데이터 확보의 필요성이 있다. 국내 자동차 평가 3개 사이트에서 본 연구를 위해 수집되었지만, 새로운 방법론을 주장하기 위해 후속 연구가 필요하다고 사료된다. 데이터 수의 부족으로는 1) 사용자 댓글에서 주제에 맞는 정확한 묘사가 이루어지지 않는다. 2) 웹 크롤링을 통한 수집을 위해서는 해당 주제만을 다루고 있는 경로가 있어야 하는데, 자동차의 경우 상품 평가 사이트의 댓글과 사회면 뉴스에 포진되어 경로 추적의 어려움이 있다. 3) 자동차 브랜드 평가만을 위한 사이트 경로에서도 댓글과 뉴스 기사의 양이 충분하지 못하다. 이를 보완하기 위해서는 미국의 자동차 리뷰 사이트 www.caranddriver.com 혹은 www.motortrend.com에서 풍부한 데이터를 활용하여 후속 연구를 진행한다면, 연구 가치적으로 유의미한 결과가 나올 것이라 기대한다. 마지막으로 연구 분석에 활용된 Amazon Lex의 경우, 아마존의 데이터를 기반으로 딥러닝 AI를 활용했다는 긍정적인 측면이 있으나, 진행 관계와 해석 내용을 알 수 없는 블랙박스의 문제점을 갖고 있었다. 이는 Song(2018)이 언급한 문제점, 즉 AI는 방대한 데이터화 기계학습으로 최적의 결과 데이터를 도출하지만, 블랙박스의 문제점으로 검증 분석의 어려움이 있다고 표현한 내용과 같다고 볼 수 있다.

추후 이 같은 한계점을 보완할 수 있는 후속 연구를 통해 본 연구에서 제안한 분석 맵을 시작으로, 디자인 분야에서도 빅 데이터를 주도적으로 활용하는 연구에 보탬이 되고자 희망한다.

Notes

Citation: Lee, Y., Youn, D., Hwang, S., & Rhi, J. (2021). Suggestion of a Big Data-Driven Design Evaluation Matrix: Hyundai Motors and Mercedes Benz. Archives of Design Research, 34(3), 211-227.

Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.

References

Asiedu, E. (2006). Foreign direct investment in Africa: The role of natural resources, market size, government policy, institutions and political instability. World Economy, 29(1), 63-77. [https://doi.org/10.1111/j.1467-9701.2006.00758.x]
An, H., & Park, M. (2018). A Study on the Evaluation of Fashion Design Based on Big Data Text Analysis - Focus on Semantic Network Analysis of Design Elements and Emotional Terms. Journal of the Korean Society of Clothing and Textiles, 42(3), 428-437. [https://doi.org/10.5850/JKSCT.2018.42.3.428]
Chin, H., & Yi, M. Y. (2017). A Study on the Influence of Contents of Internet News Comments on the Acceptance of New Car Products. Korea Information Science Society, 605-608.
Cho, J., & Garcia-Molina, H. (2002, May). Parallel crawlers. In Proceedings of the 11th international conference on World Wide Web (pp. 124-135). [https://doi.org/10.1145/511446.511464]
Farquhar, P. H. (1990). Managing brand equity. Journal of advertising research, 30(4), RC-7.
Godes, D., & Mayzlin, D.(2004). Using online conversations to study word-of-mouth communication. Marketing science, 23(4), 545-560. [https://doi.org/10.1287/mksc.1040.0071]
Hwang, H. J. (2016). Exploration of User Experience Research Method with Big Data Analysis: Focusing on the Online Review Analysis of Echo. The Journal of the Korea Contents Association, 16(8), 517-528. [https://doi.org/10.5392/JKCA.2016.16.08.517]
Jo, J. T., & Choi, S. H. (2015). Sentiment Analysis of movie review for predicting movie rating. Management & Information Systems Review, 34(3), 161-177. [https://doi.org/10.29214/damis.2015.34.3.009]
Kang, S. J., & Kim, M. J. (2018). The Propose a Legislation Bill to Apply Autonomous Carsand the Study for Status of Legal and Political Issues. Journal of Korea Technology Innovation Society 21(1), 151-200.
Kim, S. H. (2016, Apr). Reading the World: The 4th Industrial Revolution of Automobiles and Jeju Green Big Bank. Maeil Busines, Retrived form https://www.mk.co.kr/opinion/contributors/view/2016/04/253746/.
Kim, S. T. (2017). A Methodology for privacy incident inspecting System based on Web Crawler (Unpublished Master's thesis). Soongsil University, Seoul, Korea.
Kim, D. W. (2013). Big Data Use Cases of the Sector. Dong-A University Business Research Center, 34, 39-52.
Kim, J. C. (2017, March). Fundamental questions about big data utilization. CIO, Retrieved from https://www.ciokorea.com/insider/33206.
Kim, D. W. (2013). Big Data Use Cases of the Sector. Dong-A University Business Research Center, 34, 39-52.
Kim, E. H. (2012). Study on female Consumer Perceived Quality of Automobile Design through Usability Evaluation (Master's thesis). Sungshin Women's University, Seoul.
Korea Institute of Design Promotion. (2016). User Experience Quality Guidebook.
Kim, K. H. (2015). A study on the car exterior tuning design sensibilities elements analysis - focused on customizing tuning parts. Korea Science & Art Forum, 20, 59-71. [https://doi.org/10.17548/ksaf.2015.06.20.59]
Lee, G. S., & Woo, J. P. (2018). Analysis of Interest in Automobiles Using Naver BigData. Korea Ditribution Association, 98-102.
Ministry of Trade, Industry and Energy. (2018). 2019 Korea Design Statistical Data, 121-163.
Park, C. S., & Shin, S. J. (2009). Relationship analysis between Customer Satisfaction Index and Market Share in Automotive and IT industries. In Proceedings of the Korea Information Processing Society Conference (pp. 939-940). Korea Information Processing Society.
Petty, R. E., & Cacioppo, J. T. (1984). The effects of involvement on responses to argument quantity and quality: Central and peripheral routes to persuasion. Journal of personality and social psychology, 46(1), 69-81. [https://doi.org/10.1037/0022-3514.46.1.69]
Park, B. Y., Kim, S. S., Kang, J. H., & Jun, M. S. (2018). Trend of Big data Analysis Platform Service. In Proceedings of the Korea Information Processing Society Conference (pp. 589-591). Korea Information Processing Society.
Park, G, J. (2014). 아마존 클라우드 AWS를 활용한 빅 데이터 분석 수업환경 구축 [Building a Big Data Analysis Class Environment with Amazon Cloud AWS]. Industrial Engineering Magazine, 21(3), 62-66.
Park, J. Y., Lee, J., Seo, B. G., Kim, K. W., Yoo, I. J., Lee, H., Lee, S., Lee, Y., Park, Y., Park, K., & Park. D. (2019). A Study on the Methodology of Data-Driven UX Concept Development. Proceedings of HCI KOREA 2019, 633-637.
Qiyu, J. (2020). The Effect of Wool Coat Image by Country of Origin on Chinese Consumer's Perceived Quality, Product Attitude and Purchase Intention : Focused on Moderating effect of the Brand Familiarity (Master's thesis). Ewha Women's University, Seoul. (UCI No.I804:11048-000000163368).
Shin, H. (2021, Feb 04). From a smartphone to an Apple car...Camera parts stock is up. Sedaily, Retrived form https://www.sedaily.com/NewsVIew/22IEF2K3XX.
South Korea Ministry of Trade, Industry and Energy. (2020). Annual trends in the automotive industry in 2019.
Sun, A., Lachanski, M., & Fabozzi, F. J. (2016). Trade the tweet: Social media text mining and sparse matrix factorization for stock market prediction. International Review of Financial Analysis, 48, 272-281. [https://doi.org/10.1016/j.irfa.2016.10.009]
Song, N, Y. (2018). Estimation of Explicit Functions using Deep Learning (Unpublished Master's thesis). Myongji University, Seoul.
Viveros-Jiménez, F.,Sanchez-Perez, M. A., Gómez-Adorno,H., Posadas-Durán, J. P., Sidorov, G., & Gelbukh, A. (2018). Improving the boilerpipe algorithm for boilerplate removal in news articles using HTML treestructure. Computación y Sistemas, 22(2), 483-489. [https://doi.org/10.13053/cys-22-2-2959]
Yatskov, A. K., Varlamov, M. I., & Turdakov, D. Y. (2018). Extraction of data from mass media web sites. Programming and Computer Software, 44(5), 344-352. [https://doi.org/10.1134/S0361768818050092]
Yoon, H. K. (2013). Research on the Application Methods of Big Data within the Cultural Industry. Academic association of global cultural contents, 10, 157-179.
Yoon, H. S. (2017). A Preliminary Study on Regulation of Emerging Technologies. Journal of Law & Economic Regulation,1, 7-29.
Yoon, D. M., Lee, Y., H., & Lee, B. G. (2020). Proposal of Brand Evaluation Map through Big Data : Focus on The Hyundai Motor's Product Evaluation. Journal of Information Technology Services, 19, 1-11.
Yun, P. S. (2019). Implementation of AWS-based deep learning platform using streaming server and performance comparison experiment. Electronic & Information Research Information Center, 12(6), 591-596.
Zeithaml, V. A. (1988). Consumer perceptions of price, quality, and value: a means-end model and synthesis of evidence. Journal of marketing, 52(3), 2-22. [https://doi.org/10.1177/002224298805200302]
Zhang, H., & Park, J. S. (2015). The Antecedents of eWOM Credibility and Its Impact on Secondary eWOM Intentions. Management and Information Systems Review, 34(1), 81-101. [https://doi.org/10.29214/damis.2015.34.1.006]
Cloud computing with AWS. (n.d.). Retrieved December 12, 2020, from https://aws.amazon.com/what-is-aws/?nc1=h_ls.
Amazon Lex Documentation. (n.d.). Retrieved Apr 5, 2021, from https://docs.aws.amazon.com/lex/.
Chris, P. (2019, Aug). Google Cloud vs AWS vs Azure. eWEEK, Retrieved from https://www.eweek.com/cloud/at-a-high-level-aws-vs-azure-vs-google-cloud.
Web Crawler. (n.d.). Retrieved Sep 30, 2020, from https://en.wikipedia.org/wiki/WebCrawler#cite_ref-:1_2-2.

연구자	정의
Olshavsky(1985)	품질은 제품의 대한 전반적인 평가
Zeithaml(1988)	제품 혹은 서비스의 전반적 우월성(superiority) 혹은 우수성(excellence)에 대해서 소비자 판단의 총체적 평가
Hays(1999); Capon et l.,(1990) Buzzell & Gale(1987) Pillips et al.(1983)	다양한 시장에서 이윤성과 시장점유율에 대해서 중요한 결정을 하는 것
Snoj et al.(2004)	품질은 고객에 대한 효용을 의미한다. 효용은 소비자의 기대수준과 비교되는 지각된 품질 혹은 탁월성 수준을 통해 측정

● 조사방식: 웹 크롤링을 이용한 오피니언 마이닝 수집 방식 ● 조사기간: 2020년. 10월 1일 (1일간)
조사 대상	다음 자동차 (https://auto.daum.net)
	SK 엔카 (http://www.encar.com/mocha.do?WT.hit=index_gnb)
	다나와 자동차 (http://auto.danawa.com/news/?Tab=A&Work=list)
수집 범위	2018년 11월1일~2020년 10월 1일
수집 내용	현대자동차와 벤츠 디자인 언급 기사와 댓글
수집된 데이터 수	선별된 자동차 디자인이 언급된 12,801개의 게시물

위치	명칭	동의어1	동의어2	동의어3	동의어4	동의어5	동의어6	동의어7	동의어8
A	전면	앞면	정면	얼굴	앞모습	페이스	전면디자인	페이스리프트	정면 뷰
A-1	프런트에어댐	리어에어댐	에어댐	상하부	정면 하단	안개등	에어로파츠	포그램프
A-2	라디에이터그릴	그릴	인테이크그릴	프런트크릴	입	이빨
A-3	엔진후드	본넷	본넷트	보닛	후드	덮개
A-4	프런트디퓨저	범퍼	앞범퍼	하체	프런트 립	프런트스커트
A-5	로고	엠블럼	심볼	마크
A-6	헤드라이트	라이트	눈빛	전조등	헤드램프	하이빔	LED
B	측면	옆태	옆구리	A필러	C필러	측면뷰	옆모습
B-1	오버펜더	휀다	오버휀다	휀더	오버휀더	펜더
B-2	알로이휠	바퀴	휠	타이어
B-3	에어벤트	벤트
B-4	사이드스커트	스커트	발판	옆범퍼	하체	머드가드	흙받이
B-5	문	도어	차문	앞문	뒷문	앞좌석	뒷좌석	좌석
C	뒷면	뒤태	후면부	후면	엉덩이	해치백	후면부
C-1	리어에어댐	뒷범퍼	뒤 범퍼	범퍼	후면바디킷	후방바디	엉덩이
C-2	머플러	마후라	레조네이터
C-3	리어디퓨저	하부	하단	리어스커트
C-4	리어스포일러	트렁크
C-5	글라스스포일러	뒷창문	후면창문	후면윈도우	파노라마	뒷유리
C-6	로고	엠블럼	심볼	마크
C-7	테일램프	깜빡이	리어램프	브레이크등	후면램프	후미등