Home Blog

Blog Blog에 대한 설명글이 들어갑니다

    • 소셜 미디어 빅데이터 분석을 이용한 나홀로 여행 트렌드 분석 : 제주도를 중심으로
    • 2019-09-03 17:30:54
  • 파일 소셜_미디어_빅데이터_분석을_이용한_나홀로_여행_트렌드_분석.pdf (1.41 MB)

  • ▲논문 전문 보기▲


    This study aimed to analyze trends of solo travel through social media big data

    reflecting social phenomena on Jeju Island which is the most preferred region for solo

    travelers. For three years from January 1, 2016 to December 31, 2018, we collected text

    data including the keyword ‘Jeju Island solo travel’ from blog and cafes of Korea’s leading

    portal site NAVER and DAUM. The data were collected using TEXTOM and UCINET 6

    was used for analysis of degree centrality, closeness centrality, betweenness centrality,

    eigenvector centrality and CONCOR. According to the results of analysis, the words such

    as ‘Jeju Island’, ‘travel’, ‘guest house’, ‘course’, ‘restaurant’, and ‘accommodation’ were

    shown as high frequencies. In addition, the words such as ‘cafe’, ‘sea’, and ‘photo’ except

    for common words were influential in the centrality analysis. And CONCOR analysis

    included five clusters of ‘selection attributes of solo travel’, ‘selection attributes of Jeju

    Island’, ‘selection attributes of accommodation’, ‘stage of planning a travel’, and

    ‘influencing factors to decision-making’. The study is differentiated in that it used social

    media big data instead of traditional research methods. Furthermore it reflects social

    phenomena, so there will be practical value in establishing a tourism marketing strategy.



    1. 데이터 수집 및 정제


    본 연구는 소셜 미디어 빅데이터에 나타난 나홀로 여행객들에 대한 여행 트렌드 및 인식에 관하여 제주도를 대상으로 진행하고자 한다. 소셜 미디어의 경우 뉴스, 블로그, 카페, 페이스북, 트위터 등이 있지만 실제 관광객들의 경험과 후기를 진실성 있게 확인할 수 있는 블로그와 카페를 대상으로 네이버와 다음에서 수집하였다. 또한, 제주도 나혼자 여행과 관련 없는 단어들은 삭제하였으며, 소셜 미디어 빅데이터 프로그램인 텍스톰(Textom)을 활용하여 수집 및 정제를 실시하였다. 2016년 1월 1일부터 2018년 12월 31일까지의 포털 사이트 네이버와 다음의 블로그 및 카페에 작성된 글의 수를 살펴보았다. 이 과정에서 본 연구와 관련 없는 단어들은 삭제하였으며, 분석에 쓰이지 않는 ‘것’, ‘때’, ‘곳’ 등의 조사와 대명사 등을 삭제하였다. 또한, 본 연구를 수행하기 위한 데이터 수집의 전반적인 개요는 <표 1>과 같으며, 소셜 미디어에 존재하는 ‘제주도 혼자여행’ 이라는 키워드로 데이터를 수집하였다.


    제주도 나홀로 여행’ 혹은 ‘제주도 혼행’이 아닌 ‘제주도 혼자여행’을 검색어로 선정한 것은 <표 2>와 같이 이용객들이 그 관광경험을 기록하고 공유하는 블로그 및 카페에서 ‘제주도 혼자여행’이라는 키워드 사용으로 작성된 글이 가장 많았기 때문이다. 즉, 소셜 미디어 빅데이터 연구를 진행함에 있어 단순히 검색량이 많거나 학술적인 용어보다는 관광을 경험한 이들의 실제 후기에 많이 쓰인 키워드를 활용하여 연구를 진행하는 것이 보다 정확한 결과를 도출할 수 있다고 판단하여 키워드를 선정하였다.



    2. 데이터 분석방법


    본 연구에서는 수집한 소셜 미디어 빅데이터 분석을 위해 텍스트 마이닝(textmining)과 사회연결망 분석(social network analysis)을 이용하였다. 텍스트 마이닝은 비정형화된 텍스트 데이터에서 고품질의 정보를 추출하는 과정이며, 텍스트 자료의 구조화를 통해 패턴 도출 및 결과를 평가하고 해석하는 기술이다(한국데이터베이스진흥원. 2014). 사회연결망 분석은 행위의 주체가 의미하는 개체(node) 및 링크(link)를 활용한 사회연결망 모델링(modeling)으로 이를 구성하는 개체들의 특징에 대하여 계량적으로 분석하는 기법이다(Scott et al. 2007). 먼저 텍스톰을 활용하여 텍스트 마이닝을 실시한 후, UCINET 6를 이용하여 사회연결망 에서 가장 대표적인 개념인 중심성(Centrality) 및 CONCOR(convergence of iterated correlations) 분석을 실시하였다. 중심성의 경우 연결망 내에서 특정 개체가 중심에 위치하는 정도를 나타내는데(Freeman. 2008), 그 중 연결정도 중심성(degree centrality), 근접 중심성(closeness centrality), 매개 중심성(betweenness centrality), 위세 중심성(eigenvector centrality) 등이 대표적이라고 할 수 있다. CONCOR 분석은 노드(단어)들 간의 관계 패턴을 도출하여 분석하는 방법으로 네트워크 내에 존재하는 하위그룹 관계의 구조적 분석에 활용된다(손동원. 2002). 이에 본 연구에서는 ‘제주도 혼자여행’ 키워드로 2016년 1월 1일부터 2018년 12월 31까지 각 연도별로 수집된 데이터를 통합한 후 연관 단어 빈도 상위 100개를 추출하여 네트워크 시각화를 진행하였다. 이후 50개의 핵심단어로 매트릭스를 도출하여 분석에 사용하였으며, 중심성 분석과 CONCOR 분석을 통하여 각 노드(단어)의 지위, 특성, 관계구조를 파악하였다.






    1. 검색어의 주요 연관 단어 빈도


    ‘제주도 혼자여행’ 검색어를 이용하여 2016년~2018년 3년 간의 데이터를 수집 및 분석하여 상위 100개의 결과를 정리하면 다음 <표 3>과 같다. 높은 빈도의 단어는 제주도, 여행, 혼자, 게스트 하우스, 코스, 맛집, 숙소 등의 순으로 확인되었다. 숙박형태, 여행목적지, 나홀로 여행의 동기 등이 단어로 나타났으며, 제주도 관련 단어로는 게스트 하우스, 카페, 바다, 올레길, 우도, 오름, 성산, 서귀포, 애월, 협재, 파티, 월정리, 한라산 등이 높은 빈도를 보였다.




    또한, 이러한 분석 결과를 바탕으로 네트워크 분석을 시각화한 자료는 [그림 1]과 같다. 이와 같이 노드의 크기로 단어의 빈도를 알 수 있으며, 노드(단어)와 노드(단어) 사이의 선은 두 단어의 동시출현 빈도와 서로 간의 연결강도를 의미한다. 구체적으로 제주도, 여행, 혼자, 게스트 하우스, 코스, 맛집, 숙소 등의 노드가 크고 서로 간의 선이 굵은 것을 확인할 수 있다.


    2. 중심성 분석


    중심성 분석에서 연결 중심성, 근접 중심성, 매개 중심성, 위세 중심성을 살펴본 결과는 다음 <표 4>와 같으며, ‘제주도 혼자여행’ 연관 단어 빈도가 높은 경우, 연결중심성, 근접 중심성, 매개 중심성, 위세 중심성 정도가 전반적으로 높게 나타나고 있는 것을 확인할 수 있다. 연결 중심성은 제주도, 여행, 혼자, 게스트 하우스, 코스, 숙소, 추천, 맛집, 카페 등 순으로 나타났으며, 근접 중심성에서는 제주도, 여행, 혼자, 게스트 하우스, 코스, 일정, 바다, 사진, 카페 등의 순으로 나타났다. 매개 중심성의 경우에는 제주도, 여행, 혼자, 게스트 하우스, 코스, 일정, 숙소, 사진, 바다, 카페가 동일하게 가장 높은 값을 나타내고 있으며, 위세 중심성에서는 제주도, 여행, 혼자, 게스트 하우스, 코스, 맛집, 숙소, 추천, 카페, 바다, 해변, 생각 등의 단어들이 큰 비중을 차지하는 것을 확인하였다.




    3. CONCOR 분석


    CONCOR 분석은 적정한 수준의 유사성이 있는 집단을 찾아내기 위해서 상관관계 분석을 반복적으로 수행하는 방법(오익근 외 2인. 2015)이다. 다음 [그림 2]는 연구에 사용된 네트워크 데이터의 구조적 등위성을 알아보기 위하여 CONCOR 분석을 수행하여 시각화한 결과이다.





    구체적으로는 나홀로 여행에서 5개의 클러스터가 생성되었고, 그 중에서 혼자, 마음, 생각, 사진, 가을, 겨울 등의 노드가 포함된 클러스터가 가장 크게 이루어졌으며 이를 ‘나홀로 여행 선택속성’으로 명명하였다. 다음으로는 제주도, 바다, 올레길, 협재, 해변, 카페 등의 노드가 포함되어 있어 ‘제주도여행 선택속성’으로 명명하였으며, 게스트 하우스, 파티, 투어, 호텔, 숙소, 서귀포 등의 노드가 포함되어 있는 클러스터는 ‘숙박시설 선택속성’으로 명명하였다. 또한, 여행지, 국내, 계획, 준비, 힐링 등의 노드는 ‘여행 계획단계’로 명명하였으며, 후기, 이야기, 정보의 노드 구성은 ‘의사결정 영향요인’으로 명명하였다.




    본 연구는 1인 가구 증가에 따른 혼행, 소셜 미디어와 빅데이터의 중요성을 바탕으로 나홀로 여행객이 가장 선호하는 방문지인 제주도를 대상으로 소셜 미디어에서 나홀로 여행객들의 트렌드와 인식을 살펴보았다. 이를 바탕으로 본 연구는 관광목적지, 관련 사업체 및 개별 숙소 등의 마케팅 전략과 정책 등에 대해 효율적인 방안을 모색하는 것에 목적이 있다. 이를 달성하기 위하여 2016년 1월 1일부터 2018년 12월 31일 까지 네이버와 다음의 블로그 및 카페를 통해 글의 수가 가장 많은 ‘제주도 혼자여행’이라는 키워드로 데이터를 수집하고 분석하였다. 구체적으로 텍스톰을 이용하여 연관 단어의 빈도 분석 및 네트워크 시각화, UCINET 6과 NetDraw를 활용하여 연결중심성, 근접 중심성, 매개 중심성, 위세 중심성, CONCOR 분석 등을 실시하였다. 이에 본 연구의 주요 분석결과를 바탕으로 시사하는 바를 정리하면 다음과 같다.


    첫째, 사회적 현상을 반영한 여행 행태인 나홀로 여행과 이들이 선호하는 지역인제주도를 중심으로 연구의 주제를 선정하였으며, 전통적인 연구방법에서 벗어나 빅데이터 분석을 통한 연구를 진행하였다는 점에서 학술적 가치가 있다고 할 수 있다. 특히 이슈의 확산성이 매우 빠른 소셜 미디어 빅데이터를 활용한 연구는 소비자의 인식 및 트렌드를 파악하기에 더욱 효과적인 방법이라 할 수 있다.


    둘째, 전반적으로 웹 가시성이 높은 단어로는 제주도, 여행, 혼자, 게스트 하우스, 코스, 맛집, 숙소 등으로 나타났다. 제주도를 혼자 여행하는 나홀로 여행객들은 게스트 하우스에 대한 선호가 높은 것을 확인할 수 있으며, 맛집과 숙소 및 여행코스에 많은 비중을 두고 있다고 짐작 할 수 있다. 특히 ‘제주도’, ‘여행’, ‘혼자’ 단어를 제외하고는 게스트 하우스의 웹 가시성이 가장 높았는데 이를 통해 나홀로 여행객들 의 가장 큰 관심사 중 하나가 게스트 하우스라는 것을 알 수 있다. 더 나아가 게스트 하우스와 연관 검색어로 파티 및 투어 단어도 출현하였는데 숙박시설의 경우 게스트 하우스가 아니더라도 나홀로 여행객들의 관심사인 파티 및 투어와 관련하여 마케팅 전략을 수립할 수 있을 것이다. 또한, 게스트 하우스에서 발생할 수 있는 불법적인 요소를 배제하고 나홀로 여행객들의 안전성을 높이기 위하여 관련 정책 등의 마련이 필요하다.


    셋째, 중심성을 이용하여 각 단어들의 역할과 지위를 살펴본 결과, 주요 연관 단어의 빈도가 높은 ‘제주도’, ‘여행’, ‘혼자’, ‘게스트 하우스’, ‘코스’ 등의 단어들이 연결 중심성, 근접 중심성, 매개 중심성, 위세 중심성에서도 전반적으로 높게 나타났다. 이외에 연결 중심성에서는 숙소, 추천, 맛집, 카페, 바다가 영향력을 가지고 있었으며, 근접 중심성에서는 일정, 숙소, 바다, 사진, 카페가 영향력을 보였고, 매개 중심성에서는 일정, 숙소, 사진, 바다, 카페가 위세 중심성에서는 맛집, 숙소, 추천, 카페, 바다가 영향력을 갖는 것으로 확인되었다. 이는 제주도를 찾는 나홀로 여행객들이 혼자 여행 코스 및 일정을 계획하고 맛집과 카페, 바다 등을 여행하며 이를 사진으로 남기는 것을 선호한다고 할 수 있다. 따라서 지자체 혹은 관광목적지 나아가 관련 산업체 및 개별 숙소 등에서는 이러한 수요자들의 욕구를 충족시킬 수 있는 감성적인 마케팅 전략을 통하여 더욱 효과적인 성과를 얻어낼 수 있으리라 생각한다.


    넷째, CONCOR분석의 경우 5개의 클러스터가 생성되었으며 혼자, 마음, 생각, 사진, 가을, 겨울 등의 노드가 포함된 ‘나홀로 여행 선택속성’과, 제주도, 바다, 올레길, 협재, 해변, 카페 등의 노드로 구성된 ‘제주도여행 선택속성’, 그리고 게스트 하우스, 파티, 투어, 호텔, 숙소, 서귀포 등의 노드로 포함되어 있는 ‘숙박시설 선택속성’, 여행지, 국내, 계획, 준비, 힐링 등의 노드는 ‘여행 계획단계’, 끝으로 후기, 이야기, 정보의 노드 구성은 ‘의사결정 영향요인’으로 구분되었다. 이와 같은 분석 결과를 고려하면, 나홀로 여행객들은 마음과 생각을 정리하기 위해 여행을 하며 비교적 한적한 가을과 겨울을 선호하는 것으로 나타났다. 이를 통해 전통적 성수기인 여름 계절에서 벗어나 관광목적지의 계절성을 극복할 수 있는 전략 중 하나로 고려할 수 있으며, 행동론적 관점에서 더욱 감성적으로 접근하는 방법이 필요하겠다. 이어서 숙박시설의 경우 서귀포 지역을 선호하고 파티와 투어에 대한 관심이 게스트 하우스를 선택하는데 있어 중요한 요인이라는 것을 알 수 있다. 그렇기 때문에 게스트 하우스에서는 가격 및 시설 등의 우위보다는 파티와 투어 프로그램을 통한 홍보 전략이 더욱 효과적일 것으로 보인다. 또한, 나홀로 여행객들 코스와 일정을 스스로 계획하기 때문에 후기, 이야기, 정보 등이 의사결정에 영향을 많이 미치는 것으로 나타났다. 따라서 관광목적지와 숙박시설 등에서는 후기를 작성할 수 있는 사이트 및 블로그, 카페, SNS 등의 관리를 통한 홍보 전략도 유효하다고 할 수 있겠다.


    끝으로 이러한 시사점에도 불구하고 몇 가지 한계점은 첫째, 한국어로만 분석이 진행되어 외국인 나홀로 여행객들에 대한 제주도의 인식을 분석하지 못하였다. 둘째, 페이스북, 인스타그램, 유튜브 등 트렌드를 선도하는 소셜 미디어 플랫폼의 데이터를 활용하지 못한 점이다. 셋째, 해외여행 출국자가 증가하는 만큼 나홀로 여행객들이 선호하는 해외 관광목적지에 대한 인식 및 트렌드를 조사하여 비교 분석이 이루어진다면 관광목적지로서의 제주도 경쟁력을 더욱 강화시킬 수 있을 것이라 생각된다. 이에향후 연구에서는 이러한 문제를 극복하여 이론적인 측면과 실질적인 측면에서 기여할 수 있기를 기대한다. 따라서 본 연구가 향후 관광산업에 더욱 기여하고, 새로운 연구 주제의 시발점이 될 수 있으리라 사료된다.