Home Communication FAQ

Communication

검색을 이용하시면 보다 빠르게 답변을 찾을 수 있습니다.
찾으시는 문의내용이 없다면 'Q&A' 게시판을 이용하시기 바랍니다.

  • Q기능 연도별로 구분하여 데이터를 수집하고 싶습니다. 어떻게 하면 연도별로 수집한 내용을 각각 확인할 수 있을까요?
    • A

      수집 결과를 연도별로 구분해서 보시려면, 수집 설정 시 수집단위를 ‘연 단위’로 해 주셔야 하며 엑셀 프로그램으로 수집된 데이터의 날짜정보를 분류하시는 추가 작업이 필요합니다. 


      만약 추가 작업을 원치 않으시다면 한 해씩 나눠서 따로 수집하는 방법을 추천해 드립니다.

  • Q기능 '수집단위 선택 시 원문수집이 되지 않는다'는 말이 쉽게 이해되지 않습니다.
    • A

      수집 설정을 하실 때 원문수집과 수집단위를 동시에 설정하실 수 없다는 의미로, 원문수집을 체크하면 수집단위를 일/주/월/연 단위로 나눠서 수집할 수 없고, 미사용으로만 수집이 가능합니다. 


      ※텍스톰에서는 내용의 일부를 발췌하는 방식인 ‘요약수집’을 기본값으로 결과를 제공해 드리고 있습니다. 전문이 필요하신 경우에는 ‘원문수집’을 체크해주세요.

  • Q기능 데이터의 내용 중 일부가 '...'으로 끊겨 있습니다. 모든 내용을 볼 수 있는 방법이 없을까요?
    • A

      전문의 일부를 발췌한 요약수집을 하신 것으로 보입니다. 모든 내용을 수집하시려면 ‘원문수집’을 해주시면 되는데요. ‘수집단어’의 단어 추가 버튼 아래에 위치한 ‘원문수집’을 체크해주시면 됩니다.


      ※원문수집 선택 시, Raw Data 다운로드는 불가하며 수집단위 설정이 되지 않는다는 점 참고해주세요.



  • Q기능 가정제 데이터 바로편집하기에서 변경한 단어를 되돌릴 수 있나요?
    • A

      변경된 단어를 변경 전으로 다시 되돌릴 수 없습니다.


      그러므로 항상 변경 전 가정제 데이터를 미리 다운로드하여 놓으시길 바랍니다.

      잘못 정제하셨을 때는 그 파일을 다시 업로드하고 적용을 해주시면 변경 전 가정제 원본부터 새로 시작이 가능합니다.


      *업로드 파일은 txt 확장자로 올려주셔야 하며, 다운받으신 엑셀 파일의 텍스트를 전체 복사하시고 txt 프로그램(메모장, Notepad++ 등)에 붙여넣기 하셔서 txt 파일을 만드시면 됩니다.

  • Q기능 원문수집, 요약수집의 구분은 수집결과에서 어떻게 확인하나요?
    • A

      'Raw data'에서 우측 데이터량 테이블에 'view' 버튼을 클릭하시면, 새창에서 수집 결과 데이터를 확인하실 수 있습니다.

      각 데이터의 하단에 '수집원문보기' 버튼이 있으면 원문수집, 해당 버튼이 없다면 요약수집입니다.

  • Q기능 반복수집시 같은 정제를 여러번 반복하지 않는 방법은 없나요?
    • A

      같은 키워드를 기간이나 채널을 다르게 하여 반복 수집할 경우

      같은 정제 과정을 여러번 반복하는 경우가 있습니다. 

      이럴 때는 '사용자 사전' 기능을 사용하시면 편리합니다. 


      사용자 사전의 자세한 이용 방법은 아래 링크를 통해 

      확인해 보시길 바랍니다. 

       https://blog.naver.com/textom/221087307929


  • Q기능 수집단위를 사용하면 수집 결과에 어떤 차이가 있나요?
    • A

      수집량에 차이가 있습니다. 수집단위를 미사용할 경우에는 수집량이 채널별로 최대 1,000건 입니다. 

      하지만 수집단위를 사용할 경우 선택한 기간단위로 끊어서 1,000건 씩 수집합니다. 


      예를 들어서, 수집기간을 1년으로 두고 수집단위를 '월단위'로 설정한다면 

      일년을 월로 끊어서 월마다 채널별로 최대 1,000건씩 수집합니다. 

      그렇게되면 총 수집량은 채널별로 최대 12,000건이 됩니다. 


      단, 수집단위를 사용할 수 있는 채널은 수집채널에서 

      진하게 표시된 채널입니다. (네이버 블로그, 카페, 지식인 등)

  • Q기능 채널별 수집량이 1,000건이 안되는건 왜 그런가요?
    • A

      채널별로 한번에 최대로 수집할 수 있는 양은 1,000건 입니다. (수집단위 미사용시)

      하지만 수집량이 1,000건이 채 안되는 경우가 있습니다.


      이는 수집하고자 하는 문서가 전체공개가 아니거나,

      사이트에서 수집을 막아둔 경우 등 다양한 변수로 인해 수집이 이루어지지 않은 경우입니다.

  • Q회원 학습용 이용자인데, 10MB 갱신이 안됐어요.
    • A

      학습용 이용자는 신규 가입시 10MB를 트라이얼 용량으로 지급해 드리며, 

      전월에 사용 내역이 있는 학습용 이용자를 대상으로 매월 첫 째주에 10MB로 갱신 해드립니다. 


      전월에 텍스톰을 이용했는데 갱신되지 않았다면

      Q&A 게시판을 통해 사용자 아이디를 남겨주세요. 

      확인 후 갱신해 드리도록 하겠습니다. 

  • Q결제 학생 할인 관련 문의
    • A

      안녕하세요. 텍스톰 관리자입니다.


      학생분들은 텍스톰 사용시 결제 비용이 많이 부담이 될 수 있습니다.


      그래서 텍스톰은 가입목적에 따라 용량별 결제 금액이 다르게 책정되어있습니다.


      따라서 학생이신 경우에는 처음 가입하실 때 선택한 가입목적을 제대로 확인해주셔야


      텍스톰의 할인 혜택을 받으실 수 있습니다.


      혹시나 가입목적을 잘못선택하셨다면 Q&A게시판에 관련 글을 문의해주시면 처리해드리도록 하겠습니다.

      (※학생신분임을 증명할 수 있는 사진이 있으셔야 가입목적 변경을 해드릴 수 있습니다.)


      항상 텍스톰에 관심을 가져주셔서 감사합니다 ^^

  • Q결제 대용량 구매 후 사용기간 조정
    • A

      안녕하세요. 텍스톰 관리자입니다.


      자주 들어오는 질문 중 대용량 구매 후 한 달만 사용하는 것이 아닌 기간을 더 길게 사용하고 싶다는 

      문의가 많았습니다. 이런 경우에는 우선 대용량을 결제하신 후 저희쪽 070-4269-8480으로 전화를 

      주신다면 사용기간을 조정해드리도록 하겠습니다.


      혹시나 다른 문의 사항이 있으시면 Q&A 게시판에 글을 올려주시면 최대한 빠른시간 안에 

      답변해드리도록 하겠습니다.


      감사합니다.

  • Q기능 200개 키워드 외 더 많은 키워드 보기 및 선택하기
    • A

      안녕하세요. 텍스톰 관리자입니다.


      텍스톰에서 추출단어 빈도수는 상위 200개의 단어만 보여집니다.

      하지만 상위 200개 단어 외 다른 단어도 확인하고 싶다면 우선 추출단어 빈도수를 다운로드 합니다.




      아래 그림과 같이 다운로드 받으신 엑셀 파일에서 보고 싶은 단어 및 빈도를 왼쪽과 같이 지정하여

      메모장에 붙여넣기 합니다. 저런식으로 필요한 단어들을 한줄씩 선택하셔서 메모장에 붙여넣으시면

      됩니다.



      키워드 선택이 완료되셨다면 키워드 리스트를 저장해줍니다.

      저장 하실 때 아래 그림과 같이 UTF-8로 저장해주셔야합니다.

      이름은 아무거나 하셔도 상관없습니다



      저장한 키워드 파일을 텍스톰에 다시 업로드해야 합니다.

      아래 그림과 같이 빅데이터 생산 탭에 가셔서 우선 키워드를 선택합니다. 키워드가 선택된 것을 확인 한 후 메모장으로 만든 키워드 파일을 업로드 하시면 됩니다.



      적용한 뒤 매트릭스 데이터를 다운로드하시면 해당 키워드로 만들어진 매트릭스 데이터를

      다운로드하게 됩니다.

  • Q기능 엑셀에서 가정제 데이터 정제하기
    • A


      엑셀에서 수정할 시 장점은 우선 엑셀의 되돌리기 기능으로 인하여 실수를 하여도


      다시 손 쉽게 이전으로 돌아 갈 수 있습니다. 또한 저장이 손 쉽기 때문에


      가정제 데이터의 버전 관리도 쉽게 할 수 있습니다.


      우선 텍스톰에서 가정제 데이터를 다운 받으셔서 파일을 열어줍니다.



      위 그림과 같이 가정제 데이터 엑세파일과 추출단어 빈도수를 같이 보면서 작업하시는게 편할 것 같습니다.

      빈도수를 보면 강정이라는 단어가 있는데, 제가 생각했을 때 강정은 강정호를 말하는데 정제시 호가 떨어진 것 같습니다.

      그럼 "강정 -> 강정호"로 고쳐야합니다. 엑셀에서 컨트롤+h를 누르시면 단어를 변경시켜주는 창이 뜹니다.




      위에 원본 내용을 넣고 아래에 수정할 내용을 넣으면 됩니다. 여기서 주의하실 점은 가정제 데이터가 띄어쓰기로 구분이 되어 있습니다.

      그래서 " 강정 " <= 와 같이 단어 강정 앞,뒤로 띄어 쓰기를 입력해 주어야 합니다.

      바꿀 단어 역시 마찬가지로 " 강정호 "로 입력해주어야합니다.



      위의 그림과 같이 입력해주고 모두 바꾸기를 누르면 " 강정 "이 " 강정호 "로 바뀌게 됩니다.

      위와 같은 방법으로 단어들을 정제해주면 됩니다.

      정제가 끝나면 엑셀에서 내용을 전체 복사한 뒤 메모장에 붙여서 TXT파일로 저장합니다.

      (txt 파일로 저장할 때 꼭 UTF-8 코딩으로 저장하셔야합니다!!)


      그리고 그걸 텍스톰의 가정제 데이터 업로드에서 업로드하시면 해당 키워드의 가정제 파일이


      수정된 가정제 파일로 덮어쓰게 되어 사용 가능합니다.

  • Q기능 포털사이트 각 채널 1,000건 이상 데이터 수집하기
    • A

      안녕하세요. 텍스톰 관리자입니다.


      포털사이트와 SNS 트위터의 경우 데이터량이 1,000건 이상이여도 채널별로 1,000건의 데이터만 수집이 가능합니다. 이러한 경우는 대부분 기간을 길게 설정할 경우 해당 기간의 데이터량이 많아져 해당 포털사이트에서 제공하는 최대 링크수가 1,000건이므로 최대 1,000건만 수집 가능하게 됩니다.


      따라서 이 문제를 해결하기 위해서는 기간을 나누어 수집을 하시면 됩니다.

      기간을 나누어 수집하는 방법에는 두 가지 방법이 있습니다.


      1. 수집단위를 사용하여 수집


      예를 들어 일 단위로 수집 할 경우 수집할 경우 한달을 하루 단위로 잘라서 검색한 뒤 데이터 수집하게 됩니다.

      쉽게 말해서 하루에 네이버 블로그 데이터가 300건씩 있다고 가정하면 일주일 기간을 수집 기간으로 설정하면 2,100 건의 데이터량이 발생하게 됩니다. 그리고 수집단위를 미사용으로 할 경우 1,000건의 데이터를 수집하게 됩니다. 하지만 수집 단위를 일단위로 할 경우 하루씩 검색을 끊어서 수집하기 때문에 2,100건의 데이터가 모두 수집 됩니다.


      수집단위를 모든 채널에 사용 할 수 있는 것은 아니고 채널명 중 진하게 표시된 채널명만 수집단위를 설정 가능합니다.



      2. 수집단위 미사용 방법

      수집 단위 미사용 시에는 사용자가 직접 기간을 나누어 해당 키워드로 반복적으로 수집해야합니다. 이렇게 할 경우 수집이 완료되면 수집된 데이터를 합쳐서 다시 텍스톰에 올려야 하므로 용량이 중복으로 사용 될 수 있습니다. 따라서 위의 수집단위를 사용하는 것을 추천해드립니다.

  • Q기능 수집할 데이터의 용량 확인방법
    • A

      안녕하세요. 텍스톰 관리자입니다.


      텍스톰을 처음 사용하시는 분들이 자주 문의하시는 내용으로

      “수집하려는 데이터의 용량은 어느 정도일까?” 의 문의가 많이 오는 편입니다.


      문의에 대하여 답변을 해드리면 기본적으로 텍스톰은 요약수집을 주로 사용합니다. 원문수집의 경우 광고성 데이터와 저작권 문제가 발생할 소지가 있고, 다양한 사이트가 존재하여 사용을 자제하는 편입니다. 따라서 요약수집을 기준으로 설명해드리겠습니다.


      가장 많이 사용하는 네이버 데이터 수집의 경우 데이터 1건당 약 600byte 용량을 필요로 합니다. 이것을 MB 단위로 계산을 해보시면 1MB로 1700건의 데이터를 수집 할 수 있습니다.

      자신의 데이터 건수를 확인하는 방법은 네이버 검색을 기준으로 설명해드리겠습니다.

      네이버포털에 접속 후 수집 키워드를 검색합니다. 그 후 아래 상세검색 탭에서



      위의 그림과 같이 데이터 수집기간을 설정한 뒤 적용하기를 클릭합니다.


      다음으로 데이터를 수집할 채널(블로그, 카페, 뉴스 등)을 클릭합니다. 클릭하시면 아래와 같이 데이터의 건수가 나타나게 됩니다. 따라서 해당 데이터 건수를 각 채널별로 합산하여 위의 건당 데이터 용량으로 수집 데이터의 용량을 계산하시면 되겠습니다.



      네이버 외 구글, 다음의 경우도 위와 유사한 방법으로 데이터량을 알 수 있습니다.

      ※ 주의사항

      (1) : 페이스북과 트위터의 경우 데이터 정책으로 인해 수집기간이 약 7일 가량으로 제한적일 수 있습니다.

      (2) : 데이터 수집 시 한 번에 수집할 수 있는 최대 데이터 건수는 채널(블로그, 카페, 뉴스 등)의

      1,000건만 수집 가능합니다. 예를 들어 데이터 수집 기간이 1년으로 했을 경우 포털에서 데이터 건수가 2만으로 떠도 데이터는 1,000건만 수집됩니다.