Home Communication FAQ

Communication

검색을 이용하시면 보다 빠르게 답변을 찾을 수 있습니다.
찾으시는 문의내용이 없다면 'Q&A' 게시판을 이용하시기 바랍니다.

  • Q기능 News Data 수집 시 3개월로 수집 기간이 한정되어 있는데 제가 분석하고자 하는 데이터의 기간은 5개월입니다. 그래서 3개월 + 2개월로 따로 수집하였는데요. 정제 단계에서 두 데이터를 합칠 방법이 있을까요?
    • A

      방법이 있습니다!


      ① 우선 두 데이터의 Raw Data를 다운로드 받아줍니다. (수집 데이터 다운로드 버튼)

      ② 엑셀파일을 열어 모두 선택한 뒤 복사를 해주시고 새 엑셀파일에 붙여넣기를 해줍니다. 이때 3개월 데이터가 끝난 행 바로 뒤에 2개월 데이터를 붙여넣기 해주시면 됩니다.

      ③ 두 데이터를 붙여넣기한 엑셀파일을 저장합니다.

      ④ 텍스톰 Cleaning – User Data 의 보유파일 부분에 해당 파일을 적용해주시고, 컬럼지정 란에 분석을 원하시는 열의 알파벳을 기재해줍니다.

      ⑤ 파일 적용 로딩이 끝나면 기존의 정제와 동일한 방법으로 정제를 해주시면 됩니다.

  • Q기능 데이터 수집 시 수집단위에서 '연 단위'를 설정하지 않았습니다. 부가적인 작업을 하면 연 단위로 나눠서 시각화 자료로 쓸 수 있는 방법이 있을까요?
    • A

      수집단위를 지정하지 않으시면 날짜정보가 따로 수집되지 않습니다. 그러므로 수집된 데이터에는 현재 원하시는 작업에 필요한 날짜정보가 없으므로 불가능합니다. 


      ※데이터의 추이를 살피려면 수집기간 설정에서 원하시는 단위에 맞게 수집단위를 꼭 설정해 주셔야 합니다. 

  • Q기능 연도별로 구분하여 데이터를 수집하고 싶습니다. 어떻게 하면 연도별로 수집한 내용을 각각 확인할 수 있을까요?
    • A

      수집 결과를 연도별로 구분해서 보시려면, 수집 설정 시 수집단위를 ‘연 단위’로 해 주셔야 하며 엑셀 프로그램으로 수집된 데이터의 날짜정보를 분류하시는 추가 작업이 필요합니다. 


      만약 추가 작업을 원치 않으시다면 한 해씩 나눠서 따로 수집하는 방법을 추천해 드립니다.

  • Q기능 '수집단위 선택 시 원문수집이 되지 않는다'는 말이 쉽게 이해되지 않습니다.
    • A

      수집 설정을 하실 때 원문수집과 수집단위를 동시에 설정하실 수 없다는 의미로, 원문수집을 체크하면 수집단위를 일/주/월/연 단위로 나눠서 수집할 수 없고, 미사용으로만 수집이 가능합니다. 


      ※텍스톰에서는 내용의 일부를 발췌하는 방식인 ‘요약수집’을 기본값으로 결과를 제공해 드리고 있습니다. 전문이 필요하신 경우에는 ‘원문수집’을 체크해주세요.

  • Q기능 데이터의 내용 중 일부가 '...'으로 끊겨 있습니다. 모든 내용을 볼 수 있는 방법이 없을까요?
    • A

      전문의 일부를 발췌한 요약수집을 하신 것으로 보입니다. 모든 내용을 수집하시려면 ‘원문수집’을 해주시면 되는데요. ‘수집단어’의 단어 추가 버튼 아래에 위치한 ‘원문수집’을 체크해주시면 됩니다.


      ※원문수집 선택 시, Raw Data 다운로드는 불가하며 수집단위 설정이 되지 않는다는 점 참고해주세요.



  • Q기능 가정제 데이터 바로편집하기에서 변경한 단어를 되돌릴 수 있나요?
    • A

      변경된 단어를 변경 전으로 다시 되돌릴 수 없습니다.


      그러므로 항상 변경 전 가정제 데이터를 미리 다운로드하여 놓으시길 바랍니다.

      잘못 정제하셨을 때는 그 파일을 다시 업로드하고 적용을 해주시면 변경 전 가정제 원본부터 새로 시작이 가능합니다.


      *업로드 파일은 txt 확장자로 올려주셔야 하며, 다운받으신 엑셀 파일의 텍스트를 전체 복사하시고 txt 프로그램(메모장, Notepad++ 등)에 붙여넣기 하셔서 txt 파일을 만드시면 됩니다.

  • Q기능 원문수집, 요약수집의 구분은 수집결과에서 어떻게 확인하나요?
    • A

      'Raw data'에서 우측 데이터량 테이블에 'view' 버튼을 클릭하시면, 새창에서 수집 결과 데이터를 확인하실 수 있습니다.

      각 데이터의 하단에 '수집원문보기' 버튼이 있으면 원문수집, 해당 버튼이 없다면 요약수집입니다.

  • Q기능 반복수집시 같은 정제를 여러번 반복하지 않는 방법은 없나요?
    • A

      같은 키워드를 기간이나 채널을 다르게 하여 반복 수집할 경우

      같은 정제 과정을 여러번 반복하는 경우가 있습니다. 

      이럴 때는 '사용자 사전' 기능을 사용하시면 편리합니다. 


      사용자 사전의 자세한 이용 방법은 아래 링크를 통해 

      확인해 보시길 바랍니다. 

       https://blog.naver.com/textom/221087307929


  • Q기능 수집단위를 사용하면 수집 결과에 어떤 차이가 있나요?
    • A

      수집량에 차이가 있습니다. 수집단위를 미사용할 경우에는 수집량이 채널별로 최대 1,000건 입니다. 

      하지만 수집단위를 사용할 경우 선택한 기간단위로 끊어서 1,000건 씩 수집합니다. 


      예를 들어서, 수집기간을 1년으로 두고 수집단위를 '월단위'로 설정한다면 

      일년을 월로 끊어서 월마다 채널별로 최대 1,000건씩 수집합니다. 

      그렇게되면 총 수집량은 채널별로 최대 12,000건이 됩니다. 


      단, 수집단위를 사용할 수 있는 채널은 수집채널에서 

      진하게 표시된 채널입니다. (네이버 블로그, 카페, 지식인 등)

  • Q기능 채널별 수집량이 1,000건이 안되는건 왜 그런가요?
    • A

      채널별로 한번에 최대로 수집할 수 있는 양은 1,000건 입니다. (수집단위 미사용시)

      하지만 수집량이 1,000건이 채 안되는 경우가 있습니다.


      이는 수집하고자 하는 문서가 전체공개가 아니거나,

      사이트에서 수집을 막아둔 경우 등 다양한 변수로 인해 수집이 이루어지지 않은 경우입니다.

  • Q회원 학습용 이용자인데, 10MB 갱신이 안됐어요.
    • A

      학습용 이용자는 신규 가입시 10MB를 트라이얼 용량으로 지급해 드리며, 

      전월에 사용 내역이 있는 학습용 이용자를 대상으로 매월 첫 째주에 10MB로 갱신 해드립니다. 


      전월에 텍스톰을 이용했는데 갱신되지 않았다면

      Q&A 게시판을 통해 사용자 아이디를 남겨주세요. 

      확인 후 갱신해 드리도록 하겠습니다. 

  • Q결제 학생 할인 관련 문의
    • A

      안녕하세요. 텍스톰 관리자입니다.


      학생분들은 텍스톰 사용시 결제 비용이 많이 부담이 될 수 있습니다.


      그래서 텍스톰은 가입목적에 따라 용량별 결제 금액이 다르게 책정되어있습니다.


      따라서 학생이신 경우에는 처음 가입하실 때 선택한 가입목적을 제대로 확인해주셔야


      텍스톰의 할인 혜택을 받으실 수 있습니다.


      혹시나 가입목적을 잘못선택하셨다면 Q&A게시판에 관련 글을 문의해주시면 처리해드리도록 하겠습니다.

      (※학생신분임을 증명할 수 있는 사진이 있으셔야 가입목적 변경을 해드릴 수 있습니다.)


      항상 텍스톰에 관심을 가져주셔서 감사합니다 ^^

  • Q결제 대용량 구매 후 사용기간 조정
    • A

      안녕하세요. 텍스톰 관리자입니다.


      자주 들어오는 질문 중 대용량 구매 후 한 달만 사용하는 것이 아닌 기간을 더 길게 사용하고 싶다는 

      문의가 많았습니다. 이런 경우에는 우선 대용량을 결제하신 후 저희쪽 070-4269-8480으로 전화를 

      주신다면 사용기간을 조정해드리도록 하겠습니다.


      혹시나 다른 문의 사항이 있으시면 Q&A 게시판에 글을 올려주시면 최대한 빠른시간 안에 

      답변해드리도록 하겠습니다.


      감사합니다.

  • Q기능 200개 키워드 외 더 많은 키워드 보기 및 선택하기
    • A

      안녕하세요. 텍스톰 관리자입니다.


      텍스톰에서 추출단어 빈도수는 상위 200개의 단어만 보여집니다.

      하지만 상위 200개 단어 외 다른 단어도 확인하고 싶다면 우선 추출단어 빈도수를 다운로드 합니다.




      아래 그림과 같이 다운로드 받으신 엑셀 파일에서 보고 싶은 단어 및 빈도를 왼쪽과 같이 지정하여

      메모장에 붙여넣기 합니다. 저런식으로 필요한 단어들을 한줄씩 선택하셔서 메모장에 붙여넣으시면

      됩니다.



      키워드 선택이 완료되셨다면 키워드 리스트를 저장해줍니다.

      저장 하실 때 아래 그림과 같이 UTF-8로 저장해주셔야합니다.

      이름은 아무거나 하셔도 상관없습니다



      저장한 키워드 파일을 텍스톰에 다시 업로드해야 합니다.

      아래 그림과 같이 빅데이터 생산 탭에 가셔서 우선 키워드를 선택합니다. 키워드가 선택된 것을 확인 한 후 메모장으로 만든 키워드 파일을 업로드 하시면 됩니다.



      적용한 뒤 매트릭스 데이터를 다운로드하시면 해당 키워드로 만들어진 매트릭스 데이터를

      다운로드하게 됩니다.

  • Q기능 엑셀에서 가정제 데이터 정제하기
    • A


      엑셀에서 수정할 시 장점은 우선 엑셀의 되돌리기 기능으로 인하여 실수를 하여도


      다시 손 쉽게 이전으로 돌아 갈 수 있습니다. 또한 저장이 손 쉽기 때문에


      가정제 데이터의 버전 관리도 쉽게 할 수 있습니다.


      우선 텍스톰에서 가정제 데이터를 다운 받으셔서 파일을 열어줍니다.



      위 그림과 같이 가정제 데이터 엑세파일과 추출단어 빈도수를 같이 보면서 작업하시는게 편할 것 같습니다.

      빈도수를 보면 강정이라는 단어가 있는데, 제가 생각했을 때 강정은 강정호를 말하는데 정제시 호가 떨어진 것 같습니다.

      그럼 "강정 -> 강정호"로 고쳐야합니다. 엑셀에서 컨트롤+h를 누르시면 단어를 변경시켜주는 창이 뜹니다.




      위에 원본 내용을 넣고 아래에 수정할 내용을 넣으면 됩니다. 여기서 주의하실 점은 가정제 데이터가 띄어쓰기로 구분이 되어 있습니다.

      그래서 " 강정 " <= 와 같이 단어 강정 앞,뒤로 띄어 쓰기를 입력해 주어야 합니다.

      바꿀 단어 역시 마찬가지로 " 강정호 "로 입력해주어야합니다.



      위의 그림과 같이 입력해주고 모두 바꾸기를 누르면 " 강정 "이 " 강정호 "로 바뀌게 됩니다.

      위와 같은 방법으로 단어들을 정제해주면 됩니다.

      정제가 끝나면 엑셀에서 내용을 전체 복사한 뒤 메모장에 붙여서 TXT파일로 저장합니다.

      (txt 파일로 저장할 때 꼭 UTF-8 코딩으로 저장하셔야합니다!!)


      그리고 그걸 텍스톰의 가정제 데이터 업로드에서 업로드하시면 해당 키워드의 가정제 파일이


      수정된 가정제 파일로 덮어쓰게 되어 사용 가능합니다.