지금 회원가입시 5MB 무료 증정
KOR
ENG
CHN
로그인
-
님
KOR
ENG
CHN
로그아웃
-
님
-
잔여데이터
-
MB
이용만료일
-
일 남았습니다.
용량추가
마이페이지
결제내역
사용자사전
AI 문의
TEXTOM
TEXTOM에 문의하기
TEXTOM
안녕하세요.
궁금한 사항을 질문해주세요.
사용방법이 궁금하신 연구원님은 매뉴얼을 참고바랍니다.
AI문의가 어려운 상세한 질문은 채팅문의를 이용해주세요.
매뉴얼 바로보기
대시보드
수집
데이터 수집
수집리스트
정제
데이터 전처리
정제리스트
분석
커스터마이징
용량 추가
소개페이지
바로가기
수집리스트에서 전처리 할 데이터를 선택하세요.
형태소 분석
데이터 정제
컬럼선택
텍스트 분석을 진행할 컬럼을 선택해주세요.
형태소 분석
옵션선택
선택안함
형태소 분석을 적용하지 않고 수집된 원문 그대로 분석을 진행합니다.
분석언어
한국어
ENG
분석기
MeCab-IMC
Mecab-IMC는 Mecab-ko 형태소 분석기의 성능을 개선시킨 텍스톰만의 커스터마이징 형태소 분석기로,
기존 Mecab-ko에 비해 성능과 속도가 우수합니다.
CoreNLP
스탠포드 대학(Stanford University)이 만든 CoreNLP 라이브러리를 기반으로 형태소 분석 결과를 제공합니다.
분석품사
명사
동사
형용사
외국어
숫자
사용자 사전
사용
사용안함
사용자사전설정
사전 지정
-
정제할 키워드를 사용자사전에 먼저 등록해주세요. (마이페이지-사용자사전)
텍스톰을 이용하여 여러 번 분석하실 경우, 사용자 사전을 이용하시면 반복적인 작업 없이 빠르고 효율적인 분석이 가능합니다.
적용
데이터 정제
옵션선택
선택안함
데이터 정제를 적용하지 않고 분석을 진행합니다.
중복제거
선택한 항목을 기준으로 중복 데이터를 제거합니다.
- 완전일치 : 선택한 컬럼을 기준으로 값이 완전히 일치하는 데이터를 제거합니다.
완전일치
선택안함
컬럼 선택
스팸 필터링
선택한 컬럼을 기준으로 특정 단어를 포함한 데이터를 남기거나, 제거합니다.
1. 키워드 포함 : 해당 단어를 포함한 데이터만 분석에 활용합니다.
2. 키워드 제외 : 해당 단어를 포함한 데이터를 분석에서 제외합니다.
3. AND : 입력한 키워드 포함·제외 조건을 '모두 만족'하도록 필터링합니다.
4. OR : 입력한 키워드 포함·제외 조건 중 '하나만 만족'하여도 필터링합니다.
키워드
선택안함
컬럼 선택
키워드
포함
제외
적용