Mediclassics Analyzer

한의학고전DB의 데이터를 이용하여 사용자가 입력한 용어와 관련이 높은 용어를 출력해 줍니다.


검색 용어 및 조건 입력 Search Term Setting

분석에 사용될 검색어를 입력합니다. 정해진 특수문자 외에는 모두 한자로 입력해야 오류 없이 검색 결과를 얻을 수 있습니다.

주검색어(Main Term)

보조검색어(Included Term, Excluded Term)

N그램 범위(Ngram Range)

윈도우 크기(Half Window Size)

Top n


분석 방법 설정 Analysis Method Setting

대상 코퍼스(Target Corpus) : 검색어를 적용할 텍스트를 선택합니다.

토큰 추출 모델


분석 실행

ANALYZE 버튼을 누르면 분석을 수행하여 아래 영역에 그 결과가 출력됩니다.




Mediclassics Segmenter

사용자가 입력한 원문을 적절한 용어로 구분해 줍니다. 이렇게 구분된 용어를 토큰(Token), 이러한 과정을 토크나이제이션(Tokenization) 혹은 세그멘테이션(Segmentation)이라고 지칭합니다. 이렇게 나누어진 토큰은 텍스트 분석에서 최소 단위로 사용됩니다.


원문의 입력 Target Text Setting

‘Target Text’ 아래 있는 텍스트 영역에 세그멘테이션 하고자 하는 텍스트를 입력합니다.


세그멘테이션 방법 설정 Method Setting

파라미터를 선택하여 결과값을 조정할 수 있습니다.

Segment Markup : 토큰을 좌우에서 표시할 기호를 입력합니다.

Segment Model : 세그멘테이션을 수행할 모델을 선택합니다.


분석 실행

SEGMENT 버튼을 누르면 분석을 수행하여 아래 텍스트 영역에 그 결과가 출력됩니다.

Plot 안에 legend를 클릭하여 원하는 속성의 결과만 볼 수 있습니다.