사용자 도구

사이트 도구


utagger

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.


utagger [2024/03/13 01:05] (현재) – 만듦 - 바깥 편집 127.0.0.1
줄 1: 줄 1:
 +======UTagger======
  
 +=====UTagger 4가 나왔습니다.=====
 +  * [[http://203.250.77.242:5900/uma4/|<<<<UTagger 4 데모 바로가기>>>>]]
 +  * [[UTagger 4|UTagger 4 설명 및 예문]]
 +
 +---
 +
 +=====아래 내용은 기존 버전(UTagger 3)에 관한 내용입니다.=====
 +
 +
 +UTagger(유태거)는 한국어 형태소 분석기과 동형이의어 분별을 동시에 수행, 품사태그는 세종테그셋을 쓰고 있다.
 +
 +세종태그셋 : https://jchern96.tistory.com/12375684
 +
 +동형이의어 번호 체계는 세종을 기준으로 하며, 대체로 국립국어원의 표준국어대사전과 일치한다.
 +
 +표준국어대사전 : http://stdweb2.korean.go.kr/main.jsp
 +
 +현재 정확률은 어절단위로 96.5%이다.
 +
 +기본적으로는 세종말뭉치를 학습하여 작동하며, 다른 도메인에 대한 특화 기능을 "사용자 말뭉치"라는 기술로 제공하고 있다.
 +
 +"사용자 말뭉치"를 이용하여 신조어, 용언의 활용형, 인접 두 어절간의 새로운 문맥을 실시간으로 학습.
 +
 +**이력**
 +
 +국립국어원 국어정보처리시스템 경진대회에서 2차례(2011, 2013년) 대상을 수상
 +
 +대표적인 논문 : http://www.dbpia.co.kr/Journal/ArticleDetail/NODE01873335
 +
 +최근 UWordMap와 USenseVector를 이용하여 동형이의어 분별하는 모델 개발)
 +
 +해마다 20회 가량 기술이전(연구용 무료, 기업 시제품개발용 무료)이 되고 있다.
 +
 +**데모**  
 +(형태소 분석, 품사 태깅, 다의어 WSD, 영어 대역어, 의존관계, 한자 변환 병기 등)
 +
 +  * 유태거 데모 http://203.250.77.242:5900/utagger
 +  * 유태거 데모(미러) http://203.250.77.84
 +
 +
 +======최신 다운로드 링크들은 이 홈페이지 대문에서 볼 수 있습니다.======
 +[[http://nlplab.ulsan.ac.kr/doku.php?id=start|대문 바로 가기]]
 +======아래의 것들은 예전 자료 입니다.======
 +
 +** 무료 공개용 2013년 버전 **: [[ftp://203.250.77.242/대회2013%20제출물%20재현%20일반용.zip|다운로드]]
 +
 +** 무료 공개용 2016년 버전 UTaggerTCM ** : [[ftp://203.250.77.242/tcm%202016%2009%2022.zip|다운로드]]
 +
 +
 +**오픈소스 2011년 버전**
 +
 +다운받는 페이지 가기 : http://203.250.77.242:5900/UTaggerSource/UTaggerSourcePage.aspx
 +
 +
 +※ dll 로드 오류시 2013 C++ 재배포 패키지를 설치하셔야 합니다.
 +
 +다운로드 링크 : [[https://www.microsoft.com/ko-kr/download/details.aspx?id=40784|2013 C++ 재배포 패키지]]
 +
 +
 +이 외에 특수한 목적으로 최신 라이브러리 등을 원하시면 ducksjc@nate.com, okcy@ulsan.ac.kr 으로 개별 연락 바랍니다.
utagger.txt · 마지막으로 수정됨: 2024/03/13 01:05 저자 127.0.0.1