===== python용 UTagger 설치 ===== * pip install pyutagger * pip install pyutagger --upgrade * OS(윈도우즈, 리눅스)와 UTagger version에 따라 자동으로 필요한 라이브러리와 학습사전을 다운 * UTagger version: UTagger3(ANSI 기반), UTagger4(unicode 기반), UTagger4hj(고어형태소분석기) * https://pypi.org/project/pyutagger/ ===== 형태소 분석기 Demo ===== * [[http://203.250.77.242:5900/uma4/|]] * 유니코드 기반, UTagger 3 대비 높은 정확률 * [[UTagger 4|UTagger 4 설명 및 예문]] * [[http://203.250.77.242:5900/utagger|]] * ANSI코드 기반, 빠른 속도·높은 안정성 * 한국어에서 11개국어로 다의어 단위 대역어 서비스 제공 * 알려줘 한국어, 구글 및 iPhone app. store에서 "한통이"(Han-Tong-E) 검색 * [[http://203.250.77.242:5900/uma4hj/|]] * 옛한글 형태소 분석기 * [[UTagger 4-훈민정음|UTagger 4-훈민정음 사용법]] * 모든 UTagger는 UWordMap의 의미 번호 체계를 따릅니다. ===== UWordMap 어휘의미망 ===== * [[http://203.250.77.242:7070|<>]] * 표준국어대사전 기반의 어휘의미망(Lexical Semantic Network) ===== 연구실적물 ===== * [[uwordmap|UWordMap]] (한국어 어휘지도) * [[utagger|UTagger]] (형태소분석, 동형이의어/다의어 WSD, 의존관계분석) * [[한글한자자동변환|한글 한자 자동 변환 시스템]] * [[uwordvector|USenseVector/UConceptVector]] (어휘지도와 국어사전으로 구축한 단어 의미 임베딩) * [[ucorpus|UCorpus]] (울산대 말뭉치) * [[맴버|Members]] * [[논문]] * [[지적재산권]] * [[기술이전]] ===== 파일 다운로드 안내 ===== 한번에 대용량 파일을 (600메가바이트 이상) 받으려고 하면 끝까지 다운로드가 안 될 수 있습니다. 본 홈페이지에서 일부 파일은 200메가 단위로 분할압축하여 제공하고 있습니다. 분할압축이란? 하나의 대용량 zip파일로 압축하지 않고, 여러개의 파일로 분할하여 압축하는 기술입니다. 주의사항 - 모든 파일을 다 받은 다음에 압축해제를 하여야만 완전히 파일을 얻을 수 있습니다. - 한번에 하나씩 다운 받으셔야 합니다. 동시에 여러개의 파일을 받으려고하면 "대용량을 한번에 받다가 실패하기"와 동일한 현상이 발생할 수 있습니다. ===== 다운로드 링크 모음 ===== * **//아래 태깅프로그램(윈도우즈용) 및 오픈소스는 교육 및 연구용으로 제한없이 사용할 수 있습니다.//** * **//UTagger 라이브러리(윈도우즈/리눅스, C/C++/C#/JAVA/Python3/R), UWordMap API(C/C++/C#/JAVA/Python3/R), 말뭉치 등은 기술이전(연구용 무료, 상업용 유료)이 필요함//** * [[http://203.250.77.242:8000/utg4demo_v2403.zip|UTagger4.0 시험판 윈도우 파이썬(속도 제한), 2024.03버전]] * [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna%20v1.2.7z|UTagger3.0 2021.09버전 윈도우 센토스7.8 파이썬 자바JNA. 형태소분석, 동형이의어태깅, 개체명, 의존관계, 띄붙교정 (200어절당 1초 딜레이)]] [[http://203.250.77.242:5900/file_share/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna%20v1.2.7z|미러]] * 분할 버전: [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna%20v1.2_part.zip|1]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z01|2]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z02|3]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z03|4]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z04|5]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z05|6]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z06|7]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z07|8]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z08|9]] [[http://203.250.77.242:8000/utagger%20delay%202021%2009%20centos7.8%20windown%20py%20jna v1.2_part.z09|10]] * [[http://203.250.77.242:8000/utagger%20py%20win%20delay%202019%207%20v2.zip|UTagger3.0 파이썬용2019.07(윈도우)]] [[http://203.250.77.242:5900/file_share/utagger%20py%20win%20delay%202019%207%20v2.zip|미러]] 100어절당 1초의 추가 딜레이가 주어집니다. * [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031.7z|UTagger3.0 파이썬 2018(윈도우, 우분투, 센토스)]] [[http://203.250.77.242:5900/file_share/utagger%20delay%202018%2010%2031.7z|미러]] 100어절당 1초의 추가 딜레이가 주어집니다. * 분할 버전: [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031_part.zip|1]] [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031_part.z01|2]] [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031_part.z02|3]] [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031_part.z03|4]] [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031_part.z04|5]] [[http://203.250.77.242:8000/utagger%20delay%202018%2010%2031_part.z05|6]] * [[http://203.250.77.242:8000/UTagger%EC%86%8C%EA%B0%9C_Python%EC%82%AC%EC%9A%A9%EB%B2%95_%EB%8F%99%EC%98%81%EC%83%81.zip|UTagger실행옵션설정 설명 및 python사용법_동영상]] [[http://203.250.77.242:5900/file_share/UTagger%EC%86%8C%EA%B0%9C_Python%EC%82%AC%EC%9A%A9%EB%B2%95_%EB%8F%99%EC%98%81%EC%83%81.zip|미러]] * [[http://203.250.77.242:8000/UTagger4.0_TCM_2403.zip|UTagger4.0-TCM 2024.03버전: 형태소분석및동형이의어태깅(문장당 5ms 딜레이)]] [[http://203.250.77.242:5900/file_share/UTagger4.0_TCM_2403.zip|미러]] * [[http://203.250.77.242:8000/UTagger%ED%9B%88%EB%AF%BC%EC%A0%95%EC%9D%8C_TCM_2403.zip|UTagger훈민정음-TCM 2024.03버전: 형태소분석및동형이의어태깅(문장당 5ms 딜레이)]] [[http://203.250.77.242:5900/file_share/UTagger%ED%9B%88%EB%AF%BC%EC%A0%95%EC%9D%8C_TCM_2403.zip|미러]] * [[http://203.250.77.242:8000/tcm%202019%2012%2018%20delay.7z|UTagger3.0-TCM 2019.12버전: 형태소분석및동형이의어태깅(200어절당 1초 딜레이)]] [[http://203.250.77.242:5900/file_share/tcm%202019%2012%2018%20delay.7z|미러]] * 분할 버전: [[http://203.250.77.242:8000/tcm%202019%2012%2018%20delay_part.zip|1]] [[http://203.250.77.242:8000/tcm%202019%2012%2018%20delay_part.z01|2]] [[http://203.250.77.242:8000/tcm%202019%2012%2018%20delay_part.z02|3]] [[http://203.250.77.242:8000/tcm%202019%2012%2018%20delay_part.z03|4]] * [[http://203.250.77.242:8000/tcm%202016%2009%2022.zip|UTagger3.0-TCM 2016버전: 형태소분석및동형이의어태깅]] [[http://203.250.77.242:5900/file_share/tcm%202016%2009%2022.zip|미러]] * [[http://203.250.77.242:8000/tcm%202018%203%20%EB%AC%B4%EC%A0%9C%ED%95%9C%2032%EB%B9%84%ED%8A%B8%20%EC%A0%84%EC%9A%A9.zip|UTagger3.0-TCM 32비트 버전(유지보수 종료됨)]] [[http://203.250.77.242:5900/file_share/tcm%202018%203%20%EB%AC%B4%EC%A0%9C%ED%95%9C%2032%EB%B9%84%ED%8A%B8%20%EC%A0%84%EC%9A%A9.zip|미러]] * [[http://203.250.77.242:8000/%EB%8C%80%ED%9A%8C2013%20%EC%A0%9C%EC%B6%9C%EB%AC%BC%20%EC%9E%AC%ED%98%84%20%EC%9D%BC%EB%B0%98%EC%9A%A9.zip|UTagger2.0 태깅도구 2013버전: 형태소분석및동형이의어태깅]] [[http://203.250.77.242:5900/file_share/%EB%8C%80%ED%9A%8C2013%20%EC%A0%9C%EC%B6%9C%EB%AC%BC%20%EC%9E%AC%ED%98%84%20%EC%9D%BC%EB%B0%98%EC%9A%A9.zip|미러]] * [[http://203.250.77.242:8000/UTagger2011.zip|UTagger1.0 태깅도구 2011버전: 형태소분석및동형이의어태깅]] [[http://203.250.77.242:5900/file_share/UTagger2011.zip|미러]] * 유태거 오픈소스 2011 다운로드 페이지로 가기 : [[http://203.250.77.242:5900/UTaggerSource/UTaggerSourcePage.aspx]] * [[http://203.250.77.242:8000/UTaggerSR.zip|UTagger-SR 프로그램: 의존관계및의미역 반자동태깅]] [[http://203.250.77.242:5900/file_share/UTaggerSR.zip|미러]] * [[http://203.250.77.242:8000/UTaggerNE.zip|UTagger-NE 프로그램: 개체명 반자동태깅]] [[http://203.250.77.242:5900/file_share/UTaggerNE.zip|미러]] * [[http://203.250.77.242:8000/UCorpus_Exo_Brain.zip|UCorpus-HG(형태/의미 말뭉치, 18,000천어절): 학습용/테스트용 분리, 18.10.20]] [[http://203.250.77.242:5900/file_share/UCorpus_Exo_Brain.zip|미러]] * [[http://203.250.77.242:8000/UCorpus_DP_SR.zip|UCorpus-DP/SR(형태소/동형이의어/의존관계/의미역 부착 한벌말뭉치 2,000천어절)]] [[http://203.250.77.242:5900/file_share/UCorpus_DP_SR.zip|미러]] * [[http://203.250.77.242:8000/UCorpus_DP_SR.zip|UCorpus-DP/SR(형태소/동형이의어/의존관계/의미역 부착 한벌말뭉치 2,000천어절)]] [[http://203.250.77.242:5900/file_share/UCorpus_DP_SR.zip|미러]] * [[http://203.250.77.242:8000/UPropBank.zip|UPropBank(표준국어대사전용언 의미역 90,100 다의어)]] [[http://203.250.77.242:5900/file_share/UPropBank.zip|미러]] * [[http://203.250.77.242:8000/Script_Corpus(260M).zip|구어형태의미주석말뭉치(260만어절) 21.09]] [[http://203.250.77.242:5900/file_share/Script_Corpus(260M).zip|미러]] * [[http://203.250.77.242:8000/udic_24_04_sp.7z|UTagger3.0 학습사전 버전 24.04.30]] [[http://203.250.77.242:5900/file_share/udic_24_04_sp.7z|미러]] * [[http://203.250.77.242:8000/udic_22_08_17_sp.7z|UTagger3.0 학습사전 버전 22.08.17]] [[http://203.250.77.242:5900/file_share/udic_22_08_17_sp.7z|미러]] * [[http://203.250.77.242:8000/udic20210217.zip|UTagger3.0 학습사전 버전 21.02.17]] [[http://203.250.77.242:5900/file_share/udic20210217.zip|미러]] * [[http://203.250.77.242:8000/udic1811.7z|UTagger3.0 학습사전 버전 18.11.03]] [[http://203.250.77.242:5900/file_share/udic1811.7z|미러]] * [[http://203.250.77.242:8000/udic5.7z|UTagger3.0 학습사전 버전 18.03.13]] [[http://203.250.77.242:5900/file_share/udic5.7z|미러]] * [[http://203.250.77.242:8000/UsenseBert_small_ver_202109.zip|의미 정보를 활용한 경량화 bert 모델]] [[http://203.250.77.242:5900/file_share/UsenseBert_small_ver_202109.zip|미러]] * [[http://203.250.77.242:8000/UwmExplorer.zip|UWordMap 공개(DB & 오프라인용 브라우저) 2022.07]] [[http://203.250.77.242:5900/file_share/UwmExplorer.zip|미러]] [[http://creativecommons.org/licenses/by-nc-sa/4.0/deed.ko|{{https://i.creativecommons.org/l/by-nc-sa/4.0/80x15.png|크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 4.0 국제 라이선스에 따라 이용할 수 있습니다.}}]] * UWordMap, 상표출원, 45-2016-0003295 (2016.04.21), 상표등록, 45-0073592 (2017.05.16) * [[http://203.250.77.242:8000/UwmExplorer_manual.zip|UWordMap PC 브라우저 사용 설명서 2022.07]] [[http://203.250.77.242:5900/file_share/UwmExplorer_manual.zip|미러]] * [[http://203.250.77.242:8000/uwm_db_manual.pdf|UWordMap DB CSV/SQL 설명서]] [[http://203.250.77.242:5900/file_share/uwm_db_manual.pdf|미러]] * [[http://203.250.77.242:8000/uwordmap_csv.zip|UWordMap DB CSV 파일]] [[http://203.250.77.242:5900/file_share/uwordmap_csv.zip|미러]]