NLP 초심자로 작년 상반기에 진행했던 프로젝트에서 사용했던 mecab은 설치가 까다로웠다. 그래서 colab에서 쉽게 사용하였는데 설치했던 과정을 소개한다. (링크에서 코드 확인가능)
1. bash 셸로 명령어를 입력하여 설치
%%bash
apt-get update
apt-get install g++ openjdk-8-jdk python-dev python3-dev
pip3 install JPype1
pip3 install konlpy
2. 환경변수 설정
%env JAVA_HOME "/usr/lib/jvm/java-8-openjdk-amd64"
3. mecab 설치 (시간 좀 걸림)
%%bash
bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
pip3 install /tmp/mecab-python-0.996
4. 동작 확인
import konlpy
from konlpy.tag import Kkma, Komoran, Hannanum, Okt
from konlpy.utils import pprint
from konlpy.tag import Mecab
mecab = Mecab()
sentence = "안녕하세요 저는 상휴입니다."
temp_X = mecab.morphs(sentence)
temp_X
결과창
'Project > DACON 청와대 청원 분류' 카테고리의 다른 글
Colab에서 soynlp로 토큰화(tokenizing)하고 konlpy와 비교 (0) | 2021.02.02 |
---|