본문 바로가기

Project/DACON 청와대 청원 분류

Colab에서 konlpy와 mecab 설치하기

NLP 초심자로 작년 상반기에 진행했던 프로젝트에서 사용했던 mecab은 설치가 까다로웠다. 그래서 colab에서 쉽게 사용하였는데 설치했던 과정을 소개한다. (링크에서 코드 확인가능)

 

1. bash 셸로 명령어를 입력하여 설치

%%bash
apt-get update
apt-get install g++ openjdk-8-jdk python-dev python3-dev
pip3 install JPype1
pip3 install konlpy

2. 환경변수 설정

%env JAVA_HOME "/usr/lib/jvm/java-8-openjdk-amd64"

3. mecab 설치 (시간 좀 걸림)

%%bash
bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
pip3 install /tmp/mecab-python-0.996

4. 동작 확인

import konlpy
from konlpy.tag import Kkma, Komoran, Hannanum, Okt
from konlpy.utils import pprint
from konlpy.tag import Mecab

 

mecab = Mecab()
sentence = "안녕하세요 저는 상휴입니다."
temp_X = mecab.morphs(sentence)
temp_X

 

결과창