1. 자연어 처리란?
자연어 처리(Natural Language Processing, NLP)는 인간이 사용하는 언어를 기계가 이해하고 처리할 수 있도록 하는 분야입니다. 주로 텍스트와 관련된 작업에 적용되며, 자연어 처리는 전문가가 아니더라도 웹 데이터를 다루다보면 정형화된 단순 텍스트 분석 등에 필요합니다.
KoNLPy(Korean Natural Language Processing in Python)는 한국어 자연어 처리를 위한 파이썬 라이브러리로, 한국어 텍스트 데이터를 처리하고 분석하기 위한 다양한 도구와 알고리즘을 제공합니다. KoNLPy는 주로 형태소 분석, 품사 태깅, 명사 추출 등과 같은 자연어 처리 작업을 수행하는 데 사용됩니다.
2. KoNLPy 및 모듈 설치
1) 설치 전 체크 사항
① Java 설치 여부
KoNLPy는 Java 기반의 형태소 분석기를 사용합니다. 따라서 Java가 반드시 설치되어 있어야 합니다. Java를 아직 설치하지 않았다면 Oracle의 공식 웹사이트에서 Java를 다운로드하고 설치하세요.
② JAVA_HOME 설정 여부
Java를 설치한 후, 시스템 환경 변수에 JAVA_HOME을 설정해 주세요.
③ Python 버전 확인
Visual Studio Code를 사용하고 계시다면(Jupyter는 상관 없음) 사용하고 있는 Python 버전을 확인해야 합니다. 현재 KoNLPy는 Python 3.10 버전 이하에서만 사용 가능합니다. Python 3.11 버전 이상을 사용하고 있다면 기존 Python을 지우고 3.10 버전을 다운로드할 것을 추천합니다.
④ JPype1 설치
KoNLPy는 Java와 Python을 연결하는데 JPype1이 필요합니다. 보통 Visual Studio Code에서는 터미널에서 pip install 하는 경우가 많지만 JPype1는 직접 파일을 다운로드한 뒤 경로를 지정하여 설치해야 합니다. 다운로드 전 Python 버전과 Windows bit를 확인하고 해당 환경에 맞는 파일을 JPype1 파일 다운로드 사이트에서 다운로드 합니다. 그 후 명령 프롬프트를 실행시켜 파일을 저장한 경로로 이동하여 pip install 합니다.
2) KoNLPy 설치
설치 전 체크 사항을 모두 확인하셨다면 아래 명령어를 실행하여 KoNLPy을 설치합니다.
pip install konlpy
정상적으로 설치가 완료 되었다면 "Successfully installed konlpy-0.6.0" 라는 문구가 출력됩니다.
3) KoNLPy 테스트
아래 코드를 입력하여서 오류 없이 실행되는지 확인해봅니다.
from konlpy.tag import Kkma
kkma = Kkma()
kkma.sentences('한국어 분석을 시작합니다 파이썬이 재미있다')
['한국어 분석을 시작합니다', '파이 썬 이 재미있다'] |
이렇게 나온다면 정상적으로 작동한 것입니다.
'언어 > Python' 카테고리의 다른 글
[Python/자연어 처리] 3. Word Cloud(워드 클라우드) (0) | 2023.12.21 |
---|---|
[Python/자연어 처리] 2. 한글 자연어 처리 기초 (0) | 2023.12.21 |