본문 바로가기
Dev

🧠 문맥을 이해하는 예측 모델, CRF

by soundphd 2025. 7. 18.

CRF(Conditional Random Field)는 문맥 정보를 활용하여 시퀀스 전체의 라벨을 예측하는 조건부 확률 모델입니다. 기존의 로지스틱 회귀나 HMM이 단어별 독립적인 판단을 한다면, CRF는 시퀀스 간의 상호작용, 특히 인접 단어 간 관계를 반영하여 보다 정밀한 예측이 가능합니다.

예를 들어, "은"이라는 조사는 명사 뒤에 자주 나오므로, 이전 단어가 명사일 가능성이 높다는 조건 하에서 품사를 예측할 수 있습니다. 이를 수식으로는 시퀀스 전체의 조건부 확률 P(Y|X)로 표현하며, 특징 함수와 가중치를 기반으로 softmax를 통해 확률을 산출합니다.

실제로는 sklearn-crfsuite 같은 파이썬 라이브러리를 통해 구현할 수 있으며, 품사 태깅(POS), 개체명 인식(NER), 생물정보학 등 다양한 분야에서 효과적으로 활용됩니다.

딥러닝 기반 LSTM이 장기 의존성을 처리할 수 있는 반면, CRF는 비교적 적은 데이터로도 빠르게 학습 가능하며, 직관적이고 해석 가능한 장점이 있습니다.


🔗 관련글 보기
[머신러닝] Conditional Random Field – 문맥을 읽는 예측의 기술