CRF(Conditional Random Field)는 문맥 정보를 활용하여 시퀀스 전체의 라벨을 예측하는 조건부 확률 모델입니다. 기존의 로지스틱 회귀나 HMM이 단어별 독립적인 판단을 한다면, CRF는 시퀀스 간의 상호작용, 특히 인접 단어 간 관계를 반영하여 보다 정밀한 예측이 가능합니다.
예를 들어, "은"이라는 조사는 명사 뒤에 자주 나오므로, 이전 단어가 명사일 가능성이 높다는 조건 하에서 품사를 예측할 수 있습니다. 이를 수식으로는 시퀀스 전체의 조건부 확률 P(Y|X)로 표현하며, 특징 함수와 가중치를 기반으로 softmax를 통해 확률을 산출합니다.
실제로는 sklearn-crfsuite 같은 파이썬 라이브러리를 통해 구현할 수 있으며, 품사 태깅(POS), 개체명 인식(NER), 생물정보학 등 다양한 분야에서 효과적으로 활용됩니다.
딥러닝 기반 LSTM이 장기 의존성을 처리할 수 있는 반면, CRF는 비교적 적은 데이터로도 빠르게 학습 가능하며, 직관적이고 해석 가능한 장점이 있습니다.
'Dev' 카테고리의 다른 글
| [머신러닝 기초] 결정 트리(Decision Tree): 질문으로 자라는 나무 (0) | 2025.07.19 |
|---|---|
| [머신러닝 기초] Recurrent Neural Network(RNN) 이해하기 – 기억하는 신경망의 시작 (0) | 2025.07.18 |
| Hidden Markov Model(HMM) (0) | 2025.07.18 |
| Naive Bayes Classifier – 단순하지만 강력한 확률 기반 분류기 (1) | 2025.07.18 |
| [머신러닝] Support Vector Machine (SVM) (0) | 2025.07.18 |