hmm 예제

이제 β {displaystyle beta }가 1보다 현저히 낮다고 상상해 보십시오. 이렇게 하면 φ {displaystyle {boldsymbol {varphi }}} 벡터가 희소하게 됩니다. 즉 거의 모든 확률 질량이 소수의 상태에 분산되고 나머지에서는 해당 상태로의 전환이 거의 불가능합니다. 각 시작 상태에 대해 φ {displaystyle {boldsymbol {varphi }}} 벡터가 다르므로 모든 벡터가 희소하더라도 다른 벡터가 다른 끝 상태에 질량을 분배할 수 있습니다. 그러나 모든 벡터에 대해 {displaystyle {boldsymbol {eta}}}는 종료 상태가 질량에 할당될 가능성이 있는 상태를 제어합니다. 예를 들어 β {디스플레이 스타일 베타 }가 0.1인 경우 각 φ {디스플레이 스타일 {boldsymbol {varphi}}}는 희소하며, 주어진 시작 상태 i의 경우 J i {displaystyle mathbf {J} _{i}} 상태의 집합은 매우 작을 것입니다. 일반적으로 한 두 개의 멤버만 있습니다. 이제 {displaystyle {boldsymbol {eta}}}의 확률이 모두 동일하다면(또는 이에 상응하여 위의 모델 중 하나={displaystyle {eta}}}를 사용함), 다른 i의 경우 해당 J i { displaystyle mathbf {J} _{i}} 모든 상태가 주어진 J i {displaystyle mathbf {J} _{i}} 에서 똑같이 발생할 가능성이 있도록 합니다. 반면에 {displaystyle {boldsymbol {eta}}의 값이 불균형한 경우 한 상태가 다른 주보다 훨씬 높은 확률을 가지도록 하면 거의 모든 J i {displaystyle mathbf {J} _{i}}가 이 상태를 포함합니다. 따라서 시작 상태에 관계없이 전환은 거의 항상 이 지정된 상태로 발생합니다.

다른 유형의 확장은 표준 HMM의 생성 모델 대신 판별 모델을 사용합니다. 이 유형의 모델은 조인트 분포를 모델링하는 대신 관측값에 주어진 숨겨진 상태의 조건부 분포를 직접 모델링합니다. 이 모델의 예로는 로지스틱 회귀(“최대 엔트로피 모델”라고도 함)를 사용하여 상태의 조건부 분포를 모델링하는 소위 최대 엔트로피 마르코프 모델(MEMM)이 있습니다. 이러한 유형의 모델의 장점은 관측값의 임의피처(즉, 함수)를 모델링할 수 있어 현재 진행 되는 문제에 대한 도메인별 지식을 모델에 삽입할 수 있다는 점입니다. 이러한 종류의 모델은 숨겨진 상태와 관련 관측값 간의 직접 종속성을 모델링하는 데만 국한되지 않습니다. 오히려, 주변 관측값의 특징, 관련 관측값과 인근 관측값의 조합, 또는 주어진 숨겨진 상태에서 임의의 관측값의 사실은 숨겨진 상태의 값을 결정하는 데 사용되는 프로세스에 포함 될 수있다 . 또한 이러한 기능이 생성 모델에서 사용된 경우와 마찬가지로 이러한 기능이 통계적으로 서로 독립적일 필요가 없습니다. 마지막으로, 인접한 숨겨진 상태 쌍에 대한 임의피처를 단순 전환 확률 대신 사용할 수 있습니다. 이러한 모델의 단점은 다음과 같습니다 : (1) 숨겨진 상태에 배치 할 수있는 이전 분포의 유형은 심각하게 제한됩니다; (2) 임의의 관찰을 볼 확률을 예측할 수 없다. HMM의 많은 일반적인 사용에는 이러한 예측 확률이 필요하지 않기 때문에 이 두 번째 제한은 실제로 문제가 되지 않는 경우가 많습니다.