마르코프 연쇄, '과거는 잊고 현재만 기억하는' 확률 모델
우리의 미래는 과연 어떻게 결정될까요? 혹시 '내가 어제 무엇을 했는지가 오늘에 영향을 주고, 오늘 한 일이 내일에 영향을 미친다'고 생각하시나요? 대부분의 일은 그렇습니다. 하지만 세상에는 놀랍게도 '과거는 상관없고, 오직 현재의 상태만이 미래를 결정한다'고 가정하는 아주 독특하고 강력한 분석 도구가 있습니다. 바로 '마르코프 연쇄(Markov Chain)'입니다. 이름은 어렵게 들리지만, 사실 우리 일상 곳곳에 숨어 있는 매우 흥미로운 개념입니다. 이 글을 통해 복잡한 수식 없이, 마르코프 연쇄의 비밀을 파헤쳐 보겠습니다.

마르코프 연쇄, 도대체 무엇일까?
1. 과거는 깨끗이 잊는 기억상실 모델
마르코프 연쇄의 가장 핵심적인 특징은 '과거를 기억하지 않는다'는 점입니다. 이를 '마르코프 속성'이라고 부릅니다. 예를 들어, 연못의 연잎 위를 뛰어다니는 개구리를 상상해 봅시다. 이 개구리가 다음에 어떤 연잎으로 뛸지는, 이전에 어떤 경로를 거쳐왔는지와는 전혀 상관없이 오직 지금 밟고 있는 연잎의 위치에 의해서만 결정됩니다. 이처럼 다음 행동이 이전의 모든 역사가 아닌, 바로 직전의 '현재 상태'에만 의존하는 확률적 모델이 바로 마르코프 연쇄입니다.
2. 아주 간단한 날씨 예시
마르코프 연쇄를 이해하는 가장 고전적인 예시는 날씨 예측입니다. 만약 오늘 날씨가 '맑음'이라면, 내일도 '맑음'일 확률이 80%, '비'가 올 확률이 20%라고 가정해 봅시다. 반대로 오늘 '비'가 왔다면, 내일은 '맑음'일 확률이 40%, 계속 '비'가 올 확률이 60%라고 해보겠습니다. 이 예측 모델에서는 어제나 그저께 날씨가 어땠는지는 전혀 고려하지 않습니다. 오직 '오늘'의 날씨 상태(맑음 또는 비)만이 '내일'의 날씨 확률을 결정하는 것입니다. 이것이 바로 마르코프 연쇄의 핵심 원리입니다.
3. 상태와 전이 확률, 핵심 두 단어
마르코프 연쇄를 이해하기 위해서는 딱 두 가지 단어만 기억하면 됩니다. 바로 '상태(State)'와 '전이 확률(Transition Probability)'입니다. '상태'는 현재 처해 있는 상황이나 종류를 의미합니다. 앞선 날씨 예시에서는 '맑음'과 '비'가 바로 상태입니다. '전이 확률'은 하나의 상태에서 다른 상태로 변화할 확률을 뜻합니다. '맑음' 상태에서 다음 날 '비' 상태로 바뀔 확률 20%가 바로 전이 확률에 해당합니다. 이 두 가지만 있으면 세상을 분석하는 강력한 도구를 얻게 되는 셈입니다.
우리 주변에 숨어있는 마르코프 연쇄
1. 구글 검색 엔진의 비밀, 페이지랭크
우리가 매일 사용하는 구글 검색 엔진의 초기 핵심 기술인 '페이지랭크' 알고리즘은 마르코프 연쇄를 기반으로 합니다. 웹상의 모든 페이지를 하나의 '상태'로 보고, 사용자가 한 페이지의 링크를 클릭해 다른 페이지로 이동하는 것을 '상태 전이'로 간주한 것입니다. 이때 어떤 페이지에 많은 링크가 연결되어 사용자가 그 페이지에 머무를 확률(전이 확률)이 높다면, 그 페이지는 중요한 페이지로 판단됩니다. 이 간단한 원리로 구글은 수많은 웹페이지의 중요도를 계산해 우리에게 더 정확한 검색 결과를 보여줄 수 있었습니다.
2. 스마트폰 키보드의 자동 완성 기능
스마트폰으로 메시지를 보낼 때 다음 단어를 추천해 주는 자동 완성 기능에도 마르코프 연쇄가 숨어 있습니다. 예를 들어, 사용자가 '오늘 점심은'이라는 단어를 입력했다면, 키보드는 이전에 사용자가 썼던 단어들의 패턴을 분석합니다. 그리고 '오늘 점심은'이라는 현재 '상태' 다음에 올 확률이 가장 높은 '맛있는', '뭘까?', '간단히' 같은 단어들을 '전이 확률'에 따라 추천해 줍니다. 전체 문장의 맥락보다는 바로 직전 단어에 집중하여 다음 단어를 예측하는 것입니다.
3. 금융 시장의 주가 예측 모델
복잡한 금융 시장을 분석할 때도 마르코프 연쇄는 기초적인 도구로 사용됩니다. 예를 들어, 주식 시장의 상태를 '상승장', '하락장', '보합장' 세 가지로 나눌 수 있습니다. 그리고 과거 데이터를 분석해 오늘이 상승장일 때, 내일도 상승장일 확률, 하락장으로 변할 확률 등을 계산합니다. 물론 실제 금융 시장은 수많은 변수에 의해 움직이므로 이 모델만으로 미래를 완벽히 예측할 수는 없습니다. 하지만 시장의 큰 흐름과 경향성을 파악하는 데 중요한 기초 아이디어를 제공합니다.
마르코코프 연쇄, 더 깊이 생각해보기
1. 그렇다면 과거는 정말 중요하지 않을까?
'과거를 기억하지 않는다'는 마르코프 연쇄의 가정이 현실과 동떨어져 보일 수 있습니다. 하지만 여기서 말하는 '현재 상태'는 사실 과거의 결과가 누적된 최종 형태인 경우가 많습니다. 예를 들어, 체스 게임에서 다음 수를 예측할 때, 이전까지의 모든 기보(과거의 기록)를 알 필요는 없습니다. 오직 현재 말들이 놓인 '상태'만 완벽히 파악하면 최적의 수를 계산할 수 있습니다. 즉, 현재 상태가 과거의 중요한 정보를 모두 포함하고 있다고 보는 것입니다.
2. 우리가 사용하는 언어 모델
최근 인공지능 챗봇에서 사용되는 거대 언어 모델(LLM) 역시 마르코프 연쇄의 아이디어를 확장한 형태라고 볼 수 있습니다. 이 모델들은 단순히 바로 앞 단어 하나만 보는 것이 아니라, '나는 오늘 아침에' ~와 같이 몇 개의 단어 묶음(상태)을 기반으로 다음 단어가 나올 확률을 계산합니다. 기억해야 할 과거(단어의 개수)가 더 길어진 정교한 마르코프 연쇄라고 생각할 수 있습니다. 이를 통해 훨씬 더 자연스럽고 문맥에 맞는 문장을 생성해 낼 수 있는 것입니다.
3. 2의 256제곱, 상상도 못 할 숫자의 의미
마르코프 연쇄로 모델링하는 세상은 때로 상상 이상으로 복잡해질 수 있습니다. 예를 들어, 상태의 개수가 매우 많아지면 경우의 수는 기하급수적으로 늘어납니다. 이때 '2의 256제곱' 같은 숫자가 등장하기도 합니다. 이는 우주에 있는 모든 원자의 수보다도 훨씬 큰, 사실상 0에 가까운 확률을 의미하는 숫자입니다. 모래사장에서 특정 모래알 하나를 눈 감고 한 번에 집어내는 것보다도 비교할 수 없을 정도로 어려운 확률을 말할 때 사용되곤 합니다. 단순한 규칙이 상상할 수 없는 복잡성을 만들어 내는 것입니다.
결론
마르코프 연쇄는 '과거는 잊고, 현재에만 충실하라'는 단순한 규칙에서 출발하는 강력한 확률 모델입니다. 이 간단한 아이디어는 구글 검색, 스마트폰 키보드, 금융 분석, 심지어 최신 인공지능에 이르기까지 우리 세상의 복잡한 현상을 이해하고 예측하는 데 폭넓게 사용되고 있습니다. 이제부터 주변의 자동 추천 시스템이나 예측 서비스를 볼 때, 그 속에 숨어 있는 '기억상실' 모델, 마르코프 연쇄를 떠올려 보시는 것은 어떨까요? 숫자가 세상을 이해하는 또 다른 창문을 열어줄 것입니다.
'숫자와 세상의 비밀' 카테고리의 다른 글
| 상관관계는 인과관계를 의미하지 않는다, 통계 해석의 가장 큰 함정 (0) | 2025.11.05 |
|---|---|
| 이항분포, 동전 던지기 속에 숨겨진 예측 가능한 패턴 (0) | 2025.11.04 |
| 몬테카를로 시뮬레이션, 무작위 숫자로 미래를 예측하는 법 (0) | 2025.11.02 |
| 켈리 기준, 도박사가 파산하지 않기 위한 최적의 베팅 공식 (0) | 2025.11.01 |
| 랜덤 워크 이론, 술 취한 사람의 걸음걸이가 주가를 예측한다? (0) | 2025.10.31 |