→ Bayesian Inference Explained: Thomas Bayes, Prior Probability, and Evidence
베이지안 추론이란 무엇인가: 토머스 베이즈, 사전 확률, 그리고 증거
베이지안 추론은 인간이 세상을 백지로 만나지 않는다는 사실에서 출발합니다. 우리는 이미 어떤 기대와 의심, 기억과 습관을 가진 채 사건을 봅니다. 문제는 선입견이 있느냐 없느냐가 아닙니다. 더 중요한 문제는 새로운 증거가 들어왔을 때 그 믿음을 얼마나 책임 있게 고칠 수 있느냐입니다.
그래서 베이지안 추론은 통계학의 한 기법이면서 동시에 불확실한 세계를 살아가는 태도입니다. 사전 확률, 증거, 가능도, 사후 확률이라는 네 요소를 통해 믿음이 움직이는 과정을 보여줍니다. 믿음은 바위처럼 버티는 것이 아니라, 증거와 만날 때 조금씩 방향과 강도를 바꾸는 판단의 상태가 됩니다.
다만 여기에는 냉정한 경고도 붙습니다. 잘못된 사전 확률에서 출발하면, 아무리 정교한 계산도 편견을 말끔하게 지워주지 못합니다. 수식은 고요하지만, 그 수식에 들어가는 세계는 결코 고요하지 않습니다.
베이지안 추론은 증거가 들어온 뒤 믿음을 갱신하는 방식입니다
베이지안 추론은 어떤 가설의 확률을 새로운 증거에 비추어 다시 계산하는 추론 방식입니다. 가장 널리 알려진 형태는 베이즈 정리를 사용해 사전 확률과 가능도, 증거의 전체 확률을 결합하고, 그 결과로 사후 확률을 얻는 방식입니다.
기본식은 보통 P(H | E) = P(E | H) P(H) / P(E)로 표현합니다. 여기서 H는 가설, E는 증거입니다. P(H)는 새로운 증거를 보기 전 가설에 부여한 사전 확률입니다. P(E | H)는 그 가설이 참일 때 해당 증거가 나타날 가능도입니다. P(E)는 여러 가능성을 모두 고려했을 때 그 증거가 나타날 전체 확률입니다. P(H | E)는 증거를 반영한 뒤의 사후 확률입니다.
공식은 짧습니다. 그러나 그 공식이 수행하는 일은 작지 않습니다. 베이지안 추론은 어떤 주장이 절대적으로 참인지 거짓인지를 먼저 묻지 않습니다. 대신 증거가 우리의 확신을 얼마나 움직여야 하는지를 묻습니다. 의사, 과학자, 판사, 정책 담당자, 아이의 침묵을 읽어내려는 부모까지 모두 제한된 정보 속에서 판단합니다. 확실성을 소유하지 못한 채, 확신의 정도를 조정합니다.
이 조정이 핵심입니다. 믿음은 한 번 새기면 끝나는 명령문이 아닙니다. 증거에 따라 올라가거나 내려가거나 거의 움직이지 않을 수 있는 확률적 판단입니다.
토머스 베이즈의 이름은 공식에 붙었지만, 문제는 더 오래되었습니다
토머스 베이즈(Thomas Bayes, c. 1701–1761)는 영국의 장로교 목사이자 수학자였습니다. 그의 유명한 글 『확률론의 한 문제를 풀기 위한 시론』은 사후인 1763년에 출간되었습니다. 이후 피에르시몽 라플라스(Pierre-Simon Laplace, 1749–1827)가 확률을 불완전한 정보 속에서 판단하는 일반적 방법으로 발전시키면서, 베이즈의 이름은 더 넓은 지적 생명을 얻게 됩니다.
확률론은 계산으로 정리된 상식에 지나지 않는다.
— 라플라스, 『확률에 관한 철학적 시론』(1814)
라플라스의 이 문장은 유명합니다. 확률이 상식을 더 정확하게 만들 수 있다는 매혹을 잘 보여주기 때문입니다. 그러나 바로 이 지점에서 조심해야 합니다. 상식은 중립적인 공기가 아닙니다. 상식 안에는 계급, 성별, 제도, 직업적 관성, 시대의 편견이 섞여 있습니다. 베이지안 추론은 우리의 판단을 또렷하게 만들 수 있지만, 출발점이 어디서 왔는지를 묻는 일을 대신해주지는 않습니다.
이 역사적 배경은 중요합니다. 베이즈 정리는 현대 데이터 과학을 위해 갑자기 떨어진 도구가 아닙니다. 그것은 유한한 증거로 일반적 믿음을 어떻게 정당화할 수 있는지, 결과에서 원인을 어떻게 추정할 수 있는지, 어제의 관찰이 내일의 기대를 왜 바꾸어야 하는지를 둘러싼 오래된 고민과 이어져 있습니다.
증거는 혼자 말하지 않습니다. 증거는 언제나 가설과 배경 조건 속에서 의미를 얻습니다. 같은 기침도 꽃가루가 많은 봄날에는 알레르기의 신호일 수 있고, 독감 유행기에는 감염의 신호일 수 있으며, 면역 질환이 있는 환자에게는 다른 무게를 가질 수 있습니다. 목에서 나온 소리는 같아도, 합리적 해석은 상황에 따라 달라집니다.
사전 확률은 부끄러운 비밀이 아니라 출발점의 고백입니다
베이지안 추론에서 가장 논쟁적인 요소는 사전 확률입니다. 사전 확률은 새로운 증거를 보기 전에 우리가 어떤 가설에 부여하는 초기 확률입니다. 누군가는 여기서 주관성이 들어온다고 비판합니다. 맞는 말입니다. 그러나 그 비판은 반대로도 작동합니다. 다른 추론 방식도 가정을 갖고 있습니다. 다만 그 가정이 제도적 관행, 전문가의 자신감, 중립을 가장한 절차 속에 숨어 있을 뿐입니다.
사전 확률은 과거 자료, 전문가 판단, 물리적 모형, 인구 집단의 발생률, 또는 정보가 부족할 때 의도적으로 약하게 설정한 가정에서 나올 수 있습니다. 의료 진단에서는 특정 집단의 질병 유병률이 사전 확률이 될 수 있습니다. 스팸 필터에서는 과거에 어떤 문구와 발신 패턴이 스팸으로 판정되었는지가 사전 확률에 영향을 줍니다. 과학 모델에서는 이전 실험이나 이론적 제약이 출발점이 됩니다.
사전 확률의 장점은 투명성입니다. 계산이 시작되기 전에 무엇이 이미 들어와 있었는지를 묻게 만듭니다. 그러나 그 투명성의 그림자도 있습니다. 사전 확률이 편향되어 있으면 사후 확률도 그 편향을 물려받을 수 있습니다. 부당한 단속 자료로 학습한 위험 평가 시스템은 이미 과잉 감시를 받은 집단을 다시 위험하다고 표시할 수 있습니다. 과거 승진 자료로 훈련된 채용 알고리즘은 오래된 배제를 새로운 근거처럼 다룰 수 있습니다.
그래서 베이지안 추론은 수학적 절차이면서 인식의 윤리입니다. 우리는 제대로 갱신했는지만 물어서는 부족합니다. 그 계산에 들어간 숫자들이 신뢰할 만한지, 그 숫자들이 누구의 경험을 지우고 누구의 불안을 확대했는지도 함께 물어야 합니다.
가능도는 가설이 참일 때 증거가 얼마나 그럴듯한지를 묻습니다
가능도는 사후 확률과 자주 혼동됩니다. 그러나 둘의 차이는 결정적입니다. 가능도는 그 가설이 참이라면 이 증거가 얼마나 나타날 법한가를 묻습니다. 사후 확률은 이 증거가 주어졌을 때 그 가설이 얼마나 참일 법한가를 묻습니다. 방향이 반대입니다. 이 둘을 섞으면 똑똑한 사람도 허술한 결론에 도달합니다.
간단한 의료 검진 예를 들어보겠습니다. 어떤 질병이 전체 인구의 1%에게 있다고 가정합시다. 검사는 실제 환자의 99%를 양성으로 찾아내고, 환자가 아닌 사람의 5%에게도 양성 반응을 냅니다. 어떤 사람이 양성 판정을 받으면 많은 사람은 질병 가능성이 99%에 가깝다고 느낍니다. 그러나 그것은 검사 민감도와 양성 판정 이후 실제 질병 확률을 혼동한 것입니다.
1만 명을 생각해보겠습니다. 그중 약 100명이 환자입니다. 검사는 이 중 99명을 잡아냅니다. 환자가 아닌 9,900명 중에서는 5%인 495명이 양성 판정을 받습니다. 그러면 양성 판정자는 진짜 양성 99명과 거짓 양성 495명으로 이루어집니다. 양성 판정을 받은 사람이 실제로 환자일 확률은 99를 594로 나눈 값, 약 16.7%입니다.
이 숫자가 낯설게 느껴지는 이유는 우리가 흔히 기본 발생률을 놓치기 때문입니다. 베이지안 추론은 바로 그 충동을 붙잡습니다. 강렬한 신호가 기존 상황을 지워버리도록 내버려두지 않습니다. 공적 판단에서도 이 태도는 중요합니다. 바이럴 영상 하나, 충격적인 범죄 기사 하나, 표본이 불분명한 여론조사 하나가 여론 전체를 흔듭니다. 베이지안 추론은 묻습니다. 그 사건은 원래 얼마나 흔했습니까. 그 가설이 틀려도 그런 증거가 나타날 가능성은 얼마나 됩니까. 같은 증거를 설명할 다른 가설은 없습니까.
사후 확률은 마지막 결론이 아니라 갱신된 현재입니다
사후 확률은 증거를 반영한 뒤의 확률입니다. 그러나 그것을 영원한 결론처럼 다루면 베이지안 정신을 오해하게 됩니다. 오늘의 사후 확률은 내일의 사전 확률이 될 수 있습니다. 배움은 한 번의 계산으로 끝나지 않습니다. 새로운 증거가 오면 다시 움직입니다.
여기서 베이지안 추론은 철학적으로 흥미로워집니다. 합리성은 딱딱함이 아니라 수정 가능성입니다. 합리적인 사람은 아무 증거에도 흔들리지 않는 사람이 아닙니다. 그렇다고 모든 정보 조각에 정신없이 흔들리는 사람도 아닙니다. 좋은 판단에는 탄성이 있습니다. 조작당하지 않을 만큼의 단단함, 독단에 빠지지 않을 만큼의 열림이 함께 필요합니다.
우리의 공론장은 이 균형을 자주 잃습니다. 제도는 불확실성을 약점처럼 숨기고, 온라인 집단은 즉각적인 확신을 충성의 표시처럼 요구합니다. 베이지안 추론은 더 차분하지만 더 엄격한 태도를 제안합니다. 지금 나는 무엇을 믿고 있는가. 왜 그렇게 믿는가. 어느 정도의 확신인가. 어떤 증거가 오면 그 믿음을 바꿀 것인가.
자신을 수정할 증거를 말하지 못하는 믿음은 더 이상 탐구가 아닙니다. 그것은 정체성 관리에 가까워집니다.
베이지안 추론과 빈도주의는 지성의 우열이 아니라 강조점의 차이입니다
베이지안 통계와 빈도주의 통계는 종종 서로 싸우는 정당처럼 소개됩니다. 그러나 그것은 좋은 설명도 아니고 좋은 철학도 아닙니다. 빈도주의는 반복 표본, 장기적 오류율, 신뢰구간, 가설검정에 큰 비중을 둡니다. 베이지안 접근은 가설이나 모수에 대한 확률분포를 세우고, 증거가 들어오면 그 분포를 갱신하는 데 초점을 둡니다. 두 전통 모두 엄밀한 도구를 만들었고, 두 전통 모두 잘못 쓰일 수 있습니다.
차이는 확률을 무엇으로 이해하느냐에도 있습니다. 빈도주의의 많은 장면에서 확률은 반복 시행의 장기적 빈도와 관련됩니다. 베이지안 접근에서는 확률이 합리적 확신의 정도를 표현할 수도 있습니다. 그래서 한 번뿐인 사건, 직접 반복하기 어려운 모수, 불확실한 의사결정에서는 베이지안 방식이 강한 매력을 갖습니다.
하지만 대가는 있습니다. 사전 확률을 두고 논쟁이 생길 수 있습니다. 계산이 복잡해질 수 있습니다. 모델은 수학적으로 세련되어 보여도 사회적으로는 둔감할 수 있습니다. 베이지안 방법이 인공지능, 금융, 치안, 의료, 공공정책에 들어갈 때 핵심 질문은 공식이 아름다운지가 아닙니다. 누구의 불확실성이 수치화되는가. 누구의 자료가 쓰이는가. 사후 확률이 틀렸을 때 누가 비용을 치르는가입니다.
이 지점에서 철학은 가장 좋은 의미의 정치가 됩니다. 지식은 진공에서 생산되지 않습니다. 지식은 기관, 예산, 데이터베이스, 인센티브, 행정 관성 속을 지나갑니다. 베이지안 추론은 더 나은 판단을 도울 수 있지만, 그 판단을 사용하는 시스템에 대한 민주적 감시를 대신할 수는 없습니다.
베이지안 추론의 힘은 배움의 과정을 드러내는 데 있습니다
베이지안 추론의 장점은 배움의 구조를 분명하게 나눈다는 데 있습니다. 사전 확률, 증거, 가능도, 사후 확률을 구분합니다. 이 구분은 지적 위생에 가깝습니다. 아무 가정도 없는 척하는 오류, 가능도와 사후 확률을 혼동하는 오류, 기본 발생률을 무시하는 오류, 새로운 사실 하나가 모든 판단을 뒤집어야 한다고 믿는 오류를 줄여줍니다.
응용 범위가 넓은 이유도 여기에 있습니다. 불확실성은 어디에나 있습니다. 베이지안 추론은 과학 모델링, 의료 진단, 머신러닝, 스팸 필터링, 법적 판단, 위험 분석, 검색 알고리즘, 기후 모델, 일상적 의사결정에 등장합니다. 어떤 체계가 정보에 반응해 기대를 수정해야 한다면, 그 근처에는 베이지안 논리가 있습니다.
그러나 이 개념의 가장 좋은 사용법은 기술 이전에 윤리적입니다. 베이지안 추론은 자신의 확신이 어떻게 움직였는지 설명하라고 요구합니다. 의심과 증거를 구분하고, 증거와 증명을 구분하며, 증명과 더 이상 생각하고 싶지 않다는 욕망을 구분하게 만듭니다.
알고리즘적 확실성의 시대에는 이 교훈이 특히 필요합니다. 우리는 점수, 순위, 추천, 경고, 위험 분류에 둘러싸여 살아갑니다. 그것들은 계산의 매끈한 목소리로 말합니다. 베이지안 추론은 그 목소리 앞에서 묻게 합니다. 어떤 사전 확률이 있었습니까. 어떤 증거를 보았습니까. 어떤 가능도를 가정했습니까. 어떤 집단이 빠졌습니까. 어떤 제도적 공포가 숫자로 변장했습니까.
잘 쓰인 베이지안 추론은 지적 책임의 훈련입니다. 잘못 쓰이면 오래된 가정을 깨끗한 기호로 세탁하는 장치가 될 수 있습니다. 그러므로 과제는 수학과 비판 중 하나를 고르는 일이 아닙니다. 비판을 견딜 수 있는 수학을 요구하는 일입니다.
베이지안 추론은 책임 있는 불확실성의 문법입니다
베이지안 추론은 전지전능을 약속하지 않습니다. 그것은 불완전한 믿음에 대해 더 정직하게 말하는 방식입니다. 사전 확률은 우리가 어디서 출발했는지를 말합니다. 가능도는 증거가 가설과 얼마나 잘 맞는지를 말합니다. 사후 확률은 증거와 만난 뒤 우리가 어디에 서 있는지를 말합니다. 증거는 마음을 마법처럼 정화하지 않습니다. 다만 마음이 스스로를 고치도록 압력을 가합니다.
그래서 이 개념은 여전히 살아 있습니다. 문제를 이해하기도 전에 확신에 찬 목소리부터 내는 사람이 보상받는 시대에, 베이지안 추론은 다른 습관을 제안합니다. 비례, 수정, 책임입니다. 확신에는 이력이 있어야 하고, 판단에는 어떻게 바뀌었는지의 흔적이 남아야 합니다.
공식 안에 숨어 있는 가장 인간적인 교훈은 이것일지도 모릅니다. 잘 갱신한다는 것은 어제의 내가 불완전했음을 인정하면서도 어제의 나를 모욕하지 않는 일입니다. 증거를 존중하되 소음에 끌려가지 않는 일입니다. 믿음을 성벽처럼 세우지 않고, 들을 줄 아는 대화로 남겨두는 일입니다.


댓글 쓰기