게임이론과 일상 — 죄수의 딜레마부터 가위바위보까지

들어가며 — 두 죄수의 운명
게임이론이란 무엇인가
내시균형 — 아무도 후회하지 않는 지점
- 가위바위보의 균형
일상 곳곳에 숨은 죄수의 딜레마
협력은 어떻게 진화하는가 — 액설로드의 토너먼트
모든 게임이 딜레마는 아니다 — 치킨게임과 조정게임
- 치킨게임 — 누가 먼저 핸들을 꺾는가
- 조정게임 — 우리는 같은 편
비즈니스와 국제관계 속 게임이론
동물도 게임을 한다 — 진화적으로 안정한 전략
공유지의 비극, 그 너머 — 엘리너 오스트롬
페널티킥의 수학 — 일상 속 혼합전략
평판이라는 보이지 않는 자산
레몬 시장 — 정보가 비대칭일 때
벼랑 끝의 사고실험 — 협력과 파국 사이
협력을 설계하는 법 — 작은 실천 가이드
값비싼 신호 — 자연과 사회의 공통 문법
잠깐 퀴즈 — 당신의 게임 감각은?
게임이론의 한계 — 겸손하게 쓰기
마치며 — 우리는 이미 플레이어다
- 생각할 거리
참고 자료

들어가며 — 두 죄수의 운명

밀폐된 취조실 두 곳에 각각 한 명씩, 공범으로 의심받는 두 사람이 앉아 있다고 상상해 보세요. 두 사람은 서로 대화할 수 없습니다. 검사가 똑같은 제안을 따로따로 건넵니다.

"당신이 자백하고 동료가 침묵하면, 당신은 즉시 풀려나고 동료는 10년형을 받습니다. 반대라면 당신이 10년형이고요. 둘 다 자백하면 각자 5년형입니다. 그런데 둘 다 끝까지 침묵하면, 우리가 가진 증거가 약해서 둘 다 1년형으로 끝납니다."

자, 당신이라면 어떻게 하시겠습니까?

논리적으로 따져 봅시다. 상대가 침묵한다고 가정해 봅시다. 그러면 나는 자백하는 게 낫습니다(0년 대 1년). 상대가 자백한다고 가정해도, 역시 나는 자백하는 게 낫습니다(5년 대 10년). 즉, 상대가 무엇을 하든 나에게는 자백이 유리합니다. 상대도 똑같이 생각할 테니, 결국 두 사람 모두 자백하고 각자 5년형을 받습니다.

여기에 이 이야기의 잔인한 아이러니가 있습니다. 두 사람이 모두 입을 다물었다면 각자 1년이면 끝날 일이었는데, 각자 '합리적으로' 행동한 결과 5년씩을 살게 된 것입니다. 개인의 합리성이 모두의 비합리성으로 귀결되는 이 역설, 이것이 바로 게임이론에서 가장 유명한 **죄수의 딜레마(Prisoner's Dilemma)**입니다.

이 글은 이 작은 사고실험에서 출발해, 우리가 일상에서 매일 치르고 있는 '보이지 않는 게임'의 규칙을 함께 탐험해 보려고 합니다.

게임이론이란 무엇인가

게임이론은 이름 때문에 오해받기 쉽습니다. 보드게임이나 비디오게임 공략법이 아닙니다. 게임이론은 여러 의사결정자가 서로의 선택에 영향을 주고받는 상황에서, 각자가 어떻게 행동하는지를 수학적으로 분석하는 학문입니다.

여기서 핵심은 "서로 영향을 주고받는다"는 점입니다. 혼자 동전을 던지는 것은 게임이론의 대상이 아닙니다. 하지만 상대가 무엇을 할지에 따라 내 최선의 선택이 달라진다면, 그것은 전략적 상황, 곧 '게임'입니다.

게임이론은 1944년 수학자 존 폰 노이만(John von Neumann)과 경제학자 오스카어 모르겐슈테른(Oskar Morgenstern)이 함께 쓴 책 『게임이론과 경제 행동』으로 본격적인 학문이 되었습니다. 이후 존 내시(John Nash)가 결정적인 개념을 더하면서, 게임이론은 경제학, 정치학, 생물학, 컴퓨터과학을 넘나드는 강력한 도구가 되었습니다.

게임을 분석할 때 우리는 보통 세 가지 요소를 따집니다.

게임의 3요소
─────────────────────────────
1) 참가자 (Players)   : 누가 게임을 하는가
2) 전략 (Strategies)  : 각자 무엇을 선택할 수 있는가
3) 보수 (Payoffs)     : 각 결과에서 누가 무엇을 얻는가
─────────────────────────────

죄수의 딜레마로 다시 돌아가 보면, 참가자는 두 죄수, 전략은 '자백' 또는 '침묵', 보수는 형량입니다. 이 세 가지만 정해지면 우리는 게임의 결과를 예측할 수 있습니다.

내시균형 — 아무도 후회하지 않는 지점

게임이론의 심장에는 **내시균형(Nash Equilibrium)**이라는 개념이 있습니다. 영화 『뷰티풀 마인드』의 실제 주인공인 수학자 존 내시가 1950년 박사 논문에서 제시한 이 아이디어는, 훗날 그에게 노벨 경제학상을 안겨 주었습니다.

내시균형은 한 문장으로 이렇게 정의할 수 있습니다.

"모든 참가자가, 다른 사람의 선택이 그대로일 때, 자기 선택을 바꿀 이유가 없는 상태."

조금 풀어 봅시다. 어떤 상황에서 내가 혼자 전략을 바꿔도 내 처지가 나아지지 않는다면, 나는 현재 선택을 유지할 것입니다. 모두가 그렇게 느끼는 지점, 즉 누구도 일방적으로 이탈할 동기가 없는 안정된 상태가 내시균형입니다.

죄수의 딜레마에서 '둘 다 자백'은 내시균형입니다. 상대가 자백하는 상황에서 나 혼자 침묵으로 바꾸면 형량이 5년에서 10년으로 늘어나니까요. 반면 '둘 다 침묵'은 보수가 훨씬 좋지만, 내시균형이 아닙니다. 상대가 침묵할 때 나 혼자 자백하면 0년으로 풀려나기 때문입니다. 그래서 이 좋은 결과는 불안정합니다. 늘 배신의 유혹이 도사립니다.

내시의 위대함은, 아주 넓은 종류의 게임에 적어도 하나의 균형이 반드시 존재한다는 사실을 증명한 데 있습니다. 덕분에 우리는 어떤 전략적 상황에서도 "결국 어디로 수렴할까?"를 분석할 도구를 얻었습니다.

가위바위보의 균형

내시균형이 늘 한 가지 결정된 행동인 것은 아닙니다. 가위바위보를 떠올려 보세요. 만약 당신이 항상 바위만 낸다면, 상대는 곧 알아채고 보를 내서 당신을 이길 것입니다. 어떤 고정된 선택도 안정적이지 않습니다.

그렇다면 가위바위보의 내시균형은 무엇일까요? 바로 가위, 바위, 보를 각각 3분의 1씩 무작위로 내는 것입니다. 이렇게 하면 상대가 무엇을 하든 평균적으로 이기지도 지지도 않고, 상대 역시 나의 패턴을 이용할 수 없습니다. 이처럼 확률을 섞은 전략을 **혼합전략(mixed strategy)**이라고 부릅니다. 예측 불가능함 그 자체가 최선의 전략이 되는 순간입니다.

일상 곳곳에 숨은 죄수의 딜레마

죄수의 딜레마는 취조실에만 있는 이야기가 아닙니다. 우리 삶의 수많은 장면이 사실 같은 구조를 갖고 있습니다.

죄수의 딜레마 보수 구조 (낮을수록 형량이 무겁다 → 나쁨)
              상대 침묵      상대 자백
나 침묵      (1년, 1년)     (10년, 0년)
나 자백      (0년, 10년)    (5년, 5년)
※ 각 칸의 (왼쪽=나, 오른쪽=상대)

이 구조의 본질은 "서로 협력하면 둘 다 좋지만, 각자에게는 배신이 유리하다"는 것입니다. 이 패턴을 알아채기 시작하면, 세상이 달라 보입니다.

헬스장의 가격 경쟁: 동네에 헬스장 두 곳이 있다고 합시다. 둘 다 적정 가격을 유지하면 모두 적당한 이윤을 냅니다. 하지만 한 곳이 가격을 내려 손님을 빼앗으면 그곳이 이득을 봅니다. 그래서 양쪽 다 가격을 내리고, 결국 둘 다 박리다매에 시달립니다.
공유지의 비극: 모두가 함께 쓰는 목초지에서, 각 목동은 자기 가축을 한 마리라도 더 풀어놓는 게 이득입니다. 하지만 모두가 그렇게 하면 풀이 모두 사라져 목초지가 황폐해집니다. 깨끗한 공기, 바다의 물고기, 지하수 같은 공공자원이 자주 고갈되는 이유가 여기에 있습니다.
군비 경쟁: 두 나라가 모두 무장을 자제하면 평화롭고 예산도 아낄 수 있습니다. 하지만 상대가 무장을 강화하면 나도 해야 안전합니다. 결국 양쪽 다 막대한 군비를 쏟아붓고도 안전은 그대로인 상태에 빠집니다.

이 모든 상황의 공통점은, 개인에게 합리적인 선택이 모두에게는 손해가 된다는 점입니다.

협력은 어떻게 진화하는가 — 액설로드의 토너먼트

죄수의 딜레마가 그렇게 비관적이라면, 우리는 어떻게 서로 협력하며 사회를 이루고 살아갈까요? 이 질문에 멋진 답을 던진 사람이 정치학자 로버트 액설로드(Robert Axelrod)입니다.

1980년, 액설로드는 흥미로운 실험을 했습니다. 그는 전 세계 학자들에게 죄수의 딜레마를 반복해서 겨루는 컴퓨터 프로그램을 제출해 달라고 요청했습니다. 한 번의 게임이 아니라, 같은 상대와 수백 번을 반복하는 상황이었습니다. 반복이 핵심입니다. 다시 만날 상대라면, 배신의 대가를 나중에 치를 수 있으니까요.

수많은 정교한 전략이 제출되었습니다. 복잡한 통계로 상대를 속이려는 프로그램, 처음부터 끝까지 배신만 하는 프로그램도 있었습니다. 그런데 우승은 아나톨 라포포트(Anatol Rapoport)가 제출한, 단 몇 줄로 된 가장 단순한 전략에게 돌아갔습니다. 그 이름은 팃포탯(Tit for Tat), 우리말로 "받은 대로 갚기"입니다.

팃포탯 전략
─────────────────────────────
1. 첫 판: 무조건 협력한다.
2. 그다음: 상대가 직전에 한 행동을 그대로 따라 한다.
   - 상대가 협력했으면 → 나도 협력
   - 상대가 배신했으면 → 나도 배신
─────────────────────────────

이 단순한 전략이 어떻게 승리했을까요? 액설로드는 성공한 전략들의 공통점을 분석해 네 가지 원칙을 발견했습니다.

친절함(Nice): 먼저 배신하지 않는다. 협력으로 시작한다.
보복함(Retaliatory): 상대가 배신하면 즉시 응징해, 만만하게 보이지 않는다.
용서함(Forgiving): 상대가 다시 협력하면 과거를 묻지 않고 곧장 협력으로 돌아간다.
명료함(Clear): 전략이 단순하고 예측 가능해, 상대가 협력의 이점을 쉽게 학습한다.

여기서 깊은 통찰이 나옵니다. 협력은 천사 같은 선함에서 나오는 것이 아니라, '미래에 다시 만난다'는 사실에서 자라난다는 것입니다. 관계가 지속될수록, 배신의 단기 이익보다 협력의 장기 이익이 커집니다. 액설로드는 이를 "미래의 그림자(the shadow of the future)"라고 불렀습니다. 미래가 길게 드리울수록 사람들은 협력합니다.

모든 게임이 딜레마는 아니다 — 치킨게임과 조정게임

게임이론의 세계에는 죄수의 딜레마 말고도 흥미로운 게임들이 있습니다.

치킨게임 — 누가 먼저 핸들을 꺾는가

두 운전자가 서로를 향해 마주 보고 차를 몹니다. 먼저 핸들을 꺾어 피하는 사람이 '겁쟁이(치킨)'가 되어 망신을 당합니다. 하지만 둘 다 끝까지 직진하면 정면충돌로 모두 파국을 맞습니다.

치킨게임의 핵심은 죄수의 딜레마와 정반대입니다. 죄수의 딜레마에서는 '상대가 무엇을 하든 배신'이 유리했지만, 치킨게임에서는 상대가 직진하면 내가 피해야 하고, 상대가 피하면 내가 직진해야 합니다. 내 최선의 선택이 상대의 선택에 정반대로 달려 있습니다.

여기서 역설적인 전략이 등장합니다. 만약 내가 핸들을 아예 뽑아서 차창 밖으로 던져 버리는 모습을 상대에게 똑똑히 보여 준다면 어떨까요? 이제 나는 핸들을 꺾을 수조차 없습니다. 합리적인 상대는 피할 수밖에 없습니다. 자기 선택지를 스스로 없애는 것이 오히려 승리를 가져오는, 이른바 '공약(commitment)'의 힘입니다. 냉전 시기의 핵 억지력 논리에도 이런 그림자가 어른거립니다.

조정게임 — 우리는 같은 편

모든 게임이 갈등은 아닙니다. **조정게임(coordination game)**에서는 참가자들의 이해가 일치합니다. 다만 '어떻게 발을 맞출지'가 문제일 뿐입니다.

도로에서 모두가 오른쪽으로 달릴지 왼쪽으로 달릴지는, 사실 둘 중 무엇이든 상관없습니다. 중요한 것은 모두가 같은 쪽을 택하는 것입니다. 언어, 화폐, 키보드 자판 배열, 약속 장소 정하기 같은 수많은 사회적 관습이 바로 이런 조정게임의 결과물입니다.

게임 유형 비교
─────────────────────────────────────────────
유형          핵심 긴장             대표 예시
─────────────────────────────────────────────
죄수의 딜레마  협력 대 배신          담합, 공유지의 비극
치킨게임      누가 양보하는가        벼랑끝 외교, 가격 인하 치킨런
조정게임      어떻게 발을 맞추나      좌측통행 대 우측통행, 표준 규격
─────────────────────────────────────────────

비즈니스와 국제관계 속 게임이론

게임이론은 추상적 이론에 머물지 않습니다. 실제 세계의 큰 결정들이 이 논리 위에서 움직입니다.

경매와 주파수 할당. 정부가 통신용 주파수를 기업들에게 경매로 파는 방식은, 게임이론자들이 정교하게 설계했습니다. 누가 얼마를 써낼지, 다른 기업의 행동을 어떻게 예측할지가 모두 전략적 게임이기 때문입니다.

가격 담합과 그 붕괴. 같은 업종의 기업들은 가격을 높게 유지하면 모두 이득이지만, 누군가 몰래 가격을 내려 손님을 끌면 큰 이익을 봅니다. 그래서 담합은 본질적으로 불안정합니다. 죄수의 딜레마가 반복되는 구조이기 때문입니다.

국제 협상. 무역 협정, 기후변화 대응, 핵 군축 같은 국제 문제는 거대한 반복 게임입니다. 각국은 협력의 이익과 배신의 유혹 사이에서 줄타기를 합니다. 여기서 '신뢰할 수 있는 약속'과 '미래의 그림자'가 협력의 열쇠가 됩니다. 다만 이런 영역은 가치관과 입장이 첨예하게 갈리므로, 게임이론은 정답을 주기보다 서로의 유인 구조를 이해하는 렌즈를 제공한다고 보는 편이 정확합니다.

동물도 게임을 한다 — 진화적으로 안정한 전략

게임이론이 인간의 합리적 계산에만 적용된다고 생각하면 오산입니다. 1973년, 생물학자 존 메이너드 스미스(John Maynard Smith)는 게임이론을 진화의 세계로 옮겨 왔습니다. 동물들은 의식적으로 전략을 '계산'하지 않습니다. 그러나 자연선택이 그 계산을 대신해 줍니다. 더 나은 전략을 가진 개체가 더 많은 자손을 남기면, 그 전략은 집단 안에서 점점 퍼져 나가니까요.

여기서 그는 **진화적으로 안정한 전략(ESS, Evolutionarily Stable Strategy)**이라는 개념을 제시했습니다. 어떤 전략이 집단 안에 자리 잡았을 때, 소수의 '돌연변이' 전략이 침입해도 그것을 이겨 낼 수 있다면, 그 전략은 진화적으로 안정합니다.

대표적인 예가 '매-비둘기 게임'입니다. 한 종의 동물들이 먹이나 영역을 두고 다툰다고 합시다. '매' 전략은 늘 끝까지 싸우고, '비둘기' 전략은 위협만 하다 위험해지면 물러섭니다.

매-비둘기 게임의 직관
─────────────────────────────
모두가 매라면  : 끊임없는 부상, 집단이 손해
모두가 비둘기라면 : 평화롭지만 매 한 마리가 나타나면 휩쓴다
→ 안정점은 매와 비둘기가 일정 비율로 섞인 상태
─────────────────────────────

흥미로운 결론은, 자연이 종종 '완전한 협력'도 '완전한 경쟁'도 아닌 중간 지점에서 균형을 이룬다는 것입니다. 너무 호전적이면 서로 다쳐서 손해이고, 너무 순하면 호전적인 개체에게 이용당합니다. 그래서 많은 동물 집단에서 공격성의 수준이 일정한 비율로 유지됩니다. 인간 사회의 협력과 경쟁의 미묘한 균형도, 어쩌면 이런 진화적 논리의 후예일지 모릅니다.

공유지의 비극, 그 너머 — 엘리너 오스트롬

앞에서 우리는 '공유지의 비극'을 살펴보았습니다. 모두가 함께 쓰는 자원은 각자의 이기심 탓에 결국 고갈된다는 비관적 이야기였습니다. 오랫동안 사람들은 이 문제의 해법이 둘뿐이라고 믿었습니다. 정부가 강하게 규제하거나, 자원을 사유재산으로 쪼개 파는 것.

그런데 정치학자 엘리너 오스트롬(Elinor Ostrom)은 전 세계의 실제 사례를 끈질기게 조사한 끝에, 놀라운 제3의 길을 발견했습니다. 그녀는 2009년 여성 최초로 노벨 경제학상을 받았습니다.

오스트롬이 본 것은 이것이었습니다. 스위스의 알프스 목초지, 일본의 마을 공유림, 스페인의 관개수로처럼, 수백 년 동안 지역 공동체가 스스로 규칙을 만들어 공유 자원을 훌륭히 관리해 온 사례들이 세계 곳곳에 있었습니다. 정부의 강제도, 시장의 사유화도 아닌, 사람들 사이의 약속과 신뢰로요.

오스트롬이 발견한 성공의 조건(일부)
─────────────────────────────
1) 누가 자원을 쓸 수 있는지 경계가 분명하다
2) 규칙을 쓰는 사람들이 직접 규칙을 만든다
3) 규칙을 어기는지 서로 감시할 수 있다
4) 위반에 대한 처벌이 단계적이다
5) 분쟁을 풀 저렴하고 쉬운 방법이 있다
─────────────────────────────

이 발견의 의미는 깊습니다. 죄수의 딜레마는 협력이 깨지기 쉽다는 것을 보여 주지만, 오스트롬은 인간이 적절한 제도와 신뢰만 갖추면 그 함정을 빠져나올 수 있음을 보여 주었습니다. 게임의 규칙을 바꾸면, 게임의 결과도 바뀝니다. 우리는 운명에 갇힌 죄수가 아니라, 함께 규칙을 설계할 수 있는 존재입니다.

페널티킥의 수학 — 일상 속 혼합전략

앞에서 가위바위보의 최선이 '무작위'라고 했습니다. 이 원리가 실제로 가장 극적으로 펼쳐지는 무대 중 하나가 축구의 페널티킥입니다.

키커는 공을 왼쪽으로 찰지 오른쪽으로 찰지 정해야 하고, 골키퍼는 어느 쪽으로 몸을 던질지 동시에 정해야 합니다. 만약 키커가 늘 오른쪽으로만 찬다면, 골키퍼는 곧 알아채고 오른쪽으로 뛰어 막을 것입니다. 반대도 마찬가지입니다. 그래서 양쪽 모두 상대가 예측하지 못하도록 방향을 섞어야 합니다.

페널티킥의 전략 구조
─────────────────────────────
키커  : 왼쪽 / 오른쪽을 섞어 찬다
키퍼  : 왼쪽 / 오른쪽을 섞어 막는다
핵심  : 어느 쪽도 패턴을 들키면 손해
→ 양쪽 모두 적절한 비율의 혼합전략이 최선
─────────────────────────────

흥미롭게도 실제 프로 축구 경기를 분석한 연구들은, 일류 선수들의 선택 비율이 게임이론이 예측하는 최적 혼합전략에 상당히 가깝다는 것을 보여 주었습니다. 누구도 칠판 앞에서 확률을 계산하지 않지만, 수많은 경기와 훈련을 거치며 몸이 최적의 전략을 학습한 셈입니다. 이론이 운동장 위에서 살아 움직이는 멋진 사례입니다.

이 원리는 스포츠를 넘어섭니다. 테니스의 서브 방향, 포커의 블러핑, 심지어 세무 당국의 무작위 세무조사까지, '예측 불가능함이 곧 힘'인 상황은 우리 주변에 의외로 많습니다.

평판이라는 보이지 않는 자산

반복 게임에서 협력을 지탱하는 또 하나의 기둥이 있습니다. 바로 **평판(reputation)**입니다.

내가 어떤 거래에서 상대를 배신하면, 그 소문은 다른 사람들에게 퍼집니다. 그러면 미래의 거래 상대들이 나를 경계하게 됩니다. 즉, 한 번의 배신이 그 거래만이 아니라 앞으로의 수많은 관계까지 망칠 수 있습니다. 이것을 '간접 호혜성(indirect reciprocity)'이라고 부릅니다. 내가 잘 대해 준 사람이 직접 보답하지 않더라도, 나의 좋은 평판이 전혀 다른 사람에게서 협력을 이끌어 내는 것입니다.

온라인 시대에 이 원리는 더욱 또렷해졌습니다. 중고 거래 플랫폼의 별점, 숙소 예약 사이트의 후기, 판매자 신뢰도 점수 같은 평판 시스템은, 서로 한 번 보고 말 낯선 사람들 사이에서도 협력이 가능하도록 만드는 정교한 장치입니다. 익명의 시장이라면 죄수의 딜레마에 빠지기 쉬운 거래를, 평판이라는 '미래의 그림자'가 협력으로 끌어올리는 셈입니다.

여기서 한 가지 교훈이 나옵니다. 정직과 신뢰는 단지 도덕적 미덕에 그치지 않고, 길게 보면 가장 영리한 전략이기도 하다는 것입니다. 좋은 평판은 시간이 만들어 주는, 돈으로 사기 어려운 자산입니다.

레몬 시장 — 정보가 비대칭일 때

지금까지의 게임에서는 모두가 같은 정보를 알고 있다고 가정했습니다. 그러나 현실에서는 한쪽이 다른 쪽보다 더 많이 아는 경우가 흔합니다. 경제학자 조지 애컬로프(George Akerlof)는 이 문제를 중고차 시장으로 설명해, 훗날 노벨 경제학상을 받았습니다.

중고차를 파는 사람은 그 차가 멀쩡한 차인지, 겉만 멀쩡하고 속은 골치 아픈 '레몬'인지 잘 압니다. 그러나 사는 사람은 알기 어렵습니다. 이 정보의 비대칭이 시장을 묘하게 망가뜨립니다.

레몬 시장의 악순환
─────────────────────────────
1) 사는 사람은 차의 진짜 상태를 모른다
2) 그래서 '평균적인' 가격만 내려 한다
3) 좋은 차 주인은 제값을 못 받아 시장을 떠난다
4) 시장에는 점점 나쁜 차(레몬)만 남는다
5) 사는 사람은 더 의심하고, 가격은 더 떨어진다
─────────────────────────────

좋은 물건이 오히려 시장에서 밀려나는 이 역설을 '역선택(adverse selection)'이라고 합니다. 정직한 판매자가 손해를 보는, 누구도 원하지 않은 결과입니다.

그렇다면 해법은 무엇일까요? 핵심은 '신뢰할 수 있는 신호'를 만드는 것입니다. 품질 보증서, 공인 점검 기록, 환불 보장, 브랜드 평판 같은 장치들이 모두 이 역할을 합니다. 좋은 차의 주인만이 기꺼이 감수할 수 있는 약속을 내걺으로써, "내 차는 진짜 좋다"는 말에 믿음을 실어 주는 것입니다. 보험, 채용, 대출 같은 수많은 시장이 사실은 이 '신호 게임'의 무대입니다.

벼랑 끝의 사고실험 — 협력과 파국 사이

치킨게임을 이야기할 때, 우리는 자기 선택지를 스스로 없애는 '공약'이 역설적으로 힘이 된다고 했습니다. 그러나 이 전략에는 어두운 그림자가 따릅니다.

한 사고실험을 해 봅시다. 두 나라가 서로를 향해 점점 위협의 수위를 높이는 상황을 상상해 보세요. 각국은 '물러서지 않겠다'는 의지를 보이려 점점 더 돌이키기 어려운 약속을 합니다. 한쪽이 후퇴하면 지는 게임이니, 양쪽 모두 핸들을 뽑아 던지려 합니다. 그런데 두 나라가 동시에 핸들을 던져 버린다면? 아무도 피할 수 없는 충돌이 일어납니다.

여기에 치킨게임의 무서움이 있습니다. '강하게 보이려는' 합리적 동기가 양쪽에서 작동하면, 누구도 원치 않는 파국에 이를 수 있습니다. 역사 속 여러 위기 상황에서, 지도자들이 이 벼랑 끝에서 가까스로 발을 멈춘 사례들이 있습니다. 결정적 순간에 한쪽이 체면을 잃을 각오로 먼저 양보하거나, 양쪽이 서로 빠져나갈 명분을 만들어 주었기에 가능한 일이었습니다.

이 사고실험이 주는 교훈은 균형 잡힌 것입니다. 한편으로 단호함과 신뢰할 수 있는 결의는 협상에서 분명 힘이 됩니다. 다른 한편으로, 모두가 물러서지 않으려고만 하면 함께 벼랑 아래로 떨어질 수 있습니다. 게임이론은 어느 쪽이 옳다고 말해 주지 않습니다. 다만 우리가 어떤 게임에 들어서 있는지, 그 끝에 무엇이 기다리는지를 차갑고 또렷하게 비춰 줄 뿐입니다.

협력을 설계하는 법 — 작은 실천 가이드

지금까지의 이야기를 우리 삶에 어떻게 써먹을 수 있을까요? 게임이론은 추상적이지만, 거기서 나온 통찰들은 의외로 실용적입니다. 협력이 잘 일어나도록 '게임의 판'을 손보는 몇 가지 원칙을 정리해 봅니다.

관계를 길게 만들라. 일회성 거래를 반복 거래로 바꾸면 협력의 유인이 커집니다. 다시 만날 사이라는 것을 서로가 알 때, 사람들은 신중해집니다.
약속을 눈에 보이게 하라. 말로만 하는 다짐보다, 지키지 않으면 손해를 보는 '공약'이 신뢰를 만듭니다. 계약서, 보증금, 공개 선언이 그런 장치입니다.
평판이 흐르게 하라. 좋은 행동과 나쁜 행동의 소문이 잘 퍼지는 구조를 만들면, 정직이 이득이 됩니다.
친절하되 만만하지 마라. 팃포탯처럼, 먼저 협력하되 배신에는 분명히 응답하고, 상대가 돌아오면 기꺼이 용서하세요.
규칙을 함께 만들라. 오스트롬이 보여 주었듯, 규칙을 따르는 사람들이 직접 규칙을 설계할 때 협력이 오래갑니다.

일상의 게임, 어떻게 다룰까
─────────────────────────────────────────────
상황            핵심 질문              지렛대
─────────────────────────────────────────────
협상            한 번인가 반복인가     관계의 지속성
경쟁            모두 손해 보는 구조인가 규칙·제도의 재설계
신뢰            상대가 내 평판을 보는가 평판·신호 만들기
갈등            벼랑 끝인가             빠져나갈 명분 주기
─────────────────────────────────────────────

이 원칙들의 바탕에는 하나의 생각이 흐릅니다. 사람들을 더 착하게 '만들려' 애쓰기보다, 착하게 행동하는 것이 이득이 되도록 '판'을 바꾸는 편이 훨씬 효과적이라는 것입니다. 좋은 제도는, 평범한 사람들의 평범한 이기심마저 협력 쪽으로 흐르게 합니다.

값비싼 신호 — 자연과 사회의 공통 문법

레몬 시장에서 보았듯, 정보가 비대칭일 때는 '신뢰할 수 있는 신호'가 중요합니다. 그런데 흥미롭게도 자연도 똑같은 문제를 풀어 왔습니다.

수컷 공작의 화려하고 거대한 꼬리를 떠올려 보세요. 그 꼬리는 사실 생존에 불리합니다. 무겁고, 눈에 잘 띄어 포식자에게 위험하니까요. 그런데도 왜 진화했을까요? 한 가지 유력한 설명은, 바로 그 '불리함'이 정직한 신호이기 때문이라는 것입니다. 허약한 수컷은 그런 거추장스러운 꼬리를 감당할 수 없습니다. 오직 진짜 건강하고 우수한 수컷만이 그런 사치를 부리고도 살아남을 수 있습니다. 그래서 화려한 꼬리는 "나는 정말 우수하다"는, 흉내 내기 어려운 진실한 신호가 됩니다. 생물학자들은 이를 '값비싼 신호 이론'이라고 부릅니다.

이 논리는 인간 사회에도 메아리칩니다. 어렵게 딴 자격증, 오랜 수련, 위험을 무릅쓴 헌신 같은 것들은, 말로만 하는 약속보다 훨씬 믿음직한 신호가 됩니다. 정말로 그럴 능력과 의지가 있는 사람만이 그 값을 치를 수 있기 때문입니다. 자연이든 시장이든, 신뢰는 종종 '치르기 어려운 대가'를 통해 증명됩니다.

잠깐 퀴즈 — 당신의 게임 감각은?

다음 상황들이 어떤 게임에 가까운지 생각해 보세요. 정답은 바로 아래에 있습니다.

문제 1. 같은 동네의 두 카페가 서로 눈치를 보며 음료 가격을 계속 낮추다가, 결국 둘 다 거의 남는 게 없게 되었다. 이것은 무슨 게임일까?

문제 2. 친구와 만나기로 했는데 장소를 정하지 않았다. 둘 다 상대가 어디로 올지 몰라 헤맨다. 어디든 한 곳에서 만나기만 하면 둘 다 행복하다. 이것은 무슨 게임일까?

문제 3. 가위바위보에서 절대 지지 않으려면 어떤 전략을 써야 할까?

정답 1. 죄수의 딜레마입니다. 둘 다 적정 가격을 유지하면 좋지만, 각자에게는 가격 인하가 유리해 결국 모두 손해를 봅니다.

정답 2. 조정게임입니다. 갈등은 없고, 그저 같은 선택으로 발을 맞추는 것이 관건입니다.

정답 3. 가위, 바위, 보를 무작위로 균등하게 내는 혼합전략입니다. 어떤 패턴도 들키는 순간 약점이 되기 때문입니다.

문제 4. 중고차 시장에서 좋은 차들이 오히려 시장을 떠나고 나쁜 차만 남는 현상을 무엇이라 부를까?

문제 5. 같은 자원을 공유하는 마을 공동체가 정부 규제나 사유화 없이도 자원을 잘 관리해 온 사례를 연구한 학자는 누구일까?

정답 4. 역선택입니다. 정보의 비대칭 때문에 좋은 물건이 제값을 못 받아 시장에서 밀려나는 현상입니다.

정답 5. 엘리너 오스트롬입니다. 그녀는 이 연구로 여성 최초의 노벨 경제학상을 받았습니다.

게임이론의 한계 — 겸손하게 쓰기

게임이론은 강력한 렌즈이지만, 만능 도구는 아닙니다. 그 한계를 아는 것도 이 학문을 제대로 쓰는 길입니다.

첫째, 게임이론의 많은 결과는 '사람이 완벽하게 합리적이다'라는 가정 위에 서 있습니다. 그러나 실제 인간은 감정에 휘둘리고, 계산을 틀리고, 때로는 손해를 보면서까지 불공정에 분노합니다. 이런 인간의 실제 행동을 다루기 위해 행동경제학과 실험경제학이 발전했고, 게임이론도 더 현실적인 방향으로 보완되어 왔습니다.

둘째, 현실의 보수를 정확히 숫자로 매기기는 어렵습니다. 사람들은 돈뿐 아니라 자존심, 공정함, 사랑, 명예 같은 것에 가치를 둡니다. 같은 상황도 사람마다 전혀 다른 '게임'으로 느낄 수 있습니다.

셋째, 게임이론은 '무엇이 일어날 가능성이 큰가'를 분석하는 도구이지, '무엇이 옳은가'를 말해 주는 도덕 이론이 아닙니다. 협력이 유리한 구조를 설계하는 것과, 어떤 가치를 추구할지 결정하는 것은 다른 문제입니다.

그러므로 게임이론은 정답을 내려 주는 기계가 아니라, 상황의 구조를 또렷이 비추는 손전등에 가깝습니다. 그 빛으로 무엇을 볼지, 그리고 어떻게 행동할지는 여전히 우리의 몫입니다.

마치며 — 우리는 이미 플레이어다

게임이론이 우리에게 주는 가장 큰 선물은, 어쩌면 '겸손'과 '시야'일지도 모릅니다.

겸손은 이렇습니다. 죄수의 딜레마는, 모두가 완벽하게 합리적이어도 모두가 손해 보는 결과에 빠질 수 있음을 보여 줍니다. 누군가가 어리석거나 악해서가 아니라, 구조 자체가 그렇게 짜여 있기 때문입니다. 우리 사회의 많은 문제가 '나쁜 사람들' 때문이 아니라 '나쁜 게임 구조' 때문일 수 있다는 깨달음은, 비난 대신 설계에 눈을 돌리게 합니다.

시야는 이렇습니다. 액설로드의 토너먼트는, 차갑고 이기적인 세계에서도 협력이 진화할 수 있음을 보여 주었습니다. 그 비결은 거창한 도덕이 아니라, 관계를 지속하고, 받은 대로 갚되, 기꺼이 용서하는 단순한 태도였습니다. "미래의 그림자"가 길게 드리울수록, 우리는 더 잘 협력합니다.

다음에 누군가와 흥정을 하거나, 줄을 설지 말지 고민하거나, 약속 장소를 정할 때, 잠깐 멈춰 이렇게 자문해 보세요. "지금 나는 무슨 게임을 하고 있지? 상대의 보수는 무엇이고, 우리의 관계는 한 번뿐인가, 계속될 것인가?" 그 질문 하나로, 보이지 않던 게임의 규칙이 조금은 또렷이 보이기 시작할 것입니다.

그리고 마지막으로 한 가지를 덧붙이고 싶습니다. 게임이론은 세상을 차가운 계산의 무대로만 그리는 것처럼 보이지만, 그 결론은 의외로 따뜻합니다. 협력은 약한 자의 어리석음이 아니라, 길게 보는 자의 지혜라는 것. 신뢰는 순진함이 아니라, 반복되는 게임에서 살아남는 가장 강한 전략일 수 있다는 것. 우리가 매일 건네는 작은 친절과 정직이, 사실은 보이지 않는 거대한 게임 속에서 우리 자신과 공동체를 위한 가장 영리한 한 수일지도 모른다는 것. 그 사실을 떠올리면, 매일의 선택이 조금 덜 외롭고 조금 더 의미 있게 느껴질 것입니다.

생각할 거리

당신의 직장이나 가정에서, 협력이 깨지는 '딜레마' 구조가 숨어 있는 곳은 어디인가? 그 구조를 어떻게 바꾸면 협력이 쉬워질까?
일회성 거래와 반복 거래에서 당신의 행동은 어떻게 달라지는가? 그 차이는 정당한가?
때로는 자기 선택지를 스스로 줄이는 '공약'이 협상에서 힘이 된다. 이 전략이 위험해지는 순간은 언제일까?
평판 시스템(별점, 후기)이 없는 익명의 세상이라면, 사람들은 지금보다 덜 협력하게 될까? 우리는 어떻게 신뢰를 만들 수 있을까?

참고 자료

Stanford Encyclopedia of Philosophy, "Game Theory" — https://plato.stanford.edu/entries/game-theory/
Stanford Encyclopedia of Philosophy, "Prisoner's Dilemma" — https://plato.stanford.edu/entries/prisoner-dilemma/
Encyclopaedia Britannica, "Game theory" — https://www.britannica.com/science/game-theory
Encyclopaedia Britannica, "John Nash" — https://www.britannica.com/biography/John-Nash
Robert Axelrod, "The Evolution of Cooperation" (소개) — https://www.britannica.com/topic/The-Evolution-of-Cooperation
Encyclopaedia Britannica, "John von Neumann" — https://www.britannica.com/biography/John-von-Neumann
Encyclopaedia Britannica, "Elinor Ostrom" — https://www.britannica.com/biography/Elinor-Ostrom
Encyclopaedia Britannica, "John Maynard Smith" — https://www.britannica.com/biography/John-Maynard-Smith
Encyclopaedia Britannica, "George A. Akerlof" — https://www.britannica.com/biography/George-A-Akerlof