게임 이론이란 무엇입니까?
게임 이론이라고도 하는 게임 이론은 투쟁이나 경쟁 현상을 연구하는 이론과 방법이다. 그것은 현대 수학의 새로운 분야일 뿐만 아니라, 운영 연구의 중요한 과제이기도 하다.
죄수의 딜레마 게임
함께 범죄를 저지른 도둑 두 명이 경찰서로 끌려가 독방에 감금되었다. 만약 한쪽이 경찰과 합작하여 그가 다른 쪽과의 행동을 고백했지만, 다른 쪽은 고백하지 않고, 고백하는 쪽은 석방되고, 다른 쪽은 3 년 형을 선고받을 것이다. 만약 쌍방이 모두 고백한다면, 각각 1 년 징역을 선고한다. 양측이 모두 고백하지 않으면 경찰의 증거 부족으로 1 개월 징역형을 선고받을 것이다. 이 두 도둑은 어떻게 선택할 것인가?
게임 이론의 발전
게임 이론의 사상은 이미 존재하고 있지만,' 손자병법' 은 군사 저작일 뿐만 아니라 최초의 게임 이론 전문 저서이기도 하다. 게임 이론은 처음에는 주로 바둑류, 브리지, 도박의 승패를 연구했다. 게임 정세에 대한 사람들의 파악은 경험에 그치지 않고 이론으로 발전하지 않았다. 20 세기 초가 되어서야 비로소 정식으로 학과로 발전하였다. 1928 폰 노이만은 게임 이론의 기본 원리를 증명하고 게임 이론의 탄생을 선언했다. 1944 년 폰 노이만 모건스탄이 쓴 획기적인' 게임론과 경제행동' 은 두 사람의 게임 구조를 N 인 게임 구조로 확장하고 게임론 체계를 경제 분야에 적용함으로써 이 학과의 기초와 이론 체계를 다졌다. 게임 이론에 관해서는 게임 이론 천재 내쉬, 내쉬의 획기적인 논문' N 인 게임의 균형점' (1950),' 비협력 게임' (195 1) 을 간과해서는 안 된다. 내쉬 균형의 개념과 균형의 존재 정리를 제시한다. 게다가, 셀튼과 하사니의 연구는 게임 이론의 발전을 촉진시켰다. 오늘날 게임 이론은 비교적 완벽한 학과로 발전했다.
게임 이론의 기본 개념
1) 게임 요소
(1) 플레이어: 한 경기나 게임에서 의사결정권을 가진 모든 참가자가 플레이어가 됩니다. 두 명의 플레이어만 있는 게임 현상을' 더블게임' 이라고 하고, 두 명 이상의 플레이어의 게임을' 멀티게임' 이라고 합니다.
(2) 전략: 한 게임에서 각 플레이어는 실행 가능한 완전한 행동 계획을 가지고 있습니다. 즉, 계획은 특정 단계의 행동 계획이 아니라 전체 행동을 지도하는 계획입니다. 각 플레이어는 처음부터 끝까지 실행 가능한 계획입니다.
이 국이 계획한 행동 계획은 이 국의 사람들의 전략이라고 한다. 한 게임의 모든 사람이 항상 제한된 전략을 가지고 있다면' 유한게임' 이라고 하고, 그렇지 않으면' 무한게임' 이라고 부른다.
(3) 득실: 한 판이 끝날 때의 결과를 득실이라고 한다. 한 판이 끝날 때 각 이닝 중 사람의 득실은 이닝 중 자신이 선택한 전략뿐만 아니라 이닝 중 사람들이 전체 정세에서 채택한 일련의 정책과도 관련이 있다. (윌리엄 셰익스피어, 윈스턴, 이닝, 이닝, 이닝, 이닝, 이닝, 이닝) 따라서 게임이 끝날 때 각 참가자의' 득실' 은 모든 참가자가 설정한 정책 세트의 함수이며, 이를 지불 함수라고 합니다.
(4) 게임 참가자에게 게임 결과가 있다.
(5) 게임은 평형과 관련이 있다. 균형은 균형이다. 경제학에서 균형은 관련된 양이 안정적인 값에 있다는 것이다. 공급과 수요 관계에서 상품 시장이 특정 가격에 있다면, 이 가격에 이 상품을 사고 싶은 사람은 모두 살 수 있고, 팔고 싶은 사람은 모두 팔 수 있다. 이때 우리는 이런 상품의 공급과 수요가 균형을 이루었다고 말했다. 이른바 내쉬 균형은 안정적인 게임 결과이다.
내쉬 균형: 하나의 전략 조합에서 모든 참가자들은 다른 사람이 전략을 바꾸지 않는 상황에서 그의 전략이 가장 좋은 상황에 직면해 있다. 다른 말로 하자면, 만약 그가 지금 전략을 바꾼다면, 그의 지불은 줄어들 것이다. 내쉬 균형점에서, 모든 이성적인 참가자들은 전략을 개별적으로 바꾸려는 충동을 갖지 않을 것이다. 내쉬 균형점의 존재를 증명하는 전제는' 게임 균형 쌍' 의 개념이다. 균형부부' 란 두 사람의 제로섬 게임에서 당국자 A 가 최적 전략 a*, 국자 B 도 최적 전략 b* 를 채택한다는 뜻이다. 플레이어 A 가 여전히 b* 를 사용하지만 플레이어 A 가 또 다른 전략 A 를 채택한다면 플레이어 A 의 지불은 원래 전략 a* 의 지불을 초과하지 않을 것이다. 이 결과는 플레이어 B 에게도 성립되었다.
이렇게 하면 "균형 쌍" 이 한 쌍의 정책 a* (정책 집합 A 에 속함) 와 b* (정책 집합 B 에 속함) 를 균형 쌍이라고 명시적으로 정의합니다. 모든 정책 A (정책 세트 A) 와 정책 B (정책 세트 B) 에 대해 항상 한 쌍 (A, b*)≤ 쌍 (a*, b*)≤ 이 있습니다.
논제로섬 게임도 다음과 같이 정의됩니다. 전략 a* (전략 세트 A) 와 b* (전략 세트 B) 를 논제로섬 게임의 균형 쌍이라고 합니다. 모든 정책 A (정책 집합 A) 와 정책 B (정책 집합 B) 에 대해 항상 쌍 (A, b*) ≤ 쌍 (a*, b*) 플레이어 A 가 있습니다. 짝쌍 (a*, b)≤ 게임에서 플레이어 B 의 짝쌍 (a*, b*).
위의 정의를 통해 내쉬 정리는 즉시 얻어졌습니다.
어떤 유한한 순책도 있는 두 사람의 대책은 적어도 하나의 균형 쌍이 있다. 이 균형 쌍을 내쉬 균형점이라고 합니다.
내시정리의 엄격한 증명은 고정점 이론이 필요하다는 것을 증명하고, 고정점 이론은 경제 균형을 연구하는 주요 도구이다. 일반적으로 균형점의 존재를 찾는 것은 게임의 고정점을 찾는 것과 같다.
내쉬 균형점의 개념은 게임 이론 연구가 하나의 게임 구조에서 더 의미 있는 결과를 찾을 수 있도록 매우 중요한 분석 방법을 제공한다.
그러나 내쉬 균형점의 정의는 일방적으로 전략을 바꾸지 않으려는 참가자로 제한되며, 다른 참가자가 전략을 바꿀 가능성을 간과하고 있다. 그래서 많은 경우 내쉬 균형점의 결론은 설득력이 없다. 연구자들은 이를' 천진하고 귀여운 내쉬 균형점' 이라고 형상적으로 부른다.
R Selten 은 일정한 규칙에 따라 여러 평형에서 불합리한 균형점을 제거함으로써 두 가지 정련된 균형 개념, 즉 서브 게임이 완전히 균형잡히고 손이 떨리는 완벽한 균형을 이루고 있다.
2) 게임의 종류
(1) 협력 게임-사람들이 협력에 도달했을 때 협력의 이익, 즉 수익 분배 문제를 어떻게 분배할 수 있는지를 연구한다.
(2) 비협력 게임-이익이 서로 영향을 미치는 상황에서 사람들이 어떻게 결정을 내리고 자신의 이익을 극대화하는지, 즉 전략 선택을 할 수 있는지 연구한다.
(3) 완전한 정보와 불완전한 정보의 게임: 플레이어는 모든 참가자의 전략 공간과 전략 조합에 따른 지불에 대해 충분히 이해하고 있으며, 이를 완전한 정보라고 합니다. 반대로, 그것은 불완전한 정보라고 불린다.
(4) 정적 및 동적 게임
정적 게임: 참가자가 동시에 행동을 취하는 것을 말합니다. 또는 선착순이 있지만 다음 행동자는 이전 행동자의 전략을 알지 못합니다.
동적 게임: 쌍방의 행동 순서를 가리키며, 다음 행동자는 이전 행동자의 전략을 알 수 있다.
재산 분포 및 Shapley 값
A, B, C, C 투표는 각각 50%, 40%, 654.38+00% 의 권한을 가진 654.38+0 만원을 어떻게 분배할지 결정한다. 규칙에 따르면, 한 방안은 50% 이상의 투표가 찬성할 때만 통과될 수 있다. 그럼 어떻게 분배해야 합리적일까요? 표수 분포에 따라 50 만, B40 만, C65438+ 10 만 C 가 A 에게 70 만, B0, C30 만 B 를 A 에게 80 만, B20 만, c0…… ... ...
권력지수: 각 의사결정권자의 의사결정권에서의 권력은 그의 승리연맹의' 관건입자' 수에 반영되며,' 관건입자' 의 수를 권력지수라고 한다.
Shapley 값: 가능한 모든 연맹 질서에서 참가자의 연맹에 대한 한계 공헌의 합계를 가능한 여러 연합 조합으로 나눕니다.
Abc ACB BAC BCA cab CBA 를 주문합니다
주요 진입자
A, b, c 의 Shapley 값은 각각 4/6, 1/6, 1/6 으로 계산됩니다.
그래서 a, b, c 는 각각 1/3 의 2/3, 1/3, 1/3 을 받아야 합니다.
게임 이론의 중요성
게임 이론의 연구 방법은 수학 도구를 이용하여 사회경제 현상을 연구하는 다른 많은 학과와 마찬가지로 복잡한 현상에서 기본 요소를 추상화하고, 이러한 요소들이 형성하는 수학 모델을 분석한 다음, 그 상황과 그 결과에 영향을 미치는 다른 요소들을 점진적으로 도입하여 그 결과를 분석하는 것이다.
서로 다른 추상화 계층을 기반으로 다양한 문제를 연구하는 데 사용할 수 있는 세 가지 게임 표현식이 형성되었습니다. 그래서 "사회과학의 수학" 이라고 불립니다. 이론상 게임 이론은 이성적 행동자 간의 상호 작용을 연구하는 형식화 이론이지만, 실제로는 경제학 정치학 사회학 등으로 깊숙이 들어가 각종 사회과학에 응용되고 있다.
1. 게임 이론은 개인이나 조직을 의미하며, 특정 환경 조건에 직면하고, 특정 규칙 하에서 파악된 정보에 의존하여 자신의 행동이나 전략을 선택 및 구현하고, 그에 상응하는 결과나 이익을 얻는 과정이다. 게임 이론은 경제학에서 매우 중요한 이론 개념이다.
게임 이론이란 무엇입니까? 옛말에는 구름이 있고, 일은 바둑과 같다. 생활 속의 모든 사람은 체스 선수와 같고, 모든 동작은 보이지 않는 바둑판에 동전을 넣는 것과 같다. 총명하고 신중한 바둑, 서로 헤아려 보고, 서로 견제하고, 모두들 힘써 이기고, 많은 흥미진진하고 변화무쌍한 바둑을 두었다. 게임 이론은 바둑선수' 바둑' 의 이성과 논리 부분을 연구하고 그것을 과학으로 체계화하는 것이다. 즉, 개인이 복잡한 상호 작용에서 가장 합리적인 전략을 얻는 방법을 연구하는 것이다. 사실, 게임 이론은 고대 게임이나 체스 같은 게임에서 유래했다. 수학자들은 자기완전한 논리적 틀과 체계를 세우고 구체적인 문제를 추상화하여 그 법칙과 변화를 연구한다. 이것은 쉬운 임무가 아니다. 가장 간단한 2 인 게임을 예로 들어 보겠습니다. 생각해 보면 큰 현기가 있다는 것을 알 수 있다. 양측이 자신과 상대의 모든 바둑을 정확히 기억하고 가장 이성적인 선수라고 가정한다면, A 는 경기를 이기기 위해 B 의 생각을 신중히 생각해야 한다. B 는 놀 때도 A 의 생각을 고려해야 한다. 그러면 A 는 B 가 그의 생각을 고려하고 있다고 생각해야 한다. B 는 당연히 A 가 이미 고려했다는 것을 알고 있다.
이런 안개에 직면하여 게임 이론은 어떻게 문제를 분석하고 해결하기 시작하고, 어떻게 최적의 해법을 찾아 추상적인 수학 문제를 현실의 귀납으로 삼아 이론적으로 지도 실천을 제공할 수 있습니까? 현대 게임 이론은 헝가리 수학자 폰 노이만이 1920 년대에 창립한 것으로, 경제학자 오스카 모건스탄과 1944 년 출간된 거작' 게임 이론과 경제 행동' 은 현대 시스템 게임 이론의 초보적인 형성을 상징한다. 비협력 순수 경쟁 게임의 경우, 노이만은 두 사람이 바둑을 두거나 탁구를 치는 것처럼, 한 사람이 한 판을 이기고, 다른 한 사람이 다른 한 판을 지고, 순이익은 0 이다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 스포츠명언) 여기서 추상적인 게임 문제는 주어진 참가자 집합 (쌍방), 전략 집합 (모든 바둑) 및 이익 집합 (승자와 패자) 의 경우, 이론적인' 해결책' 또는' 균형' 을 찾는 방법, 즉 쌍방 참가자들에게 가장 합리적이고 최적의 구체적 "합리적인" 이란 무엇입니까? 전통적인 결정론에서' 최소-최대' 준칙을 적용한다. 즉, 게임의 각 측은 상대방의 모든 장단점의 근본 목적이 자신을 최대한 손해 보는 것이라고 가정하고 이에 따라 자신의 대책을 최적화한다. 노이만은 수학적으로 어느 정도의 선형 연산을 통해 모든 2 인 제로섬 게임이' 최소-최대 해법' 을 찾을 수 있다는 것을 증명했다. 일정한 선형 연산을 통해 두 경쟁자는 확률 분포 형식으로 최적의 전략 세트의 각 단계를 무작위로 사용하여 결국 상대방을 위해 가장 크고 동등한 이윤을 거둘 수 있게 되었다. (윌리엄 셰익스피어, 윈스턴, 경쟁자, 경쟁자, 경쟁자, 경쟁자, 경쟁자, 경쟁자, 경쟁자) 물론, 이 최적의 전략은 게임에서 상대의 조작에 의존하지 않는다는 뜻이다. 통속적으로, 이 유명한 극소정리에 반영된 기본적인' 이성' 사상은' 최선의 희망을 품고 최악의 준비를 하는 것' 이다.
2. 경제학에서' 돼지의 수익' 은 게임 이론의 유명한 예이다.
이 예는 돼지우리 안에 돼지 두 마리, 큰 돼지 한 마리, 돼지 한 마리가 있다는 것이다. 돼지우리 한쪽에 디딤판이 하나 있다. 페달을 밟을 때마다 소량의 음식이 돼지우리 반대편에서 페달을 멀리하는 먹이구에 떨어진다. 만약 돼지 한 마리가 페달을 밟으면, 다른 돼지는 먼저 다른 쪽에 떨어진 음식을 먹을 기회가 있다. 돼지가 페달을 밟자, 큰 돼지는 마침 돼지가 식통으로 달려가기 전에 모든 음식을 다 먹었다. 큰 돼지가 페달을 밟으면 돼지가 떨어진 음식을 다 먹기 전에 식통으로 달려가 나머지 반을 쟁탈할 기회가 있다.
그렇다면 돼지 두 마리는 어떤 전략을 채택할까요? 대답은 돼지가' 히치하이킹' 전략, 즉 슬럼프에서 편안하게 기다리는 전략을 선택한다는 것이다. 큰 돼지는 지칠 줄 모르고 디딤판과 식통 사이를 뛰어다녔는데, 단지 남은 음식을 조금 위해서였다.
그 이유는 무엇입니까? 돼지는 페달을 밟아도 아무것도 얻지 못하지만, 페달을 밟지 않으면 음식을 먹을 수 있기 때문이다. 돼지의 경우, 큰 돼지가 페달을 밟든 밟지 않든, 밟지 않는 것은 항상 좋은 선택이다. 반면에 돼지는 돼지가 액셀러레이터를 밟지 않는다는 것을 알고 있다. 스스로 액셀러레이터를 밟는 것이 안 밟는 것보다 낫다. 그래서 그는 스스로 와야 한다.
돼지가 누워 있고, 큰 돼지가 달리고 있다' 는 현상은 이야기의 게임 규칙 때문이다. 규칙의 핵심 지표는 한 번에 떨어지는 물건의 수와 디딤판에서 먹이를 주는 입구까지의 거리입니다.
핵심 지표를 바꾸면 돼지우리도 같은' 돼지가 누워 있고, 큰 돼지가 달리고 있다' 는 장면이 나올까? 한번 해 보세요.
변경 시나리오 1: 복원 시나리오입니다. 먹이를 주는 것은 원래 체중의 절반밖에 되지 않는다. 결국 돼지도 큰 돼지도 발버둥치지 않았다. 돼지는 밟을 것이고, 큰 돼지는 음식을 다 먹을 것이다. 큰 돼지가 밟으면 돼지도 음식을 다 먹을 것이다. 누가 발버둥치는 것은 상대방에게 음식을 주는 것을 의미하므로 누구도 발버둥칠 동력이 없을 것이다.
만약 돼지가 많이 발버둥치게 하는 것이 목적이라면, 이 게임의 규칙은 분명히 실패한 것이다.
변경 시나리오 2: 증분 시나리오 이전보다 두 배 더 먹여라. 결국 돼지와 큰 돼지는 모두 페달을 밟는다. 먹고 싶은 사람은 버둥거린다. 어차피 상대방은 한 번에 모든 음식을 다 먹지 않을 것이다. 돼지와 큰 돼지는 물질이 비교적 풍부한' 물욕이 횡포하는' 사회에 사는 것과 맞먹는다. 경쟁의식은 그리 강하지 않다.
게임 규칙의 디자이너에게 이 규칙의 비용은 상당히 높습니다 (한 번에 2 인분의 음식을 제공). 그리고 경쟁이 강하지 않기 때문에, 돼지를 많이 버텨도 효과가 없다.
변경 시나리오 3: 감소+이동 시나리오 원래 무게의 절반만 먹이지만, 동시에 먹이를 페달 근처로 옮겨야 한다. 결국 돼지와 큰 돼지는 모두 필사적으로 버둥거렸다. 기다리는 사람은 먹지 않을 것이고, 노력하는 사람은 더 많은 것을 얻을 것이다. 매 수확마다 꽃일 뿐이다.
이것은 게임 디자이너에게 가장 좋은 해결책이다. 비용은 높지 않지만 수확이 가장 크다.
지돼지 게임' 의 원작 이야기는 경쟁에서 약자 (돼지) 가 최고의 전략을 기다리도록 영감을 주었다. 그러나 사회에 있어서 돼지가 히치하이킹을 할 때의 사회자원 분배는 최적의 것이 아니다. 돼지가 경기에 참가하지 못했기 때문이다. 자원을 가장 효율적으로 배분하기 위해 규칙 디자이너는 아무도 히치하이킹을 하는 것을 원하지 않는다. 정부도 마찬가지다. 회사 사장도 마찬가지다. 히치하이킹 현상을 완전히 근절할 수 있을지는 게임 규칙의 핵심 지표가 제대로 설정되었는지 여부에 달려 있다.
예를 들어, 회사의 인센티브 제도 설계, 보상이 너무 강하고 주식 보유와 옵션이다. 회사의 모든 직원들이 백만장자가 되었다. 비용이 높다고 말할 필요도 없고, 직원들의 적극성도 반드시 높은 것은 아니다. 이것은 "똑똑한 돼지 게임" 과 같습니다.
증분 시나리오에서 설명하는 상황입니다. 하지만 장려력이 크지 않으면 관객이 나뉘어 (일하지 않는' 돼지' 라도) 열심히 일했던 큰 돼지들도 동력이 없다.' 스마트 돼지 게임' 1 기 감축 계획에 묘사된 바와 같다. 최고의 인센티브는 세 번째 방안인 감원과 교대를 바꾸는 것과 같다. 보상은 모든 사람이 공유하는 것이 아니라 개인 (예: 업무 비율 공제) 을 대상으로 비용 (회사) 을 절약하고' 히치하이킹' 현상을 근절함으로써 효과적인 인센티브를 얻을 수 있다.
많은 사람들이' 똑똑한 돼지 게임' 이야기를 본 적이 없지만, 의식적으로 돼지를 사용하는 전략이다. 소매 업체는 주식 시장에서 딜러가 차를 타기를 기다리고 있습니다. 산업시장에 수익성 있는 신제품이 나오기를 기다린 후, 유금을 대규모로 복제하여 폭리를 취하다. 회사에서 이익을 창출하지 않지만 성과를 공유하는 사람 등. 따라서 경제관리의 각종 게임 규칙을 제정한 사람들에게는' 똑똑한 돼지 게임' 의 지수 변화의 원인을 이해해야 한다.
배경 지식: 내쉬 게임 이론의 원리와 응용.
북경 석간신문
내쉬는 1950 과 195 1 년 비협력 게임 이론에 관한 두 가지 중요한 논문에서 경쟁과 시장에 대한 사람들의 견해를 완전히 바꾸었다. 그는 비협력 게임과 그 균형 해법을 증명하고 균형 해법의 존재, 즉 유명한 내쉬 균형을 증명했다. 게임 균형과 경제 균형 사이의 내적 관계를 밝혀냈다. 내쉬의 연구는 현대 비협력 게임 이론의 초석을 세웠고, 이후 게임 이론 연구는 기본적으로 이 주선을 따랐다. 하지만 내쉬의 천재는 폰 노이만의 단호한 부정을 당한 것을 발견했고, 그 전까지는 아인슈타인의 냉대를 받았다. 하지만 내면에서 권위에 도전하고 경멸하는 천성은 내쉬가 자신의 관점을 고수하고 결국 대가가 될 수 있게 한다. (윌리엄 셰익스피어, 햄릿, 믿음명언) 30 여 년의 심각한 정신질환이 아니었다면, 아마 그는 벌써 그랬을 것이다
노벨상 시상대에 서서, 나는 영원히 다른 사람과 이 영예를 나누지 않을 것이다.
내쉬는 1950 에서 195 1 프린스턴에서 박사 학위를 공부할 때 주로 기여한 매우 재능 있는 수학자이다. 그러나 그의 천재는 비협력 게임의 균형, 즉' 내쉬 균형' 이 결코 순조롭지 않다는 것을 발견했다.
1948 내쉬는 프린스턴 대학에 수학 박사 학위를 받으러 갔다. 그 해 그는 아직 스무 살도 안 되었다. 당시 프린스턴, 인걸지령, 고수는 구름과 같았다. 아인슈타인, 폰 노이만, 레프셰츠 (수학과 학과장), 알버트 타크, 아렌조 체흐, 해롤드 쿤, 노먼 스틴 로즈, 요정 폭스 등. 모두 여기 있습니다. 게임 이론은 주로 폰 노이만 (1903-1957) 이 창립했다. 그는 헝가리에서 태어난 천재 수학자이다. 그는 경제 게임 이론을 창설했을 뿐만 아니라 컴퓨터도 발명했다. 일찍이 20 세기 초에 체멜로, 볼레어, 폰 노이만은 게임의 정확한 수학 표현을 연구하기 시작했다. 1939 까지 폰 노이만은 경제학자 오스카 모겐슈타인을 만나 그와 합작하여 게임 이론을 경제학의 광활한 영역으로 끌어들였다.
65438-0944 년 오스카 모건스탄과 공동 저술한 대표작' 게임론과 경제행위' 가 출간돼 현대 시스템 게임 이론의 초보적인 형성을 상징한다. 게임의 성격에 대한 연구는 19 세기 이전까지 거슬러 올라갈 수 있지만. 예를 들어, 1838 의 코노 단순 과두 정치 게임, 1883 의 버틀란과 1925 의 에치워스는 두 과점의 생산량과 가격 독점을 연구했다. 2000 여 년 전, 우리나라의 유명한 군사가 손무의 후손인 손빈은 게임 이론으로 논기가 경마를 이길 수 있도록 도와주었습니다. 등 모두 초기 게임 이론의 싹이 되어 산발적인 분산, 우연성, 무체계를 연구하는 것이 특징이다. 폰 노이만과 모건 스턴이' 게임론과 경제행동' 이라는 책에서 제시한 표준, 확장, 협동게임 모델해법의 개념과 분석 방법이 이 학과의 이론적 토대를 마련했다. 협동 게임은 1950 년대에 최고조에 달했다. 그러나, 노이만 게임 이론의 한계는 나날이 드러나고 있다. 너무 추상적이어서, 그 적용 범위는 매우 제한을 받는다. 오랫동안 게임 이론에 대한 연구는 거의 알려지지 않았으며, 게임 이론은 소수의 수학자들의 특허일 뿐이므로 그 영향력은 매우 제한적이다. 바로 이때 비협력 게임인' 내쉬 균형' 이 등장해 게임 이론의 새로운 시대의 시작을 상징한다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 게임명언) 내쉬는 단계별 학생이 아니다. 그는 자주 무단 결석을 한다. 그의 급우들의 기억에 따르면, 그들은 언제 내쉬와 함께 완전한 필수 과목을 수강했는지 전혀 기억하지 못하지만, 내쉬는 그가 적어도 Steen Rhodes 의 대수학 토폴로지에 올라갔다고 주장했다. Steen Rhodes 는 이 학과의 창시자이지만, 몇 과목을 수강한 후 Nash 는 이 수업이 그의 입맛에 맞지 않는다고 판단했다. 그래서 그는 또 떠났다. 그러나 내쉬는 결국 천부적인 재능을 가진 비범한 인물이다. 그는 토폴로지, 대수학 기하학, 논리학, 게임 이론 등 수학 왕국의 모든 가지에 매료되었다. 내쉬는 종종 그의 남다른 자신감과 자만심을 드러내며 공격적인 학문적 야망으로 가득 차 있다. 1950 여름 내내 내쉬는 긴장된 시험에 바빴다. 그의 게임 이론 연구가 중단되었다. 그는 이것이 큰 낭비라고 생각했다. 이런 일시적인' 포기' 를 모르고 무의식적으로 끊임없이 생각하다 보니 이미 점차 명확한 맥락이 형성되어 갑자기 영감이 터져 나왔다! 올해 10 월에 그는 갑자기 재능과 꿈의 급증을 느꼈다. 그중에서 가장 눈부신 하이라이트는 비협력 게임 균형의 개념이다. 이 개념은 앞으로' 내쉬 균형' 이라고 불릴 것이다. 내쉬의 주요 학술 공헌은 1950 과 195 1 의 두 논문 (박사 논문 포함) 에 반영된다. 다만 1950 이 되어서야 그는 자신의 연구 성과를' 비협력 게임' 이라는 장편 박사 논문으로 써서 1950+0 1 의' 미국 과학원 월보' 에 발표했다 말하자면, 모두 데이비드 게일 수사의 작품에 달려 있다. 폰 노이먼이 격하된 지 며칠 안 되어 그는 게일을 만나 폰 노이만의' 극소해' 를 비협력 게임 분야로 밀어 넣어 보편적인 방법과 균형점을 찾았다고 말했다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 전쟁명언) 게일은 자세히 듣고 있다. 그는 마침내 내쉬의 생각이 폰 노이만의 협동 게임 이론보다 실제 상황을 더 잘 반영할 수 있다는 것을 깨달았고, 그 엄밀하고 아름다운 수학증명은 그에게 깊은 인상을 남겼다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 과학명언) 게일은 다른 사람이 먼저 오르지 않도록 정리해서 바로 발표할 것을 건의했다. 내쉬, 초년생인 한 소년은 경쟁의 위험을 모르고 이렇게 할 생각을 한 적이 없다. 그래서 게일은 그의' 대리인' 역할을 하며 그를 대신해서 과학원에 보내는 문자 초안을 작성했다. 그 부서의 책임자인 Lev Shetz 는 직접 원고를 과학원에 제출했다. 내쉬가 쓴 문장 몇 편은 그리 많지 않지만, 그것만으로도 충분하다. 왜냐하면 모두 상위권에 있기 때문이다. 이 점도 깊이 생각해 볼 만하다. 국내 한 교수가' 핵심 저널' 에 몇 편의 문장 발표가 필요합니까? 이 기준에 따르면 내쉬는 자격이 부족할 수도 있다.
모리스, 65438-0996 년 노벨 경제학상 수상자, 옥스퍼드 대학에서 에치워스 경제학 교수로 재직했을 때 문장 발표가 없었다. 특수 인재는 특별한 선발 방식을 가져야 한다.
내쉬 대학은 순수 수학의 게임 이론을 연구하기 시작했고, 65438 ~ 0948 은 프린스턴 대학에 입학한 후 더욱 여유로워졌다. 20 대 초반에 그는 이미 세계적으로 유명한 수학자가 되었다. 특히 경제 게임 이론 분야에서 그는 폰 노이만에 이어 가장 위대한 게임 이론의 대가 중 하나인 획기적인 공헌을 했다. 그가 제시한 유명한 내쉬 균형 개념은 비협력 게임 이론에서 핵심적인 역할을 한다. 이후 연구가들이 게임론에 기여한 것은 모두 이 개념에 기반을 두고 있다. 내쉬 균형의 제안과 끊임없는 보완은 경제학, 관리학, 사회학, 정치학, 군사학 등 분야에서 게임 이론의 광범위한 응용을 위한 견고한 이론적 토대를 마련했다.
죄수의 딜레마:
"죄수의 딜레마" 에 대하여
게임 이론에서 우세한 전략 균형의 유명한 예는 타크가 제시한' 죄수의 딜레마' 게임 모델이다. 이 모델은 특수한 방식으로 우리에게 경찰과 도둑의 이야기를 알려준다. 갑을, 을 두 도둑이 공동으로 범행을 저지르고, 몰래 입실하여 경찰에게 붙잡혔다고 가정해 봅시다. 경찰은 이 두 사람을 서로 다른 두 방에 넣어 심문했다. 모든 용의자에 대해 경찰이 제시한 정책은 용의자가 자신의 범죄를 자백하고 장물을 넘겨주면 증거가 확실하고 둘 다 유죄 판결을 받는다는 것이다. 만약 다른 용의자도 기탄없이 자백한다면, 그들은 각각 8 년의 징역을 선고받았다. 또 다른 범죄 용의자가 고백하지 않고 부인하면 공무방해죄 (그가 유죄라는 증거가 있기 때문) 로 징역 2 년을 더 선고받고, 고백자는 8 년을 감형한 뒤 즉각 석방된다. 두 사람 모두 경찰이 증거 부족으로 절도죄를 선고할 수 없다는 사실을 부인하지만 불법 침입죄로 각각 1 년 징역을 선고할 수 있다. 표 2.2 는이 게임의 수익 매트릭스를 보여줍니다.
표 2.2 죄수의 딜레마 게임
B
부인하다
A 참회–8,–80,–10
거부–10,0–1,–1
이 게임의 예측 가능한 균형이 무엇인지 봅시다. A 에게 그는 B 가 무엇을 선택하는지는 모르지만 B 가 무엇을 선택하든' 고백' 을 선택하는 것이 항상 그에게 최선이라는 것을 알고 있다. 분명히, 대칭에 따르면, B 는 또한 "고백" 을 선택합니다. 결국 두 사람 모두 징역 8 년을 선고받았다. 하지만 모두' 거부' 를 선택하면 1 인당 1 년만 판정한다. 표 2.2 의 네 가지 행동 선택 조합 중 파레토가 가장 좋다. 이 행동 선택 조합에서 벗어나는 다른 행동 선택 조합은 적어도 한 사람의 처지를 악화시킬 수 있기 때문이다. "고백" 은 어떤 범죄 용의자의 우세 전략이고, (고백, 고백) 은 우세한 전략의 균형이라는 것을 쉽게 알 수 있다.
-응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응? -응?
달리 이론의 작은 이야기
내쉬의 공헌을 이해하려면 먼저 비협력 게임 문제가 무엇인지 알아야 한다. 현재 거의 모든 게임 이론 교재에서는' 죄수의 딜레마' 의 예를 언급하는데, 각 책의 예는 비슷하다.
게임 이론은 결국 수학이거나, 아니면 운영 연구의 한 분야이다. 고전과 학설에 대해 이야기하면 당연히 수학 언어가 없어서는 안 된다. 문외한들에게는 많은 수학 공식에 지나지 않는다. 다행히 게임 이론은 일상생활에 초점을 맞추고 있어 불꽃놀이를 먹지 않을 수 없다. 이 이론은 실제로 체스, 포커, 전쟁 등 경쟁, 대항, 의사결정적 성격의 문제에서 차용한 용어이다. 약간 허황된 것처럼 들릴지 모르지만, 실제로는 중요한 현실적 의의를 가지고 있다. 게임 이론의 대가는 경제사회 문제를 바둑처럼 보고, 왕왕 게임에서 깊은 이치를 가지고 있다. 그러므로 일상생활의 자질구레한 일부터 시작하여 주변의 이야기를 예로 들어 설명하는 것은 결코 지루하지 않다. 어느 날 한 부자가 집에서 살해되고 그의 재산이 도난당했다. 이번 사건 수사 과정에서 경찰은 두 명의 범죄 용의자 스카피와 나쿠르스를 체포해 그들의 숙소에서 피해 가족의 분실물을 찾았다. 그러나 그들은 자신이 사람을 죽였다는 것을 부인하고, 부자를 먼저 죽였다고 주장하고, 그 후에 그들은 단지 물건을 훔쳤을 뿐이다. 그래서 민경은 두 사람을 격리시켜 각각 다른 방에 넣어 심문했다. 지방 검사는 모든 사람과 단독으로 이야기할 것이다. 고소인은 "절도에 대한 확실한 증거가 있기 때문에 징역 1 년을 선고할 수 있다" 고 말했다. 하지만 나는 너와 거래를 할 수 있다. 만약 네가 단독으로 살인을 인정한다면, 나는 너에게 3 개월의 감금만 선고할 수 있지만, 너의 동료는 10 년의 감금을 선고할 것이다. 만약 당신이 고백을 거절하고 배우자에게 신고된다면, 당신은 징역 10 년을 선고받을 것이며, 그는 단지 징역 3 개월을 선고받을 것입니다. 그러나, 만약 당신들이 모두 고백한다면, 당신들은 모두 5 년 형을 선고받을 것입니다. "Scalfi 와 Nacoors 는 어떻게 해야 합니까? 그들은 딜레마에 직면해 있다-고백이냐 부정이냐. 분명히, 가장 좋은 전략은 쌍방이 모두 부인하는 것이고, 그 결과 모두 1 년밖에 선고되지 않았다. 하지만 두 사람은 격리 상태에 있어 고백할 수 없었다. 따라서 아담 스미스의 이론에 따르면, 모든 사람은 이기적인 목적에서 출발하며 참회를 선택하는 것이 최선의 전략이다. 고백하면 3 개월의 단기 감금을 기대할 수 있기 때문이다. 단, 배우자가 부인하면 자신이 부인하는 10 년 감금보다 낫다. 이런 전략은 남에게 손해를 끼치고 자신에게 이로운 것이다. 뿐만 아니라 고백에도 더 많은 이점이 있다. 상대방이 솔직하게 부인하면 감옥에 가야 한다 10 년. 너무 수지가 맞지 않아! 그래서 이런 상황에서는 고백을 선택해야 한다. 두 사람이 동시에 고백한다 해도 최대 5 년밖에 안 돼 10 년보다 낫다. 그래서 두 가지 합리적인 선택은 솔직히 양측에게 유리했던 전략 (거부) 과 결말 (판결 1 년 징역) 이 나타나지 않는다는 것이다. 이렇게 두 사람 모두 프랭크 전략을 선택하고 5 년 형을 선고받은 결과를' 내쉬 균형' 이라고 하며 비협력 균형이라고도 한다. 각 당사자가 전략을 선택할 때' 공모' (공모) 가 없기 때문에, 그들은 단지 자신에게 가장 유리한 전략일 뿐, 사회복지나 다른 상대의 이익은 고려하지 않기 때문이다. 즉, 이 전략 조합은 모든 참가자 (당사자와 참여자라고도 함) 의 최적 전략 조합으로 구성됩니다. 아무도 자신에게 더 큰 이익을 쟁취하기 위해 자발적으로 전략을 바꾸지 않을 것이다. " 죄수의 딜레마' 는 광범위하고 깊은 의미를 지닌다. 개인적 이성과 집단적 이성의 충돌, 각자의 이익에 대한 추구는' 내쉬 균형' 으로 이어지는데, 이는 모두에게 불리한 결말이기도 하다. 두 사람은 모두 솔직하게 부인하는 전략에서 자신을 먼저 생각하기 때문에 반드시 긴 형기를 복역해야 한다. 상대를 먼저 생각하거나 서로 결탁해야 최단감금 결과를 얻을 수 있다. 내쉬 균형은 먼저 아담 스미스의' 보이지 않는 손' 원리에 도전한다. 스미스의 이론에 따르면, 시장 경제에서 모든 사람은 이기적인 목적에서 출발하여 결국 사회 전체가 이타적인 효과를 얻는다. "국부론" 에서 이 경제성자의 명언을 돌이켜봅시다. "사리사욕을 추구함으로써, 그는 종종 그가 실제로 하고 싶은 것보다 더 효과적으로 사회적 이익을 증진시킵니다. 내시균형' 에서' 보이지 않는 손' 원칙의 역설: 이기적으로 출발하면 이기심도 아니고 이기도 아니다. 이것은 두 죄수의 운명이다. 이런 의미에서 내쉬 균형의 역설은 실제로 서구 경제학의 초석을 흔들었다. 따라서 내쉬 균형에서 우리는 협력이 유리한' 이기전략' 이라는 이치를 깨달을 수 있다. 하지만 그것은 다음과 같은 황금률을 따라야 합니다. 다른 사람이 당신을 어떻게 대하길 바라며, 다른 사람을 어떻게 대하는가 하는 것입니다. 단, 다른 사람들도 그렇게 한다면 말입니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마) 그것이 바로 중국인이 말한 것이다. "자기가 원하지 않는 것은 남에게 행하지 마라." 하지만 전제는 당신이 나에게 원하지 않는 일을 하지 말라는 것입니다. 둘째,' 내쉬 균형' 은 비협력 게임 균형이다. 실제로 비협력 상황은 협력 상황보다 더 보편적이다. 따라서' 내시균형' 은 폰 노이만과 모건 스턴의 협력 게임 이론의 중대한 발전이며, 심지어 혁명이라고 할 수 있다.
내쉬 균형의 보편적인 의미에서 우리는 경제, 사회, 정치, 국방, 관리, 일상생활에서 흔히 볼 수 있는 게임 현상을 깊이 이해할 수 있다. 우리는' 죄수의 딜레마' 와 비슷한 많은 예를 들 것이다. 가격 전쟁, 군사 경쟁, 오염 등. 일반적인 게임 문제는 세 가지 요소로 구성됩니다. 플레이어, 즉 당사자, 참가자 및 전략의 집합, 전략의 집합 및 각 플레이어가 선택한 선택입니다.