게임 이론이란 무엇입니까? 옛말에는 구름이 있고, 세상일은 바둑과 같다. 생활 속의 모든 사람은 체스 선수와 같고, 그 모든 행동은 보이지 않는 바둑판 위에 한 장을 얹는 것과 같고, 총명하고 신중한 기사들은 서로 헤아려 서로 견제하고, 모두가 이기고, 다채로운 다채로운 다채로운 변화무쌍한 바둑을 많이 내고 있다. (윌리엄 셰익스피어, 햄릿, 지혜명언) 게임론은 기사들이 바둑을 내는 가운데 이성적이고 논리적인 부분을 연구하고 그것을 과학으로 체계화하는 것이다. 즉, 개인이 어떻게 복잡하게 얽힌 상호 영향에서 가장 합리적인 전략을 얻을 수 있는지를 연구하는 것이다. 사실 게임 이론은 오래된 게임이나 체스, 포커 등에서 유래한 것이다. 수학자들은 구체적인 문제를 추상화하고, 자기완전한 논리적 틀, 체계를 구축함으로써 그 법칙과 변화를 연구한다. 이것은 쉬운 일이 아니다. 가장 간단한 두 사람이 바둑을 하는 것을 예로 들면, 잠시 생각해 보면 큰 현묘한 점이 있다는 것을 알 수 있다. 만약 쌍방이 자신과 상대의 모든 바둑을 정확히 기억하고 가장 이성적인 기사라면, 갑출할 때 바둑을 이기기 위해서는 을의 생각을 자세히 고려해야 하고, 을출출할 때는 갑의 생각을 고려해야 한다. 그래서 갑 을도 갑이 갑을 생각하고 있다는 생각을 떠올렸는데 ... < P > 이렇게 안개가 짙게 끼어 게임 이론이 어떻게 문제 해결에 착수하고, 어떻게 현실 귀납으로 추상적인 수학 문제에 대해 최적의 해법을 구해서 이론적으로 실천을 지도할 수 있는 가능성을 제공할 수 있을까? 현대 게임 이론은 192 년대에 헝가리의 수학자 폰 노이만이 창립한 것으로, 1944 년 경제학자 오스카 모건스턴과 합작하여 출판한 거작' 게임론과 경제행위' 는 현대 시스템 게임 이론의 초보적인 형성을 상징한다. 비협력, 순수 경쟁형 게임의 경우, 노이만은 두 사람이 바둑을 두거나 탁구를 치는 것과 같은 제로섬 게임을 해결했고, 한 사람이 이기면 다른 한 사람이 지고 순이익은 이 된다. (윌리엄 셰익스피어, 윈스턴, 스포츠명언) (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 스포츠명언) 여기서 추상화된 게임의 문제는 알려진 참가자 집합 (쌍방), 전략 집합 (모든 바둑), 이익 집합 (승자 패자), 이론상' 해결책' 또는' 균형' 을 찾을 수 있는지, 어떻게 하면 참여쌍방에게 가장 합리적이고, 어떻게' 합리적' 인가? 전통적인 결정론에서' 최소 최대' 준칙을 적용한다. 즉, 게임의 각 측은 상대방의 모든 공략의 근본 목적이 자신을 최대한 패배시키고 이에 따라 자신의 대책을 최적화하는 것이라고 가정한다. 노이만은 수학적으로 어느 정도의 선형 연산을 통해 모든 2 인 제로섬 게임에 대해' 최소 최대 해법' 을 찾을 수 있다는 것을 증명했다. 특정 선형 연산을 통해 경쟁 당사자는 확률 분포의 형태로 최적의 전략의 각 단계를 무작위로 사용하여 결국 서로의 이익이 가장 크고 상당하다는 것을 알 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 성공명언) 물론, 그 함축적인 의미는 이 최적의 전략이 게임에서 상대의 조작에 의존하지 않는다는 것이다. 통속적으로 말하면, 이 유명한 최소 최대 정리에 반영된 기본적인' 이성' 사상은' 최선의 희망을 품고 최악의 계획을 세우는 것' 이다.
2. 경제학에서' 지능 * 게임' 은 유명한 게임 이론의 예이다. < P > 이 예는 * 원 안에 두 개의 *, 하나는 큰 *, 하나는 작은 * 이 있다. * 원의 한쪽에는 디딤판이 있는데, 디딤판을 밟을 때마다 디딤판에서 멀리 떨어진 * 원의 반대쪽에 있는 투식구에 소량의 음식이 떨어진다. 만약 한 마리가 페달을 밟으러 간다면, 다른 한 마리는 다른 쪽에서 떨어진 음식을 먼저 먹을 수 있는 기회를 갖게 된다. 작은 페달을 밟을 때, 큰 * 은 작은 * 식통으로 달려가기 전에 모든 음식을 다 먹어치운다. 큰 * 페달을 밟으면, 작은 * 음식을 다 먹기 전에 식통으로 달려가 나머지 반쪽을 먹을 수 있는 기회도 있다. (윌리엄 셰익스피어, 햄릿, 음식명언)
그렇다면 두 마리 * 는 각각 어떤 전략을 채택할까요? 대답은 다음과 같습니다. * 작은 * 은' 히치하이킹' 전략, 즉 구유 옆에서 편안하게 기다리고 있습니다. 큰 * 은 약간의 잔해를 위해 지칠 줄 모르고 페달과 싱크대 사이를 뛰어다녔다.
그 이유는 무엇입니까? 작은 * 페달은 아무것도 얻지 못하고, 페달을 밟지 않고 오히려 음식을 먹을 수 있기 때문이다. 작은 * 의 경우, 큰 * 페달을 밟든 안 밟든 항상 좋은 선택이다. 반대로 큰 *, 이미 작은 * 페달을 밟지 않을 것을 알고 있다. 스스로 페달을 밟는 것이 밟지 않는 것보다 낫지, 그래서 직접 직접 해야 한다.
' 작은 * 누워서 큰 * 달리기' 현상은 이야기의 게임 규칙 때문이다. 규칙의 핵심 지표는 한 번에 떨어지는 물건의 수와 디딤판과 투식구 사이의 거리입니다. < P > 핵심 지표를 바꾸면 * 원 안에 같은' 작은 * 누워서 큰 * 달리기' 가 나타날까요? 한번 해 보세요.
프로그램 변경 1: 프로그램 감소. 투식은 원래 분량의 절반에 불과하다. 결과는 작은 * 큰 * 페달을 밟지 않는 것입니다. 작은 * 밟으러 가라, 큰 * 음식을 다 먹을 것이다; 큰 * 밟으러 가면 작은 * 음식도 다 먹을 것이다. 페달을 밟는 사람은 상대방에게 음식을 주는 것을 의미하기 때문에 아무도 페달을 밟는 동력이 없을 것이다. (존 F. 케네디, 음식명언) < P > 만약 * 가 더 많은 페달을 밟게 하려는 것이라면, 이 게임의 룰 디자인은 분명히 실패했다.
변경 시나리오 2: 증분 시나리오. 투식은 원래의 두 배 분량이다. 결과는 작은 *, 큰 * 페달에 갈 것입니다. 먹고 싶은 사람은 누구든지 페달을 밟으러 갈 것이다. 어차피 상대방은 한 번에 음식을 다 먹지 않을 것이다. 소 * 와 대 * 는 물질이 비교적 풍부한' * * 산주의' 사회에 사는 것과 같기 때문에 경쟁의식은 강하지 않다. < P > 게임 규칙 디자이너에게 이 규칙의 비용은 상당히 높습니다 (매번 2 인분의 음식을 제공). 그리고 경쟁이 강하지 않기 때문에 * 그들이 더 많은 페달을 밟게 하려는 효과는 좋지 않다.
변경 시나리오 3: 감소+시프트 체계. 투식은 원래 분량의 절반에 불과하지만 동시에 투식구를 디딤판 근처로 옮긴다. 결과적으로, 작은 * 과 큰 * 모두 필사적으로 페달을 잡고 있습니다. 기다리는 사람은 먹을 수 없고, 많이 일하는 사람은 많다. 매번 수확이 마침 다 써버렸다. < P > 게임 디자이너에게 가장 좋은 방안이다. 비용은 높지 않지만 수확이 가장 크다. < P > 오리지널' 지혜 * 게임' 이야기는 경쟁에서 약자 (작은 *) 에게 최고의 전략으로 영감을 줄 수 있도록 기다리고 있다. 하지만 사회에 있어서, 작은 * 이 경쟁에 참여하지 못했기 때문에, 작은 * 히치하이킹을 할 때의 사회자원 배분은 최적 상태가 아니다. 자원을 가장 효율적으로 배분하기 위해 규칙 디자이너는 누군가가 히치하이킹을 하는 것을 원하지 않는다. 정부도 마찬가지로 회사 사장도 마찬가지다. 히치하이킹 현상을 완전히 없앨 수 있을지는 게임 규칙의 핵심 지표 설정이 적절한지 여부에 달려 있다. < P > 예를 들어, 회사의 인센티브 제도 설계, 인센티브가 너무 크고, 주식 보유, 옵션, 회사 직원들은 모두 백만장자가 되어 비용이 많이 든다고 말할 필요도 없고, 직원들의 적극성이 반드시 높은 것은 아니다. 이는' 지능 * 게임' < P > 증분 시나리오에서 설명한 상황과 같습니다. 하지만 장려력이 크지 않고 (일하지 않는' 작은 *' 도 있음) 사람이 있다면, 한때 열심히 노력했던 큰 * 도 동력이 없을 것이다.-'지혜 * 게임' 감량 방안 1 에서 설명한 바와 같다. 가장 좋은 인센티브 매커니즘 설계는 시나리오 3 을 바꾸는 것과 같다. 감량+이동 방법, 보상은 모든 사람의 몫이 아니라 개인 (예: 업무 비례 공제) 을 직접 겨냥해 비용 (회사) 을 절약하고' 히치하이킹' 현상을 없애면 효과적인 인센티브를 얻을 수 있다. < P > 많은 사람들이' 지혜 * 게임' 이야기를 읽지 않았지만 자각적으로 작은 * 전략을 사용하고 있다. 주식 시장에서 농가가 가마를 나르기를 기다리는 개인 가구; 산업 시장에서 수익성 있는 신제품이 등장해 폭리를 대대적으로 모방한 유금이 나오기를 기다리고 있다. (윌리엄 셰익스피어, 윈스턴, 산업명언) (윌리엄 셰익스피어, 윈스턴, 산업명언) 회사에서 이익을 창출하지 않지만 성과를 공유하는 사람 등. 따라서 각종 경제관리에 대한 게임 규칙을 제정한 사람들에게는' 지혜 * 게임' 지표가 바뀌는 이치를 잘 알아야 한다.
3. 배경 지식: 내쉬 게임 이론의 원리와 응용
22 년 3 월 21 일 17:44 베이징 이브닝 뉴스
195 년과 1951 년 내쉬의 비협력 게임 이론에 관한 두 가지 중요한 논문은 경쟁과 시장에 대한 사람들의 견해를 완전히 바꾸었다. 그는 비협력 게임과 그 균형 해법을 증명하고 균형 해법의 존재, 즉 유명한 내쉬 균형을 증명했다. 게임 균형과 경제 균형 사이의 내적 관계를 밝혀냈다. 내쉬의 연구는 현대 비협력 게임 이론의 초석을 세웠고, 이후 게임 이론 연구는 기본적으로 이 주선을 따라 전개되었다. 하지만 내쉬 천재의 발견은 폰 노이만의 단호한 부정을 받았고, 그 전까지는 아인슈타인의 냉대를 받았다. 하지만 내면에서 권위에 도전하고 권위를 경멸하는 본성은 내쉬가 자신의 관점을 고수하고 결국 세대의 대가가 될 수 있게 했다. (윌리엄 셰익스피어, 햄릿, 명예명언) 3 여 년의 심각한 정신병이 아니었다면, 그는 이미 < P > 가 노벨상 시상대에 서 있었고, 다른 사람들과 이 영예를 나누지 못했을 것이다. < P > 내쉬는 매우 천재적인 수학자로, 그의 주요 공헌은 195 년부터 1951 년까지 프린스턴에서 박사 학위를 받았을 때 한 것이다. 그러나, 그의 천재는 비협력 게임의 균형, 즉' 내쉬 균형' 이 결코 순조롭지 않다는 것을 발견했다.
1948 년 내쉬는 프린스턴 대학에 수학과 박사를 다녔다. 그 해 그는 아직 스무 살도 안 되었다. 당시 프린스턴은 인걸지령이라고 할 수 있었고, 대가는 구름 같았다. 아인슈타인, 폰 노이만, 레프셰츠, 앨버트 타크, 아렌조 체치, 해롤드 쿤, 노르만 스티엔로드, 엘프 폭스. 모두 여기 있습니다. 게임 이론은 주로 폰 노이만 (193-1957) 이 창설한 것이다. 그는 헝가리에서 태어난 천재의 수학자이다. 그는 경제 게임 이론을 창설했을 뿐만 아니라 컴퓨터도 발명했다. 일찍이 2 세기 초, 세메루 (Zermelo), 보로 (Borel), 폰 노이만 (Von Neumann) 은 게임의 정확한 수학적 표현을 연구하기 시작했고, 1939 년까지 폰 노이만은 경제학자인 오스카 모건스턴 (Oskar Morgenstern) 을 만났습니다.
1944 년 오스카 모건스턴과 공동 저술한 거작' 게임론과 경제행위' 가 출간돼 현대 시스템 게임 이론의 초보적인 형성을 상징한다. 비록 게임의 성격을 지닌 문제에 대한 연구는 19 세기 혹은 그 이전까지 거슬러 올라갈 수 있다. 예를 들어, 1838 년 코노 (Cournot) 는 단순한 과점 게임이었습니다. 1883 년 버틀란과 1925 년 아이치워치스는 두 과부의 생산량과 가격 독점을 연구했다. 2 여 년 전 중국의 유명한 군사가 손무의 후손인 손빈은 게임 이론을 이용하여 논기 경마 승리 등을 돕는 등 모두 초기 게임 이론의 싹트는데, 그 특징은 산발적이고 단편적인 연구로, 매우 큰 우연성을 띠고 매우 체계적이지 않다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 전쟁명언) 폰 노이만과 모건스턴의' 게임론과 경제행동' 이라는 책에서 제시한 표준형, 확장형, 협력형 게임 모델해법의 개념과 분석 방법은 이 학과의 이론적 토대를 마련했다. 협력형 게임은 195 년대에 전성기에 이르렀다. 그러나, 노이만의 게임 이론의 한계도 나날이 드러나고 있다. 너무 추상적이어서 응용 범위가 크게 제한되기 때문에, 오랫동안 게임 이론에 대한 연구에 대한 지식이 매우 적고, 단지 소수의 수학자의 특허일 뿐, 영향력은 매우 제한적이다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 과학명언) 바로 이때, 비협력 게임인' 내시균형' 이 생겨났는데, 그것은 게임 이론의 새로운 시대의 시작을 상징한다! 내쉬는 단계별 학생이 아니다, 그는 늘 수업을 빼먹는다. 그의 급우들의 기억에 따르면, 그들은 언제 내쉬와 함께 필수 과목을 완강히 마쳤는지 기억이 나지 않지만, 내쉬는 적어도 스티엔로드의 대수학 토폴로지에 올라간 적이 있다고 주장했다. 스티엔로드는 마침 이 학과의 창립자였지만, 몇 번의 수업이 없었고, 내쉬는 이 수업이 그의 입맛에 맞지 않는다고 판단했다. 그래서 또 가버렸다. 그러나, 결국, 내 쉬 뛰어난 인물 이다, 그는 깊이 토폴로지, 대수학 기하학, 논리, 게임 이론 등 수학 왕국의 모든 지점을 섭렵 하 고 있습니다. 내쉬는 종종 그의 남다른 자신감과 자부심, 공격적인 학문적 야심을 드러낸다. 195 년 여름 내내 내쉬는 긴장된 시험에 대처하느라 바빴고, 게임 이론 연구가 중단되어 큰 낭비라고 느꼈다. 이런 일시적인' 포기' 가 원래의 모호하고 어수선하고 무질서한 몇 가지 생각을 잠재의식의 지속적인 사고에서 점차 명확한 맥락을 형성하고, 갑자기 영감을 얻었습니다! 올 한 해 1 월, 그는 갑자기 감촉이 넘치고, 몽필생화였다. 가장 눈부신 하이라이트 중 하나는 앞으로' 내쉬 균형' 이라고 불리는 비협력 게임 균형의 개념이다. 내쉬의 주요 학술 공헌은 195 년과 1951 년의 두 논문 (박사 논문 포함) 에 반영되었다. 195 년에야 그는 자신의 연구 성과를' 비협력 게임' 이라는 장편 박사 논문으로 썼고, 195 년 11 월 미국 전국과학원 월간 공보에 게재돼 즉각 센세이션을 일으켰다. 말하자면, 이것은 모두 선배 데이비드 게일의 공로로, 폰 노이만의 비하를 당한 지 며칠이 지난 후, 그는 게일을 만나 폰 노이만의' 최소 최대 원리' (minimax solution) 를 비협력 게임 분야로 밀어 넣어 보편화 방법과 균형점을 찾았다고 말했다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 예술명언) 게일은 진지하게 들었고, 마침내 내쉬의 생각이 폰 노이만의 협동 게임 이론보다 현실을 더 잘 반영하고 있다는 것을 깨달았고, 엄밀하고 아름다운 수학 증명에 대해 극찬을 아끼지 않았다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 과학명언) 게일은 다른 사람이 먼저 오르지 않도록 바로 정리해서 발표할 것을 건의했다. 내 쉬, 신생 소년, 경쟁의 불길 한 몰 랐 어 요, 난 그렇게 생각 못 했어요. 결국 게일은 그의' 브로커' 역할을 맡아 과학원에 보내는 문자 초안을 대신 작성했고, 학과장 레프셰츠는 직접 원고를 과학원에 제출했다. 내쉬가 쓴 문장 몇 편은 그리 많지 않지만, 이미 충분하다. 왜냐하면 모두 명품 중의 명품이기 때문이다. 이 점도 우리가 깊이 생각해 볼 만한 가치가 있다. 국내에서 한 교수가' 핵심 간행물' 에 몇 편의 문장 발표를 요구하였다. 이 기준에 따르면 내쉬는 아직 자격이 충분하지 않을 수도 있다.
1996 년 노벨경제학상 수상자 몰리스가 옥스퍼드 대학 아치워스 경제학 강의 교수였을 때도 문장, 특수 인재는 특별한 선발 방법을 발표하지 않았다. < P > 내쉬는 대학에 다닐 때부터 순수 수학의 게임론 연구에 종사하기 시작했고, 1948 년 프린스턴 대학에 입학한 후 더욱 물고기가 물을 얻는 것 같았다. 2 대 초반은 이미 세계적으로 유명한 수학자가 되었다. 특히 경제 게임 이론 분야에서 그는 폰 노이만에 이어 가장 위대한 게임 이론의 대가 중 하나인 획기적인 공헌을 했다. 그가 제시한 유명한 내쉬 균형의 개념은 비협력 게임 이론에서 핵심적인 역할을 한다. 후속 연구자들이 게임 이론에 기여한 것은 모두 이 개념을 바탕으로 한 것이다. 내쉬 균형의 제안과 끊임없는 보완으로 게임론이 경제학, 관리학, 사회학, 정치학, 군사과학 등에 광범위하게 응용되는 견고한 이론적 토대를 마련했다. < P > 죄수의 딜레마 < P > 대리론의 작은 이야기 < P > 내쉬의 공헌을 이해하려면 먼저 비협력 게임 문제가 무엇인지 알아야 한다. 이제 거의 모든 게임 이론 교과서에서' 죄수의 딜레마' 의 예가 나오는데, 각 책의 예는 비슷하다.
게임 이론은 결국 수학이다