Hwoarang MYPI

Hwoarang
접속 : 5904   Lv. 65

Category

Profile

Counter

  • 오늘 : 2 명
  • 전체 : 4960 명
  • Mypi Ver. 0.3.1 β
[기본] 알파고 VS 이세돌 3국에서의 공돌이 관점 해석. (4) 2016/03/12 PM 07:12
오늘 중계중 가장 임팩트 있는 말은.
"알파고 얘가"
"알파고는 패싸움을 싫어합니다"
라는 두 마디 입니다.

첫번째는 AI 를 바라보는 관점이 이번 대국으로 인해.
인공지능이 지능을 가졌다 라는 감성을 갖게 된 것이고.

두번째의 패싸움으로 끌고가면 유리하다.
라는 중계를 듣고 '그래 4번째 판에서는 패 싸움을 적극적으로 끌고가면 이기겠구나' 라고 생각 하고 계시다면.
그것은 잘못 생각하고 계신것이라고 의견을 제시 합니다.

패 싸움이 안되는 이유.
바둑 용어로 '패' 란. 상대가 따낸것을 다시 따내는 것입니다.
돌을 서로 한번씩 두면서 무한 반복이 되는 형태를 말합니다.

이렇게 되면 서로 계속 돌을 따다 보면. 경기가 안끝나서.
그래서 붙은 룰이. 내가 직전 턴에 놓은자리에는 놓을 수 없다.
라는 룰이 생겼습니다.

그렇다는것은.
패 싸움이 되면.
상대가 따놓은것을 내가 다시 따기 위해서 어딘가 둬야 한다는 것입니다.

이것은 경우의 수 이론으로 보면.
알파고 입장에서는

알파고 : 계산해야 할 경우의 수가 줄어 듦.
이세돌 : 턴을 사용 했음에도 바둑판 위에 돌을 더 놓지 못함.

이렇게 정리 됩니다.

그러면. 패 싸움으로 진행이 되면.
필패 입니다.

아마도 패 싸움은 못할꺼라는 주변의 조언이 있었거나.
알파고가 패 싸움이 약할꺼다 라고 생각하는것 같은데.
그건 순전히 알파고를 인간처럼 보는 방식입니다...

그리고 알파고는 패라는 개념을 알고 있는게 아니라.
패싸움이 된 자리를 '착수 금지점' 이라는 값으로 표시해두고.
나머지 자리에 대한 연산을 들어갑니다.

그러니까 해설자들이.
"아 이 패를 안받나요?" 이렇게 말을 하는겁니다.

패를 받고 말고의 개념으로 접근 하면 안되고.
해당 턴의 바둑판 픽셀 값 중 그냥 제일 승률 값이 높은 자리에 놓고 마는겁니다.
그러니 패를 받았다 말았다 하는겁니다.

알파고를 기계의 관점으로 볼 줄 아는 사람들이 이세돌 선수에게 조언을 좀 해주면 좋겠습니다.
... 사람 처럼 보고 대응을 하니까 약점을 못찾죠 ㅜㅜ...
뭐.. 약점을 찾아서 이긴다고 해도.. 인공지능계에 혁명적 사건이 일어난 것은 변함이 없습니다.

한국기원에 전화라도 한통화 넣고 싶은 심정입니다... ;

신고

 

아이셔요    친구신청

이로가도 저로가도 안되는 상황입니다
이것도 가설이지만

알파고가 싸움 싫어한다는건 우선 어떤 상황이든지 간에 가장 우선점수를 줄 수 있는 안정적인 방법을 1순위로 둡니다 그건 가급적이면 싸우지 않는 상태가 되겠지요
그런의미에서 싸움을 싫어한다 표현을 하는것이라 보고요

주인장님 말씀도 맞는게 바둑은 계산 싸움입니다
단 이게 싸우게 되든 안싸우든 그때마다의 계산은 알파고가 앞서가지요
실제로 해설진들은 이해못한 앞서내다본 수를 미리 깔아놓기도 하고요

또한 어떤 방식으로 공략을 해도 그때 마다의 재계산을 통해 밀리게 될겁니다...

인간적인 공격을 하는건 우선 이세돌의 장점은 상대를 흔드는 타입이에요
기계한테 안먹히지만 알파고같은 대ai전에 경험도 없을 뿐더러 경험을 해도
계산력에 밀려 안될거라 봅니다...
이세돌도 안되는걸 2국 후 인정을 했고
오늘 대국에선 평소 본인의 모습을 보여줬고 졌지만
이전 1국과 2국에 비해서 진짜 좋은경기 보여줬습니다

Hwoarang    친구신청

맞습니다. 정말 지도바둑을 두고 있는 느낌이 듭니다.
그래도 이세돌 선수 정도되니까 매 대국 마다 실력이 껑충껑충 올라가는거 같네요.

간G나게    친구신청

조만간... 다른 기업에서 만든. 바둑 대전용 ai가. 알파고에 도전하고
그걸 중계하는 시대가 올곳 같음

IncomeCountry    친구신청

알파고를 기계의 관점으로 볼 줄 아는 사람들이라 할지라도
딱히 조언할 게 없을 것 같다는 게 제 생각.
백사이드에서 돌아가는 시스템 규모가 얼만데 뭘 어떻게 조언을 하겠어요.
아마 조언한다고 말하는 그 수도 이미 포함해서 확률 계산한 다음에 선택했을 듯.
(또는 그 수가 장기적으로는 비효율이라 이미 계산에서 탈락했을 가능성이 더 많죠.)

알파고 같은 시스템 구조라면, 만든 사람이 와서 훈수를 둬도 안되는 거죠.
걔가 어떤 식으로 추론하는가에 대한 큰 그림은 그 사람이 만들었어도
현장에서 막상 그 수를 왜 그렇게 뒀는가는 그걸 학습한 알파고 자신만 알죠.
(사람이 그 학습내용을 직접 들여다보고 예측하기에는 너무 방대하고...)

해당 수를 놓을려고 판단할 때 계산 끝난 전체 수와 확률을
알파고 스스로가 top 100으로 뽑든 해서 그때그때 보여준다고 하더라도
사람이 그거 다 보고 다음 수를 예측해서 둔다고 해서 이길거란 보장은 없는거죠.

기계는 사람이 놓은 그 다음 수에 대응해서 전체적인 가치 판단을 새로 또 하죠...
매 판을 새로 두는 것과 마찬가지입니다. 이전 수에 대한 영향을 안받죠.
그러니 사람이 판단하는 '싸움'이라는 게 애초에 일어날 수가 없는 구조죠.
애초에 세력에 관심이 없으니...

사람처럼 세력이라든가 기타 판의 연속적인 흐름 이런 걸 읽는 게 아니라
매 수마다 판 전체를 처음 보는 것인양 몬테카를로를 돌리든 경험적 선택을 하든
(중반 넘으면) 전체 경우의 수를 다 뽑아보고 최적 위치에 놓든 해내는 거니.

인간하곤 판을 보는 사고방식부터 두는 알고리즘까지 완전 다른거죠.
인간하고 두던 식으로 두면 어떻게 되는지는 이미 이번에 충분히 보여준 것 같고,
그렇다고 인간이 알파고의 사고방식과 알고리즘을 따라 하기는 불가능하죠.
(알파고는 지들끼리 둬서 질 때도 있다고 합니다만.)

알파고를 이기기 위해선 아마 판에 대한 저런 사고방식과 알고리즘 자체를 깰 수 있는
완전 새로운 전략이 나와야 하지 않을까 싶습니다. 바둑에 대한 새로운 해석 수준이겠죠.
(만약 인간이 할 수 있는 선에서 그런 게 있다면 말이죠...)
현재페이지1
X