알파고는 바둑 수 어떻게 결정할까

입력 2016.03.08 오후 5:15

글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

알파고 개발자 "신경망 통한 고도의 선별적 검색으로 경우의 수 추려내"

[김국배기자] "알파고(AlPhaGo)는 고도의 선별적 검색을 통해 경우의 수를 추려냅니다."

구글 자회사 딥마인드의 리서치 사이언티스트인 데이비드 실버 교수는 8일 경기도 성남시 경기창조경제혁신센터에서 인공지능(AI)을 주제로 열린 콘퍼런스에서 이같이 말했다.

알파고 개발 책임자인 그는 체스 챔피온을 이긴 것으로 유명한 IBM의 딥블루(DeepBlue)와 차이를 언급하며 알파고를 소개했다.

그는 특히 "딥블루는 검색을 통해 모든 하위의 가능성까지 평가하지만 알파고는 고도의 선별적 검색을 진행한다"고 설명했다.

10년 전에 나온 딥블루가 초당 200억개의 경우의 수를 고려하는 반면 알파고는 오히려 여기에 훨씬 못 미치는 초당 10만개만을 고려하는 이유다.

그는 "바둑의 경우의 수는 10의 179 제곱에 이르며 이는 우주의 원자보다도 많다"며 "최고의 바둑기사가 초당 100개의 수를 고려하는데 알파고는 초당 10만개를 고려한다"고 말했다.

그는 이런 알파고의 핵심이 '가치망'과 '정책망'이라는 2가지 신경망에 있다고 강조했다.

그의 말에 따르면 정책망은 다음 번 바둑돌을 놓을 위치 범위를 좁히고 가치망은 가장 승산 있는 수를 예측하는 역할을 한다.

그는 "알파고는 가치망과 정책망 네트워크를 통해 검색의 깊이와 너비를 줄여 나간다"며 "불필요한 경우의 수는 버리고 두 개의 경우의 수를 만들어 심층 분석한 뒤 가장 승산이 있는 수를 찾아낸다"고 말했다.

가능성이 없는 수는 아예 배제해 검색 후보군을 추려 나가는 일종의 '가지치기' 방식인 셈이다. 이는 바둑은 경우의 수가 천문학적으로 많아 다른 게임처럼 무작위 대입 기법이 통하지 않기 때문이다.

그는 "알파고는 3만 시간의 트레이닝을 거쳤고 프로 5단 이상의 3천만개 기보를 데이터 삼아 학습했다"며 "그 결과 알파고는 사람의 움직임에 대한 예측 정확도가 기존 44%에서 57%로 올라갔다"고 덧붙였다.

마지막으로 그는 "알파고의 목표는 사람을 모방하는 것이 아니라 사람을 이기는 것, 인간보다 바둑을 더 잘 두는 것"이라고 전했다.

한편 미래창조과학부 주최하고 소프트웨어정책연구소가 주관한 이날 콘퍼런스에는 500여 명의 인파가 몰리며 AI에 대한 높은 관심을 드러냈다.