루리웹-9314882745 MYPI

루리웹-9314882745
접속 : 49   Lv. 6

Category

Profile

Counter

  • 오늘 : 26 명
  • 전체 : 122976 명
  • Mypi Ver. 0.3.1 β
[유머] 인공지능 강화학습 고수님들 질문좀... (2) 2018/10/08 PM 10:44

철권을 강화학습으로 학습시켜서 기본 FSM을 이용한 철권 매우 어려움 난이도의 기본 AI를 이기는게 목표인데요(이하 철파고라고 부를게요)

 

철파고는 이미지 인식없이 순수히 입력되고 정리된 데이터 라벨만으로 학습을 시킬려고 합니다.

 

철권은 사실 가위바위보 게임이라고 생각하거든요 전

 

현재 외부프로그램의 힘으로 상대가 어떤 기술을 썻는지 프레임 이득이 얼마인지 상단인지 카운터인지 콤보시동기인지 다 긁어올 수 있게됐어요


상대가 A라는 기술을 썻을때 철파고는 위의 데이터 라벨을 기반으로 어떤 공격들을 할 수 있는지 체크를 합니다

 

각 기술마다 리턴이 얼마나 큰지를 이미 데이터 라벨로 구현해놓구

 

가장 큰 리턴값을 가진 기술을 자동으로 실행하게 만들어 놓는거죠


방어후 반격이나 딜레이 캐치등은 이렇게 한다고 쳐도

 

서로 대치중에 공격은 기술마다 가치에 따른 리턴과 리턴을 위한 발생 가능한 리스크를 계산하고 계속해서 학습시키면 공격도 개선의 가능성이 있을까요?


캐릭터 위치값이랑 카메라 위치값만 긁어오면 이제 거리랑 횡신을 얼마나 했는지도 다 파악가능해서 이미지 인식 없이 어느정도 학습시킬수 있을거라고 생각하는데...

 

물론 맨처음 학습시킬때는 오토핵처럼 칼같이 반응하게 시키고 나중에는 인풋 딜레이를 사람 처럼 0.5초 정도 넣어볼려고 합니다.

 

이론상이긴 한데 학습이 불가능할까요?

신고

 

백에이커의숲    친구신청

철알못이지만(....) 머신러닝은 전략이 구체적이면 구체적일수록 성공확률이 높습니다. 그리고 이미지 인식같이 노이즈가 많은 데이터는 뺄수록 좋아요. 전략이 짜여졌으면 이제 무슨 방법으로 학습시키냐를 결정하셔야겠군요. 이런건 그때그때 공격에만 반격하는 방식으로 1회성 패턴매칭을 시킬지 혹은 대전 시작부터 지금까지의 공방 히스토리를 가지고 바로 다음 커맨드를 어떻게 넣을지(시계열) 등등이 될 수 있겠죠.

루리웹-9314882745    친구신청

고수로 갈수록 철권의 전략은
리스크가 적은 기술로 간을 보면서 회피기동 움직임을 취하다가 상대방의 공격을 피하거나 헛친걸 쌔게 때리는 형식이더라구요
카운터를 노리는 행동은 빈약함 하지만 카운터를 노린다는건 상대방의 습관이나 패턴을 예상해서 기술을 지른다는 거니까 더 많은 데이터(더 많은 게임 판수)에 따라 카운터를 시도하고 성공하는 횟수도 늘어나지 않을까 생각하는데...
으으...
X