루리웹-9314882745 마이피

철권을 강화학습으로 학습시켜서 기본 FSM을 이용한 철권 매우 어려움 난이도의 기본 AI를 이기는게 목표인데요(이하 철파고라고 부를게요)

철파고는 이미지 인식없이 순수히 입력되고 정리된 데이터 라벨만으로 학습을 시킬려고 합니다.

철권은 사실 가위바위보 게임이라고 생각하거든요 전

현재 외부프로그램의 힘으로 상대가 어떤 기술을 썻는지 프레임 이득이 얼마인지 상단인지 카운터인지 콤보시동기인지 다 긁어올 수 있게됐어요

상대가 A라는 기술을 썻을때 철파고는 위의 데이터 라벨을 기반으로 어떤 공격들을 할 수 있는지 체크를 합니다

각 기술마다 리턴이 얼마나 큰지를 이미 데이터 라벨로 구현해놓구

가장 큰 리턴값을 가진 기술을 자동으로 실행하게 만들어 놓는거죠

방어후 반격이나 딜레이 캐치등은 이렇게 한다고 쳐도

서로 대치중에 공격은 기술마다 가치에 따른 리턴과 리턴을 위한 발생 가능한 리스크를 계산하고 계속해서 학습시키면 공격도 개선의 가능성이 있을까요?

캐릭터 위치값이랑 카메라 위치값만 긁어오면 이제 거리랑 횡신을 얼마나 했는지도 다 파악가능해서 이미지 인식 없이 어느정도 학습시킬수 있을거라고 생각하는데...

물론 맨처음 학습시킬때는 오토핵처럼 칼같이 반응하게 시키고 나중에는 인풋 딜레이를 사람 처럼 0.5초 정도 넣어볼려고 합니다.

이론상이긴 한데 학습이 불가능할까요?

댓글 : 1 개

페널티를 얼마나 주는지가 문제일듯
최적값만 찾게 만들면 횡신치고 초풍만 써도 인간은 대처가 안될거 같음

user error : Error. B.