• [유머] 으으 논문쓰는데 두렵다...2018.10.25 PM 10:53

게시물 주소 FONT글자 작게하기 글자 키우기

머신러닝이랑 딥러닝에 관심이 생겨서 혼자서 공부하다가 강화학습도 알게됐고  

 

관심있게 보다가 머신러닝은 학습시킬때 데이터가 잘 정의되어 있을수록 학습이 용의하다는 걸 깨달았고 

 

강화학습은 행동x를 했을때 그 결과를 숫자나 단순한 상태값으로 표현가능하면 학습하기에 용의하다.   

 

그래서 숫자랑 단숭 상태값으로 명확하게 표현할 수 있는 게임이 뭐가 있을까 생각하다 나온게 철권...   

 

 그래서 철권에다가 강화학습을 적용하는 이론을 쓰고 있습니다.   

 

일단 먼저 학술대회용이기 때문에 아직 정확하고 디테일하게 적는 수준은 아니고 철권에 강화학습을 적용하기 위해 어떤 데이터들이 필요한지    

 

왜 철권에 강화학습 적용 가능성이 있는지(프레임을 이용한 명확한 계산 가능성과 체력이라는 숫자로 정의된 피드백)를 먼저 쓴건데요   

 

상대가 초풍을 쓴다면 ai는 초풍의 프레임, 판정(상,중,하단),  회피 가능한 횡 방향, 사거리 등과 같은 데이터로 초풍의 파홰법을 데이터로 계산이 가능하죠  

 

 근데 반응속도를 어떻게 해야할지 모르겠습니다. 핵처럼 칼같이 반응하는건 딜캐랑 짠발만 쓸거 같아서...   

 

커맨드 입력을 0.5초 늦춰야할지 상대방이 사용한 기술의 데이터를 0.5초늦게 전달해줘야할지... 

 

  졸업논문은 직접 구현쪽으로 갈 거 같고....근데 감당하기 너무 어려운 주제를 잡은거 아닌가 고민되기도 합니다      

 

 고수까지 필요없고 기본 컴까기 실력만 됐으면 좋겠습니다...    


 개발자분들이 보시기에 구현 가능성이 터무니 없을까요??   

 

게임내 메모리로 상대방이 어떤 기술을 쓰는지는 실시간으로 확인이 가능합니다  

댓글 : 4 개
근데 이렇게 하면 머신러닝을 적용시킨 AI 캐릭터가 얼마나 효과적으로 학습했는지 수치상으로 확인 가능한가요? 대전 상대의 실력이 일정한게 아닐텐데...
그걸 보상이랑 체력, 그리고 승률등으로 확인할 거 같네요...

일단 컴까기하고 난 다음에 멀티를 돌려볼까...
상대방이 기술a를 썻을때 ai가 그걸 회피하던 딜캐를 하던 막던 상대방의 기술을 파홰하고 기술a를 사용한 상대방에게 데미지를 입힐때마다 올바른 학습이 이루어진다고 생각하는데...
테스트배드먼저 만드시는거라면 그냥 구현하시면서 수치맞추시면될꺼같습니다만 ..
친구글 비밀글 댓글 쓰기