-
[잡담] 게임으로 인공지능을 훈련시켰을때 의도되지 않은 결과들.txt2018.11.14 PM 10:37
펜케이크 던지기 : 펜케이크의 체공 시간이 길수록 높은 보상을 부여하자 수직으로만 던짐
이미지 분류 : 이미지를 보고 파악하게 지시하자 이미지 설치 경로를 보고 이미지를 분류함
버섯분류 : 식용 버섯과 독버섯을 교대로 보여주면서 독버섯을 학습시키자 교대로 보여주는 패턴에 대해 파악함
소닉 : 게임을 하던 인공지능은 맵 뚫 버그를 발견하곤 그 버그만 사용
축구 : 공을 터치할수록 높은 보상을 부여하자 가장 반동을 최소화하는 진동터치 방법을 익힘
데이터 정리 : 데이터 정리를 시킨 후 기존 데이터와 다를수록 높은 보상을 부여하자 기존 데이터를 지움
자율주행 : 사고를 일으키지 않고 멀리 갈수록 높은 보상을 부여하자 제자리에서 빙빙 돔
큐버트 : 큐버트 게임을 시켜 고득점을 지시하자 인공지능은 버그를 찾아내고 2라운드로 넘어가지 않는 상황에서 1라운드에서 포인트를 무한히 얻음
상자들기 : 상자를 높게 들어올릴수록 높은 보상을 부여함, 인공지능은 점수 체점이 상자 밑면 좌표의 높이인걸 알아낸 뒤 상자를 들지않고 뒤집음
미니타우러 : 사족보행 인공지능에게 등에 공을 얹고 떨어트리지 않고 움직이도록 시켰더니 다리사이에 공을 끼고 움직임
로드러너 : 패배하지 않기 위해 인공지능은 스테이지1이 끝나기 직전 자살함
전략 시뮬레이션 : 버그로 게임이 터지면 인공지능이 죽음을 당하지 않게된다는걸 알게되고 게임 터트리는 방법을 익힘
테트리스 : 패배하기 직전 무한 일시중지를 함
블록 옮기기 : 테이블 위 블록을 옆으로 옮길때마다 점수를 부여함. 인공지능은 테이블을 옮김
진화 : 빠른 속도를 가지도록 진화를 시키자 자신의 키를 키우는 방향으로 진화함, 그리고 넘어져서 최고 속도를 냄
원문
댓글 : 6 개
- 정심일도
- 2018/11/14 PM 10:46
꼼수만 줄창 찾아내넼ㅋㅋㅋㅋㅋㅋㅋㅋ
- 리베르올라
- 2018/11/14 PM 10:47
근데 인간도 그렇지않나 꼼수부리는건.. 인공지능은 그저 가장 최적화 된 꼼수를 부릴뿐.
- Octa Fuzz
- 2018/11/14 PM 10:48
늘상 우리가 하던 짓들...
- 박가박가박가
- 2018/11/14 PM 11:46
ㅋㅋㅋ 버그 찾아낼 때 인공지능 쓰면 되겠네.
QA가 필요 없네...
QA가 필요 없네...
- 이터군
- 2018/11/15 AM 01:13
데이터 정리 : 데이터 정리를 시킨 후 기존 데이터와 다를수록 높은 보상을 부여하자 기존 데이터를 지움
이건 꽤 무서운데요? 이거 발전하면 터미네이터2 실제로 찍는거 아닙니까?
이건 꽤 무서운데요? 이거 발전하면 터미네이터2 실제로 찍는거 아닙니까?
- kofluvs
- 2018/11/15 AM 09:40
스포츠 하는거랑 똑같은거 같은데
애초에 목표와 룰을 정확하게 주지 않으면 최상의 결과만을 바라보기 마련이지
애초에 목표와 룰을 정확하게 주지 않으면 최상의 결과만을 바라보기 마련이지
user error : Error. B.