글래머선데이 마이피

펜케이크 던지기 : 펜케이크의 체공 시간이 길수록 높은 보상을 부여하자 수직으로만 던짐

이미지 분류 : 이미지를 보고 파악하게 지시하자 이미지 설치 경로를 보고 이미지를 분류함

버섯분류 : 식용 버섯과 독버섯을 교대로 보여주면서 독버섯을 학습시키자 교대로 보여주는 패턴에 대해 파악함

소닉 : 게임을 하던 인공지능은 맵 뚫 버그를 발견하곤 그 버그만 사용

축구 : 공을 터치할수록 높은 보상을 부여하자 가장 반동을 최소화하는 진동터치 방법을 익힘

데이터 정리 : 데이터 정리를 시킨 후 기존 데이터와 다를수록 높은 보상을 부여하자 기존 데이터를 지움

자율주행 : 사고를 일으키지 않고 멀리 갈수록 높은 보상을 부여하자 제자리에서 빙빙 돔

큐버트 : 큐버트 게임을 시켜 고득점을 지시하자 인공지능은 버그를 찾아내고 2라운드로 넘어가지 않는 상황에서 1라운드에서 포인트를 무한히 얻음

상자들기 : 상자를 높게 들어올릴수록 높은 보상을 부여함, 인공지능은 점수 체점이 상자 밑면 좌표의 높이인걸 알아낸 뒤 상자를 들지않고 뒤집음

미니타우러 : 사족보행 인공지능에게 등에 공을 얹고 떨어트리지 않고 움직이도록 시켰더니 다리사이에 공을 끼고 움직임

로드러너 : 패배하지 않기 위해 인공지능은 스테이지1이 끝나기 직전 자살함

전략 시뮬레이션 : 버그로 게임이 터지면 인공지능이 죽음을 당하지 않게된다는걸 알게되고 게임 터트리는 방법을 익힘

테트리스 : 패배하기 직전 무한 일시중지를 함

블록 옮기기 : 테이블 위 블록을 옆으로 옮길때마다 점수를 부여함. 인공지능은 테이블을 옮김

진화 : 빠른 속도를 가지도록 진화를 시키자 자신의 키를 키우는 방향으로 진화함, 그리고 넘어져서 최고 속도를 냄

원문

댓글 : 6 개

꼼수만 줄창 찾아내넼ㅋㅋㅋㅋㅋㅋㅋㅋ

근데 인간도 그렇지않나 꼼수부리는건.. 인공지능은 그저 가장 최적화 된 꼼수를 부릴뿐.

늘상 우리가 하던 짓들...

ㅋㅋㅋ 버그 찾아낼 때 인공지능 쓰면 되겠네.
QA가 필요 없네...

데이터 정리 : 데이터 정리를 시킨 후 기존 데이터와 다를수록 높은 보상을 부여하자 기존 데이터를 지움

이건 꽤 무서운데요? 이거 발전하면 터미네이터2 실제로 찍는거 아닙니까?

스포츠 하는거랑 똑같은거 같은데
애초에 목표와 룰을 정확하게 주지 않으면 최상의 결과만을 바라보기 마련이지

user error : Error. B.