'AI Olympics 러닝' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

Today

Total

관리 메뉴

목록AI Olympics 러닝 (3)

나름 공부하는 일상

AI Olympic 레슬링, 러닝 도전기 #0

지난(2023) 학기 Term Project의 일환으로 진행했던 PPO 알고리즘을 활용한 에이전트 학습 과정을 공유하려고 한다. 0. Team "윤성빈"의 한 학기 동안의 여정 앞으로 4~5개 포스팅을 통해 지난 한 학기 동안 우디(?) 친구랑 밤을 새우며 학습시켰던 우리 레슬링, 러닝 에이전트를 소개하려고 한다. 먼저 본격적인 시작에 앞서 최종 학습 결과를 공유하고자 한다. Wrestling(레슬링) 레슬링의 경우, 초반 레슬링 규칙에 대해 파란색 공, 빨간색 공, 둘 다 몰라 랜덤으로 행동했기에 학습하기가 상대적으로 어려웠다. 이를 해결하기 위해 먼저 상대편을 정지시킨 상태로 파란색 공(나)에게 레슬링 규칙을 학습시켰고, 이후 파란색 공이 학습한 레슬링 규칙을 상대편에도 적용시켜 서로 대결을 할 수 ..

IT 개발/강화학습 PPO 2024. 2. 6. 18:13

AI Olympic 레슬링, 러닝 도전기 #2

지난(2023) 학기 Term Project의 일환으로 진행했던 PPO 알고리즘을 활용한 에이전트 학습 과정을 공유하려고 한다. 4. 지난 포스팅 정리 지난 포스팅에서 AI Olympic 종목 레슬링과 러닝에 대해 간략하게 소개했는데 오늘은 실제로 에이전트가 어떻게 해당 경기를 바라보는지 정리하려 한다. 계속 "에이전트"라는 단어를 언급하고 있는데 에이전트는 간단하게 말해서 주변환경(경기장)과 상호작용하는 친구(선수)를 의미한다고 보면된다. 다음 내용부터는 솔직히 조금 이해하기 힘들 수 있도 있다고 생각한다...홧팅..! 5. Wrestling, Running 넌 어떻게 되어있냐? 본격적인 시작에 앞서, 사람의 시야는 얼마나 될까? 구글한테 물어보니 다음과 같은 답변을 줬다. "시야는 눈으로 볼 수 있는..

IT 개발/강화학습 PPO 2024. 1. 29. 23:00

AI Olympic 레슬링, 러닝 도전기 #1

지난(2023) 학기 Term Project의 일환으로 진행했던 PPO 알고리즘을 활용한 에이전트 학습 과정을 공유하려고 한다. 1. 강화학습, 첫 만남 이번에도 어떤 강의를 수강할지 이름으로 정한 나는 "인공지능응용 및 실습"이라는 멋진 이름에 이끌려 친구랑 같이 무작정 해당 강의를 수강하게 되었다. 강의계획서에 적혀 있는 강화학습이라는 키워드는 우리의 가슴을 두근두근하게 만들었고, 앞으로 닥칠 고난과 역경은 알지 못했다. 첫날 강의에서 강의는 교수님과 박사님 이렇게 두 분이서 수업을 진행한단 사실에 조금 부담되었지만, 많은 내용을 배울 수 있으니 오히려 좋다는 생각이 들었다. 박사님께서 첫 수업에서 하신 말씀이 아직도 기억나는데 대략 이런 늬앙스였다 "여러분, 어려우니까 포기할 사람은 빨리 포기하세요..

IT 개발/강화학습 PPO 2024. 1. 29. 18:03

이전 Prev 1 Next 다음

목록AI Olympics 러닝 (3)

나름 공부하는 일상

티스토리툴바