[강의소개]
  • 최근 각광을 받고 있는 강화학습의 이론을 학습함
  • 강화학습 이론을 실습을 통하여 확인함
  • 팀별로 주제를 선정하여 기말과제 진행함
    • 좋은 결과는 학생이 원하는 경우 학술대회 논문 및 학술지 논문 진행함
    • 기말과제 주제로 이전 년도 다른 학생이 했던 주제를 심화발전하는 것도 권장함
[강화학습 이론 및 실습(MD)]
[기말과제]
  • 기말과제로 수행한 학생들의 작품 소개: 클릭
[강의노트]
  • 강의자료

    • 강의계획서: 종합시스템 수업계획서 참조
    • 강의소개

  • 강의노트
    강의자료
    (바닥부터 배우는 강화 학습 강의노트 전체 다운로드)
    1장) 강화학습이란 2장) 마르코프 결정 프로세스 3장) 벨만 방정식
    4장) MDP를 알 때의 플래닝 5장) MDP를 모를 때 밸류 평가하기 6장) MDP를 모를 때 최고의 정책 찾기
    7장) Deep RL 첫걸음 8장) 가치 기반 에이전트 9장) 정책 기반 에이전트
    10장) 알파고와 MCTS

  • 강화학습 실습: 클릭
  • 기말과제 질문게시판: 클릭

[성적확인]
[과목 게시판]
[과제]

번호

과제내용

비고

#1


[강화학습 응용분야 조사]

다음을 수행한 후 한글 혹은 워드 파일로 정리하여 제출하시오.

자신이 관심있는 분야(예, 게임, 의료, 금융, 제조, 서비스, 로봇, 자율주행, 교육, 보안, 국방, 디자인, 음악, 작곡, 생체인식, 음성인식, 얼굴인식, 물체인식 등)에서 강화학습 기술이 어떻게 개발되어 활용되고 있으며 미래 전망이 어떤지를 인터넷이나 책 등 관련자료를 참고하여 조사하시오.

[주의사항]

  • 관련 기사, 학술 자료, 세미나 자료, 오픈 소스 등등 모두 가능
  • 반드시 포함할 내용 (해당기술, 발전과정, 현재상황, 활용현황, 미래전망, 오픈 소스 등)
  • 조사 내용이 빈약한 경우 감점됨

과제는 e-class로만 제출

아래아 한글 혹은 MS word 파일로 제출

#2


[강화학습 응용 오픈소스 조사]

다음을 수행한 후 관련 정보 및 실행결과 등을 한글 혹은 워드 파일로 정리하여 제출하시오.

자신이 관심있는 분야(과제 #1에서 조사한 것을 권장하나 반드시 일치할 필요는 없음)에서 개발된 강화학습 응용 오픈소스를 조사한 후 그 중에 하나를 선정하여 해당 프로그램을 직접 수행시켜보고 다양한 수행 결과를 캡쳐하여 제출하시오.

[주의사항]

  • 해당 프로그램이 제대로 동작하는지 실제로 수행시켜 확인해야함
  • 동작확인을 위해 실제로 수행시킨 결과화면을 캡처해서 보고서에 포함해야함 (프로그램을 직접 작성하는 것은 아니고 오픈소스를 수행시켜 보는 것임!!!)
  • 가능한 프로그램을 많은 부분 이해하도록 하고 다양한 상황을 추가 실험해보는 것 권장함
[보고서에 포함해야할 항목]
  • 조사한 오픈소스 목록 (사이트 URL 포함)
  • 선정한 오픈소스 관련 정보 (사이트 URL 포함)
  • 선정한 오픈소스 설치 정보
  • 선정한 오픈소스 실행 결과 (소스 포함)
  • 실행 결과 화면
  • 실행 결과 설명 및 분석
  • 과제 중 발생한 문제 및 후기

#3


기말과제 주제 관련 국내논문 읽고 정리

기말과제의 주제와 관련이 있는 국내논문(영어논문도 가능) 1인당 4편을 읽고 요점을 정리하여 제출하시오.

  • (단, 논문 페이지가 5페이지 이상인 논문만 1편으로 인정)
  • (팀원별로 다른 논문을 선택해야함)
  • (석사학위 논문의 경우 하나당 2편으로 인정)
  • (박사학위 논문의 경우 하나당 4편으로 인정)
  • 박사학위 논문의 경우 하나만 해도 됨

    (기말과제의 주제와 조금이라도 관련성이 있어야함)

[관련링크]