Á¤¼ºÈÆ
    2023 °­È­ÇнÀ ±â¸»°úÁ¦ Á¶Æí¼º ¹× ÁÖÁ¦
2023 °­È­ÇнÀ ±â¸»°úÁ¦ ¸ñ·Ï.hwp [42 KB]    



 

°­È­ÇнÀ ÀÌ·Ð ¹× ½Ç½À (MD) ±â¸»°úÁ¦ Á¶Æí¼º ¹× ÁÖÁ¦

¸ðµç Á¶ °øÅë

* µö·¯´× ¸ðµ¨À» Æ÷ÇÔÇؼ­ °³¹ßÇÏ´Â °Í ±ÇÀå (Áï µö°­È­ÇнÀ ±¸Çö ±ÇÀå)

Á¶

Á¶¿ø

ÁÖÁ¦¸í

±âŸ

1

±è´ëÇÑ, ÀÌÁÖÇü

»õ·Î¿î º¸»óü°è ¿¬±¸

³­À̵µ: Áß»ó (Àû´ç)

ÁÁÀº ÁÖÁ¦·Î¼­ °á°ú°¡ Àß ³ª¿À¸é ³í¹® ÀÛ¼º °¡´ÉÇÔ

2

±è½Â¿ø, ±è¹Î¼®

Cliff walkingÀ» º¯ÇüÇÑ °­È­ÇнÀ

³­À̵µ: ÁßÁß (Àû´ç)

Áö·Ú¸¦ Ãß°¡Çؼ­ ÇÇÇØ°¡°Å³ª jump Çؼ­ °¡µµ·Ï ÇнÀµÇ´ÂÁö È®ÀÎÇÏ´Â °ÍÀ¸·Î¼­ ÀǹÌÀÖÀ½, ´Ù¸¸ ½Ã°£ ¿©À¯°¡ ÀÖÀ¸¸é ´Ù¸¥ Ãß°¡ ¾ÆÀÌÅÛÀ̳ª ±â´Éµµ Å×½ºÆ® Çغ¸´Â °Í ±ÇÀå

3

¹ÚÁ¤Çö

µö °­È­ÇнÀÀ» »ç¿ëÇÑ ¾ÏȣȭÆó ÀÚµ¿ ¸Å¸Å ½Ã½ºÅÛ

³­À̵µ: »óÁß (¾î´ÀÁ¤µµ ¾î·Á¿ò)

ÇнÀµ¥ÀÌÅ͸¦ Àß È®º¸ÇÏ°í ȯ°æÀÇ »óÅÂ¿Í ¿¡ÀÌÀüÆ®ÀÇ ÇൿÀ» Àß ¼³°èÇÏ°í °­È­ÇнÀ ¾Ë°í¸®ÁòÀ» Àß ¼±ÅÃÇؾßÇÔ, DQNÀº °¡Ä¡±â¹ÝÀ¸·Î Çൿ °ø°£ÀÌ ÀÌ»êÀûÀÎ °æ¿ì Àß µ¿ÀÛÇϳª ¿¬¼ÓÀûÀÎ °æ¿ì ¾î·Á¿ò, Çൿ °ø°£À» ¿¬¼ÓÀ¸·Î Çϱâ À§Çؼ­´Â Á¤Ã¥±â¹Ý PPO ¾Ë°í¸®ÁòÀÌ ÁÁÀ½

4

°­ÁøÈñ

Gym ȯ°æ¿¡¼­ Àå¾Ö¹° MountainCar °­È­ÇнÀ

³­À̵µ: ÁßÇÏ (Àû´ç)

Gym ȯ°æ¿¡¼­ ÃÖ¼ÒÇÑÀÇ ¿¬·á·Î Àå¾Ö¹°ÀÌ ÀÖ´Â ¾ð´ö ²À´ë±â¿¡ ¿À¸£´Â ¹®Á¦¸¦ °­È­ÇнÀÀ¸·Î ÇØ°á

¹Ì ¹ßÇ¥ÀÚ:

¹Ì ¹ßÇ¥ÀÚ´Â ÃÖ´ëÇÑ »¡¸® ¹ßÇ¥ÀڷḦ ¸¸µé¾î ³ªÀÇ À̸ÞÀÏ(shjung@hansung.ac.kr)·Î º¸³¾ °Í!!!

 

  µî·ÏÀÏ : 2023-11-01 [14:54] Á¶È¸ : 121 ´Ù¿î : 172   
 
¡â ÀÌÀü±Û±â¸»°úÁ¦ ÁÖÁ¦ ¼±Á¤ ½Ã °í·ÁÇØ¾ß ÇÒ »çÇ×µé (°è¼Ó ¾÷µ¥ÀÌÆ®) ¡Ú¡Ú¡Ú
¡ä ´ÙÀ½±Û±â¸»°úÁ¦ ±Ç°í »çÇ× (°è¼Ó ¾÷µ¥ÀÌÆ®)
°­È­ÇнÀ ÀÌ·Ð ¹× ½Ç½À
¹øÈ£ ¨Ï Á¦ ¸ñ À̸§ Á¶È¸ µî·ÏÀÏ
±â¸»°úÁ¦ ÁÖÁ¦ ¼±Á¤ ½Ã °í·ÁÇØ¾ß ÇÒ »çÇ×µé (°è¼Ó ¾÷µ¥ÀÌÆ®) ¡Ú¡Ú¡Ú
°­È­ÇнÀ °ü·Ã ÁÁÀº »çÀÌÆ®
°­È­ÇнÀ °ü·Ã ÀÚ·á
¹Ù´ÚºÎÅÍ ¹è¿ì´Â °­È­ ÇнÀ (°­ÀdzëÆ® Àüü)
47 ±â¸»°úÁ¦ ÁÖÁ¦ ¼±Á¤ ½Ã °í·ÁÇØ¾ß ÇÒ »çÇ×µé (°è¼Ó ¾÷µ¥ÀÌÆ®) ¡Ú¡Ú¡Ú Á¤¼ºÈÆ 86 11-04
46 2023 °­È­ÇнÀ ±â¸»°úÁ¦ Á¶Æí¼º ¹× ÁÖÁ¦ Á¤¼ºÈÆ 121 11-01
45 ±â¸»°úÁ¦ ±Ç°í »çÇ× (°è¼Ó ¾÷µ¥ÀÌÆ®) Á¤¼ºÈÆ 58 10-27
44 °­È­ÇнÀ ÁÁÀº ÀÎÅÍ³Ý ÀÚ·á Á¤¼ºÈÆ 112 01-27
43 ¦¦❶ l(GitBook) ¡Ú¡Ú¡Ú Fundamental of Reinforcement Learning Á¤¼ºÈÆ 79 01-27
42 2022 °­È­ÇнÀ ±â¸»°úÁ¦ Á¶Æí¼º ¹× ÁÖÁ¦ Á¤¼ºÈÆ 111 11-03
41 °­È­ÇнÀ °ü·Ã ÁÁÀº »çÀÌÆ® Á¤¼ºÈÆ 233 11-17
40 2021 °­È­ÇнÀ ±â¸»°úÁ¦ Á¶Æí¼º ¹× ÁÖÁ¦ Á¤¼ºÈÆ 154 11-02
39 °­È­ÇнÀ °ü·Ã ÀÚ·á Á¤¼ºÈÆ 240 09-18
38 ¦¦❶ lAn Introduction to Reinforcement Learning with OpenAI Gym, RLlib, and Google Colab Á¤¼ºÈÆ 41 10-31
37 ¦¦❶ ½ÉÃþ°­È­ÇнÀÀ» ÀÌ¿ëÇÑ ¹ÝµµÃ¼ ´ÙÀÌÁ¢Âø°øÁ¤ÀÇ ÃÖÀûÈ­ ºñ°ø°³ Á¤¼ºÈÆ 0 09-19
36 ¦¦❶ °­È­ ÇнÀ ¾Ë°í¸®Áò ¼º´É ºñ±³ ºÐ¼®À» À§ÇÑ Ã౸ °ÔÀÓ ÀΰøÁö´É ¼³°è ¹× ±¸Çö ºñ°ø°³ Á¤¼ºÈÆ 1 09-19
35 ¦¦❶ °­È­ÇнÀÀ» ÀÌ¿ëÇÑ °ÝÅõ°ÔÀÓ ÀΰøÁö´É ¼³°è ¹× ±¸Çö ºñ°ø°³ Á¤¼ºÈÆ 0 09-19
34 ¦¦❶ µ¥ÀÌÅÍ ±â¹ÝÀÇ °­È­ÇнÀÀ» ÅëÇÑ ¼±¹Ú ÀÚÀ² ¿îÇ׿¡ °üÇÑ ¿¬±¸ ºñ°ø°³ Á¤¼ºÈÆ 0 09-19
33 ¦¦❶ °­È­ÇнÀÀ» ÀÌ¿ëÇÑ ´ëÀü AI ¼³°è ¹× ±¸Çö ºñ°ø°³ Á¤¼ºÈÆ 0 09-19

[1][2][3][4]