セミナー概要
セミナーのテーマ
- 深層強化学習の基礎と理論
- 最新の強化学習アルゴリズム(PPO, SACなど)
- ロボット制御への応用とSim-to-Real転移
こんな方におすすめです
- 深層強化学習の基礎を学びたい方
- ロボット制御の実装を目指す方
- フィジカルAIの最新動向を知りたい方
割引特典つきセミナー
- 開催日時
- 2026年2月16日(月)13:00~17:00
- 受講料(定価)
- 46,200円(税込、資料付)
ロボット制御のための深層強化学習入門と最前線~フィジカルAIを支える中核理論~
〇問題設定等の基礎から、行われてきた様々な理論・アルゴリズムの改善と、国内外の最新ヒューマノイドロボットが採用している強化学習の主要な枠組みまで。
〇深層強化学習の基礎から最新動向まで、目的意識ベースで体系的に解説します!
講師
国立情報学研究所 情報学プリンシプル研究系 助教 小林 泰介 氏
2016年9月に名古屋大学大学院を修了,博士(工学)取得.2016年11月から2022年3月まで奈良先端大学院大学助教.2022年4月から現在まで国立情報学研究所/総合研究大学院大学助教.
2016年4月から10月まで日本学術振興会特別研究員,2018年5月から2019年3月までミュンヘン工科大学滞在研究員,2020年12月から2022年3月までJSTさきがけ研究者.
専門はロボットの運動制御,機械学習理論.
セミナー趣旨、ポイント
強化学習(Reinforcement Learning: RL)は、近年のフィジカルAIを支える中核的な理論の一つとして、大きな期待が寄せられています。本セミナーでは、ロボットの高度な運動制御技術の最前線とも言える強化学習について、以下の内容を目的意識ベースで体系的に解説します。
基礎:強化学習の問題設定(マルコフ決定過程など)のレベルから、基礎を固めます。
理論とアルゴリズム:深層強化学習(Deep RL)としてこれまで行われてきた様々な理論・アルゴリズムの改善について、その背景と目的を明確にしながら解説します。
最新の枠組み:世界的に開発・量産が急加速している最新ヒューマノイドロボットが採用している、近年の強化学習の主要な枠組みについても、そのエッセンスを簡潔にご紹介します。
本セミナーを通して、受講者の皆様が強化学習をロボット制御に応用するための確かな基礎知識と、最新動向を理解する視点を養うことを目指します。
受講対象者、必要な予備知識
大学1~2年度の数学知識(線形代数、微積分・偏微分、確率)
こんな方におすすめ
・深層強化学習の基礎知識を身につけたい方
・最先端のロボット制御を実装したい方
・近年のフィジカルAIについて理解を深めたい方
得られる知識
・深層強化学習の基礎
・ロボット制御に関する最新動向
など
プログラム
1.強化学習とは
1.1 強化学習の目的
1.2 マルコフ決定過程
1.3 学習すべき要素
2.基礎となるアルゴリズム
2.1 価値関数の学習:TD学習
2.2 方策関数の学習:方策勾配法
3.深層強化学習への発展
3.1 学習を安定化・効率化させるテクニック
3.1.1 経験再生
3.1.2 ターゲットネットワーク
3.2 最新のActor-Criticアルゴリズム
3.2.1 方策更新の制限:PPO
3.2.2 方策エントロピーの最大化:SAC
4.モデルベース強化学習
4.1 世界モデルの学習
4.2 世界モデルの活用例
5.ドメイン知識を活用した発展
5.1 Sim-to-Real転移
5.2 Guided強化学習
<質疑応答>
受付中
| セミナータイトル | ロボット制御のための深層強化学習入門と最前線~フィジカルAIを支える中核理論~ |
| 開催日時 | 2026年2月16日(月)13:00~17:00 【見逃し視聴】 例:2/6(月)開催 セミナー → 2/10(金)までに配信開始 → 2/17(金)まで視聴可能 |
| 開催場所/配信の補足・注意事項 | オンライン受講(見逃し視聴なし) or オンライン受講(見逃し視聴あり) ●配布資料はPDF等のデータで送付予定です。受取方法はメールでご案内致します。(開催1週前~前日までには送付致します) |
| 受講料 | 46,200円(税込、資料付) 【オンライン受講(見逃し視聴なし)】:1名 46,200円(税込(消費税10%)、資料付) |
| 主催 | 情報機構 |
受付中
