第一周
- 时间:2025.10.11-2025.10.17
- 任务:机器人学基础
- 时长:8h+
- 内容:
- 复习整理过去笔记,包括坐标系、DH、正逆解、运动学/动力学简要等
- 复习自注意力机制与 Tranformer
- 学习 BERT/T5 相关内容
- 笔记:
- 计划:
- 完成 Decoder-Only LLM 系列学习
- 完成 BERT 模型实战
第二周
- 时间:2025.10.18-2025.10.24
- 任务:LLM、RL 与 Diffusion Models 基础
- 时长:16h+
- 内容:
- 了解 LLM 三种模型不同架构的发展演变
- 学习强化学习基本概念及经典算法发展
- 了解强化学习(RLHF)在 LLM 微调阶段的作用
- 了解 Diffusion Models 思想,学习 DDPM 的原理
- 笔记:
- 问题:
- 哪些强化学习经典算法适合深入学习推导+代码?
- RLHF 中的奖励模型是必要的吗?看到一个理论说,SFT 本质上是奖励函数极为单一的 RL,如果用重要性采样修正,就可以让训练效果等同甚至优于 RL;如果用于 RLHF 呢?
- 计划:
第三周
- 时间:2025.10.25-2025.10.31
- 任务:综述阅读
- 时长:6h(本周学校课程 Final Project ddl | QAQ)
- 内容:
- 浏览综述全篇,把握整体框架与内容
- 细读 High-level Planner 模块
- 笔记:
- 问题:
- 计划:
第四周
- 时间:2025.11.1-2025.11.7
- 任务:综述阅读
- 时长:8h
- 内容:
- 笔记:
- 问题:
- VLA 更像一个后期的、概念性的内容,是否从 RL+IL 的项目内容开始学习会更好一些?
- 计划:
第五周
- 时间:2025.11.8-2025.11.14
- 任务:模仿学习基础与项目实践
- 时长:8h
- 内容:
- 了解模仿学习基本概念及经典算法发展
- 安装并熟悉 Isaac Sim 和 Isaac Lab 使用
- 笔记:
- 计划:
第六周
- 时间:2025.11.15-2025.11.21
- 任务:项目实践
- 时长:8h
- 内容:
- 尝试 Isaac Lab 中的遥操作与遥操作数据收集
- 阅读代码和文档,了解基础用法
- 创建自己的任务环境,并使用 Isaac Lab 遥操作收集数据(进行中)
- 笔记:
- 计划:
第七周
- 时间:2025.11.22-2025.11.28
- 任务:项目实践
- 时长:8h
- 内容:
- 创建自己的任务环境
- 使用 Isaac Lab 遥操作收集数据
- 尝试使用 Robomimic 进行数据集扩展
- 笔记:
- 问题:
- 使用键盘收集数据慢且不精确
- 能不能直接使用 LeRobot 收集数据?
- 计划:
第八周
- 时间:2025.11.29-2025.12.5
- 任务:项目实践
- 时长:7h
- 内容:
- 使用 Isaac Lab Mimic 进行数据集扩展
- 笔记:
- 计划:
第九周
- 时间:2025.11.29-2025.12.5
- 任务:项目实践
- 时长:8h
- 内容:
- 问题:
- 数据生成死活跑不通,卡死在 isaacsim 未响应,可能是内存不够
- 笔记:
Reference