• 首页
  • 电脑设计
  • 软件编程
  • 建筑机电
  • 经济管理
  • 资格考试
  • 幼儿教育
  • 中小学教程
  • 大学课程
  • 电商网络
  • 生活服务
  • 综合教程
  • 教程下载网

您的位置:首页 > 综合教程 》 强化学习实战:从基础到AI前沿
  • 教程简介
    本课程专为希望深入掌握强化学习核心技术的学员设计,内容涵盖从基础的线性代数、概率论到高级的深度Q网络、策略梯度及演员评论家算法等。通过实操项目如Gym游戏和大模型RLHF,学员将能够将理论知识应用于实际场景,掌握强化学习的最新趋势和技术,如近端策略优化(PPO)和深度确定性策略梯度(DDPG)。适合有志于在人工智能领域深耕的技术人员和学生。
    以下云资源目录树快照生成于[12个月前],该学习资料由夸克云用户[心旷*怡的青蛙]分享(只展示大部分文件和目录)
    强化学习实战:从基础到AI前沿2.04GB(mp4视频61节;)
    8_4-8-马尔可夫过程代码实现.mp440.23MB
    7_9-7-SAC代码实现.mp435.08MB
    7_6-7-Q-Learning&SARSA代码实现.mp423.78MB
    7_4-7-常见问题解析.mp421.65MB
    6_11-6-基于人类反馈大强化学习.mp447.15MB
    6_9-6-软性演员评论家算法.mp438.57MB
    6_6-6-SARSA算法.mp420.84MB
    6_4-6-模型分类与选择.mp430.84MB
    5_11-5-AlphaStar系统.mp482.38MB
    5_10-5-MBPO的代码实现.mp453.79MB
    5_9-5-DDPG算法代码实现.mp422.5MB
    5_8-5-近端策略优化(PPO)代码实现.mp434.58MB
    5_6-5-Q-Learning算法.mp432.26MB
    5_4-5-贝尔曼方程:迭代求解价值函数.mp430.56MB
    5_3-5-深度学习库PyTorch的安装.mp49.24MB
    4_12-4-下一步的学习建议.mp433.28MB
    4_11-4-MADDP的代码实现.mp445.07MB
    4_10-4-基于模型的策略优化.mp419.66MB
    4_9-4-深度确定性策略梯度.mp430.35MB
    4_8-4-近端策略优化算法.mp436.16MB
    4_7-4-DQN改进算法代码实现.mp431.02MB
    4_6-4-广义策略迭代.mp419.56MB
    4_5-4-动态规划代码实现.mp443.48MB
    4_4-4-马尔可夫奖励过程:懂得“想”.mp449.39MB
    4_3-4-仿真环境Gym安装.mp418.95MB
    3_12-3-强化学习最新发展趋势.mp465.61MB
    3_11-3-多智能体强化学习.mp444.45MB
    3_10-3-Dyna-Q算法代码实现.mp417.74MB
    3_9-3-演员评论家算法代码实现.mp419.74MB
    3_8-3-策略梯度方法代码实现.mp419.41MB
    3_7-3-常见问题改进和扩展.mp427.54MB
    3_6-3-蒙特卡洛方法和时序差分代码实现.mp422.84MB
    3_5-3-价值迭代.mp419.17MB
    3_4-3-马尔可夫决策过程:试着-“干”.mp429.63MB
    3_3-3-Jupyter-Notebook快速上手.mp414.13MB
    3_2-3-概率.mp446.6MB
    3_1-3-课程使用的技术栈.mp412.01MB
    2_12-2-项目实战:大模型RLHF.mp431.35MB
    2_11-2-博弈论与强化学习.mp464.74MB
    2_10-2-Dyna-Q算法.mp444.61MB
    2_9-2-改进型演员评论家算法.mp423.04MB
    2_8-2-蒙特卡洛策略梯度.mp424.23MB
    2_7-2-DQN-代码实现.mp435.82MB
    2_6-2-时序差分方法.mp434.17MB
    2_5-2-策略迭代.mp440.01MB
    2_4-2-马尔可夫观测过程:学会“看”.mp440.93MB
    2_3-2-conda使用命令.mp411.87MB
    2_2-2-微积分.mp430.04MB
    2_1-2-认识强化学习.mp453.78MB
    1_12-1-项目实战:Gym游戏.mp451.39MB
    1_11-1模仿学习.mp448.35MB
    1_10-1-基于模型的强化学习核心思想和原理.mp447.96MB
    1_9-1-演员评论家算法核心思想和原理.mp420.12MB
    1_8-1-策略梯度核心思想和原理.mp444.18MB
    1_7-1-深度Q网络核心思想和原理.mp444.71MB
    1_6-1-蒙特卡洛方法.mp432.5MB
    1_5-1-动态回归核心思想和原理.mp430.86MB
    1_4-1-序列建模与概率图模型.mp438.12MB
    1_3-1-CUDA+Anaconda深度学习环境配置.mp418.73MB
    1_2-1-线性代数.mp426.89MB
    1_1-1-课程内容和理念.mp459.03MB
  • 下载地址
    点击免费下载
  • 教程标签
    强化学习实战 openresty从入门到实战 kotlin从入门到进阶实战 实战 基础

推荐的视频教程榜单

  1. 三年级科学课升级版:与教科版同步学习11-30
  2. 2024高二英语何红艳秋季班:语法阅读写作全突09-25
  3. 2024张亮高二英语寒假班:虚拟语气+阅读写作09-25
  4. 探秘中华文明:60件镇馆之宝的博物馆之旅09-25
  5. 2024高二英语寒假特训班:虚拟语气+阅读写作09-25
  6. 少年编程思维课:提升孩子智力的秘密武器09-25
  7. 2024张亮高二英语尖端班秋季全套课程+笔记09-25
  8. 2024高二英语何红艳尖端班:阅读写作+语法精09-25
  9. Procreate板绘入门:从零到插画大师09-25
  10. 2024高二英语聂宁暑假班(尖端班+课堂笔记+技09-25
  11. 夏莎教你:实用魅力提升术09-25
  12. 台球一杆清台技巧:从入门到精通09-25
  13. 2024张亮高二英语冲顶班·秋季系统课(阅读+09-25
  • 可能感兴趣的视频推荐
  • 2024高二英语寒假特训班:虚拟语气+

    2024高二英语寒假特训班:虚拟语气+

  • 2024张亮高二英语寒假班:虚拟语气+

    2024张亮高二英语寒假班:虚拟语气+

  • 2024高二英语何红艳秋季班:语法阅读

    2024高二英语何红艳秋季班:语法阅读

  • 2024高二英语何红艳尖端班:阅读写作

    2024高二英语何红艳尖端班:阅读写作

  • 2024张亮高二英语尖端班秋季全套课

    2024张亮高二英语尖端班秋季全套课

  • 2024张亮高二英语冲顶班·秋季系统

    2024张亮高二英语冲顶班·秋季系统

  • 2024高二英语聂宁暑假班(尖端班+课

    2024高二英语聂宁暑假班(尖端班+课

  • 何红艳高二英语暑假特训班:倒装句+

    何红艳高二英语暑假特训班:倒装句+

  • 2024张亮高二英语暑假班-阅读完形

    2024张亮高二英语暑假班-阅读完形

  • 2024张亮高二英语冲顶班暑假全套课

    2024张亮高二英语冲顶班暑假全套课

  • 2024高二物理孙竟轩春季班(尖端课+

    2024高二物理孙竟轩春季班(尖端课+

  • 2024高二物理冲顶班:彭娟娟精讲振荡

    2024高二物理冲顶班:彭娟娟精讲振荡

听课网 | 来漫画 | 画涯
All Rights Reserved

免责声明:本站资源来源于网络连接,版权归原作者所有,若有侵犯您的权利,请联系告知,我们将立即予以删除。