搜索‘grpo算法’结果

【深入浅出】DeepSeek-R1 GRPO算法揭秘

【深入浅出】DeepSeek-R1 GRPO算法揭秘

作者:小鱼儿at青岛

观看:9,441次

弹幕:16

上传时间:2025-02-09

相关: R1 RL 深入浅出 强化学习 GRPO DeepSeek

一个故事秒懂强化学习与GRPO!

一个故事秒懂强化学习与GRPO!

作者:懂点AI事儿

观看:8,501次

弹幕:15

上传时间:2025-03-05

相关: RL 通俗易懂 强化学习 LLM GRPO PPO deepseek DeepSeek

从原理到代码,带你掌握DeepSeek GRPO!

从原理到代码,带你掌握DeepSeek GRPO!

作者:懂点AI事儿

观看:4,045次

弹幕:7

上传时间:2025-03-12

相关: RL 原理 代码 LLM GRPO PPO DeepSeek DeepSeek爆火

理解训练DeepSeek推理模型的GRPO算法

理解训练DeepSeek推理模型的GRPO算法

作者:刘靖峰-峰哥讲AI

观看:105次

弹幕:0

上传时间:2025-03-23

相关: GRPO 推理模型 DeepSeek爆火

硬核!使用GRPO复现Deepseek R1训练过程

硬核!使用GRPO复现Deepseek R1训练过程

作者:AI有温度

观看:2,842次

弹幕:0

上传时间:2025-03-08

相关: 算法 人工智能 大模型 强化学习 GRPO PPO DeepSeek

DeepSeek-GRPO

DeepSeek-GRPO

作者:RethinkFun

观看:9,699次

弹幕:13

上传时间:2025-03-11

相关: 深度学习 大模型 强化学习 GRPO PPO DeepSeek DeepSeek R1 DeepSeek爆火

推荐视频

迷人的自然风光,舒缓的音乐 放松音乐疗法

迷人的自然风光,舒缓的音乐 放松音乐疗法

作者:静音乐屋

观看:184次

弹幕:0

上传时间:2025-02-02

相关: 治愈 放松 冥想 静心 助眠

自然风光和安静音乐,优美放松

自然风光和安静音乐,优美放松

作者:静音乐屋

观看:2,649次

弹幕:0

上传时间:2024-12-27

相关: 音乐 风景 轻音乐 放松 减压