搜索‘GRPO’结果

一个故事秒懂强化学习与GRPO!

一个故事秒懂强化学习与GRPO!

作者:懂点AI事儿

观看:7,659次

弹幕:15

上传时间:2025-03-05

相关: RL 通俗易懂 强化学习 LLM GRPO PPO deepseek DeepSeek

从原理到代码,带你掌握DeepSeek GRPO!

从原理到代码,带你掌握DeepSeek GRPO!

作者:懂点AI事儿

观看:3,379次

弹幕:6

上传时间:2025-03-12

相关: RL 原理 代码 LLM GRPO PPO DeepSeek DeepSeek爆火

【深入浅出】DeepSeek-R1 GRPO算法揭秘

【深入浅出】DeepSeek-R1 GRPO算法揭秘

作者:小鱼儿at青岛

观看:9,207次

弹幕:16

上传时间:2025-02-09

相关: R1 RL 深入浅出 强化学习 GRPO DeepSeek

DeepSeek-GRPO

DeepSeek-GRPO

作者:RethinkFun

观看:7,890次

弹幕:9

上传时间:2025-03-11

相关: 深度学习 大模型 强化学习 GRPO PPO DeepSeek DeepSeek R1 DeepSeek爆火

60.DeepSeek专题:什么是GRPO?

60.DeepSeek专题:什么是GRPO?

作者:文言AI

观看:2,057次

弹幕:1

上传时间:2025-03-09

相关: 学习 面试 AI LLM GRPO DeepSeek DeepSeek爆火 DeepSeek基本介绍

PPO与GRPO的本质及其区别

PPO与GRPO的本质及其区别

作者:lemonjesnme

观看:1,394次

弹幕:3

上传时间:2025-02-23

相关: 编程 人工智能 AI 机器学习 seek deep

硬核!使用GRPO复现Deepseek R1训练过程

硬核!使用GRPO复现Deepseek R1训练过程

作者:AI有温度

观看:2,622次

弹幕:0

上传时间:2025-03-08

相关: 算法 人工智能 大模型 强化学习 GRPO PPO DeepSeek

上手代码复现DeepSeek-R1强化学习训练演示

上手代码复现DeepSeek-R1强化学习训练演示

作者:LLM张老师

观看:40,105次

弹幕:23

上传时间:2025-02-03

相关: 强化学习 GRPO DeepSeek DeepSeek-R1

推荐视频

迷人的自然风光,舒缓的音乐 放松音乐疗法

迷人的自然风光,舒缓的音乐 放松音乐疗法

作者:静音乐屋

观看:184次

弹幕:0

上传时间:2025-02-02

相关: 治愈 放松 冥想 静心 助眠

自然风光和安静音乐,优美放松

自然风光和安静音乐,优美放松

作者:静音乐屋

观看:2,649次

弹幕:0

上传时间:2024-12-27

相关: 音乐 风景 轻音乐 放松 减压