搜索‘grpo微调框架’结果

一个故事秒懂强化学习与GRPO!

一个故事秒懂强化学习与GRPO!

作者:懂点AI事儿

观看:7,757次

弹幕:15

上传时间:2025-03-05

相关: RL 通俗易懂 强化学习 LLM GRPO PPO deepseek DeepSeek

GRPO强化学习微调的理论基础

GRPO强化学习微调的理论基础

作者:逆风引弓

观看:258次

弹幕:0

上传时间:2025-03-21

相关: 人工智能 AI 大模型 GRPO AI IN ALL!

从原理到代码,带你掌握DeepSeek GRPO!

从原理到代码,带你掌握DeepSeek GRPO!

作者:懂点AI事儿

观看:3,455次

弹幕:6

上传时间:2025-03-12

相关: RL 原理 代码 LLM GRPO PPO DeepSeek DeepSeek爆火

通俗易懂理解全量微调和LoRA微调

通俗易懂理解全量微调和LoRA微调

作者:AI老兵文哲

观看:81,527次

弹幕:111

上传时间:2024-07-02

相关: 人工智能 微调 AGI 大模型 多模态大模型 GPT4

【深入浅出】DeepSeek-R1 GRPO算法揭秘

【深入浅出】DeepSeek-R1 GRPO算法揭秘

作者:小鱼儿at青岛

观看:9,219次

弹幕:16

上传时间:2025-02-09

相关: R1 RL 深入浅出 强化学习 GRPO DeepSeek

MLX是Mac上最强的微调框架吗?

MLX是Mac上最强的微调框架吗?

作者:干饭猛人猛干饭

观看:925次

弹幕:0

上传时间:2025-01-21

相关: 人工智能 微调 MLX LoRa Apple Silicon

推荐视频

迷人的自然风光,舒缓的音乐 放松音乐疗法

迷人的自然风光,舒缓的音乐 放松音乐疗法

作者:静音乐屋

观看:184次

弹幕:0

上传时间:2025-02-02

相关: 治愈 放松 冥想 静心 助眠

自然风光和安静音乐,优美放松

自然风光和安静音乐,优美放松

作者:静音乐屋

观看:2,649次

弹幕:0

上传时间:2024-12-27

相关: 音乐 风景 轻音乐 放松 减压