搜索‘大模型强化学习’结果

代码实现大模型强化学习(PPO)，看这个视频就够了。

代码实现大模型强化学习(PPO)，看这个视频就够了。

作者：RethinkFun

观看：47,319次

弹幕：60

上传时间：2024-09-29

相关: 人工智能大模型强化学习 LLM PPO

DeepSeek-R1深度解读，大模型+强化学习重挫英伟达！

DeepSeek-R1深度解读，大模型+强化学习重挫英伟达！

作者：ZOMI酱

观看：107,692次

弹幕：120

上传时间：2025-01-21

相关: 英伟达人工智能计算幻方大模型昇腾 DeepSeek

李宏毅：一堂课搞懂AI Agent原理【生成式AI的机器学习(2025)】大模型LLM

李宏毅：一堂课搞懂AI Agent原理【生成式AI的机器学习(2025)】大模型LLM

作者：AI大模型进化论

观看：1,821次

弹幕：16

上传时间：2025-03-29

相关: 人工智能机器学习李宏毅深度学习大模型强化学习 Agent LLM 生成式AI AI Agent

DeepSeek-R1核心算法GRPO讲解-从强化学习0基础->PPO->GRPO

DeepSeek-R1核心算法GRPO讲解-从强化学习0基础->PPO->GRPO

作者：紫陌洛西

观看：13,286次

弹幕：6

上传时间：2025-02-09

相关: RF 大模型 flappy bird LLM GRPO PPO deepseek 大模型强化学习 deepseek-r1

【走进RL强化学习】奖励模型Reward Model训练

【走进RL强化学习】奖励模型Reward Model训练

作者：小鱼儿at青岛

观看：5,263次

弹幕：0

上传时间：2025-02-03

相关: R1 RL 强化学习 PPO DeepSeek Reward Model

【迪哥谈AI】大模型必备的强化学习教程来了！绝对是2023年讲的最好的强化学习零基础入门到精通完整版教程（含实战源码）

【迪哥谈AI】大模型必备的强化学习教程来了！绝对是2023年讲的最好的强化学习零基础入门到精通完整版教程（含实战源码）

作者：迪哥谈AI

观看：12,781次

弹幕：73

上传时间：2023-12-31

相关: 科学科技人工智能机器学习神经网络深度学习大模型强化学习迪哥谈AI 2023热门年度盘点 2023年度科技榜单

一口气读懂“大模型强化学习”｜Deepseek R1 论文｜AlphaGo｜RLHF｜卡帕西对大模型未来的预测

一口气读懂“大模型强化学习”｜Deepseek R1 论文｜AlphaGo｜RLHF｜卡帕西对大模型未来的预测

作者：一枚卓子

观看：1,219次

弹幕：0

上传时间：2025-03-21

相关: 人工智能 AI 大模型强化学习 DeepseekR1 DeepSeek爆火充电星计划

一个故事秒懂强化学习与GRPO！

一个故事秒懂强化学习与GRPO！

作者：懂点AI事儿

观看：7,761次

弹幕：15

上传时间：2025-03-05

相关: RL 通俗易懂强化学习 LLM GRPO PPO deepseek DeepSeek

【全748集】目前B站最全最细的AI大模型零基础全套教程，2025最新版，包含所有干货！七天就能从小白到大神！少走99%的弯路！存下吧！很难找全的！

【全748集】目前B站最全最细的AI大模型零基础全套教程，2025最新版，包含所有干货！七天就能从小白到大神！少走99%的弯路！存下吧！很难找全的！

作者：大模型官方课程

观看：1,149,991次

弹幕：3,630

上传时间：2024-12-20

相关: RAG 大模型 Transformer Agent LLM 私有化部署 AI大模型提示词工程 Langchain 大模型微调

大模型面经--强化学习篇

大模型面经--强化学习篇

作者：qiongsuan

观看：3,044次

弹幕：1

上传时间：2024-10-07

相关: NLP 大模型面经

【AI大模型与强化学习】大模型DeepSeek R1训练全流程流程详解！GRPO算法原理详解;强化学习赋能大模型本质是什么!大模型课程大模型蒸馏人工智能课程

【AI大模型与强化学习】大模型DeepSeek R1训练全流程流程详解！GRPO算法原理详解;强化学习赋能大模型本质是什么!大模型课程大模型蒸馏人工智能课程

作者：卢菁老师_北大AI博士后

观看：38,037次

弹幕：30

上传时间：2025-02-04

相关: 人工智能 AI 大模型强化学习人工智能课程大模型训练大模型微调 deepseekr1 grpo

10大模型全栈-强化学习03-RLHF原理以及流程介绍

10大模型全栈-强化学习03-RLHF原理以及流程介绍

作者：大模型解码室

观看：6,083次

弹幕：5

上传时间：2024-06-17

相关: 强化学习 nlp Actor Model RLHF原理 Reference Model Critic Model Reward Model

零基础学习强化学习算法：ppo

零基础学习强化学习算法：ppo

作者：RethinkFun

观看：81,182次

弹幕：367

上传时间：2024-06-10

相关: 人工智能深度学习强化学习 GAE PPO 梯度策略 HFRL

大模型PPO训练part1 —— 强化学习入门基础（基础概念，actor-critic方法等）

大模型PPO训练part1 —— 强化学习入门基础（基础概念，actor-critic方法等）

作者：紫陌洛西

观看：4,290次

弹幕：4

上传时间：2025-01-11

相关: RF 强化学习 PPO actor-critic value-based 大模型强化学习 policy-based LLM PPO

【大模型+强化学习】怎么理解大模型训练中的RLHF（人类反馈强化学习）？ChatGPT背后的数学原理

【大模型+强化学习】怎么理解大模型训练中的RLHF（人类反馈强化学习）？ChatGPT背后的数学原理

作者：计算机视觉与图像处理

观看：1,359次

弹幕：21

上传时间：2024-09-30

相关: 数学人工智能 AI 机器学习深度学习大模型强化学习深度强化学习 ChatGPT 人类反馈强化学习

QMT量化交易——强化学习 | FinRL | 大模型量化 | 智能体策略

QMT量化交易——强化学习 | FinRL | 大模型量化 | 智能体策略

作者：交易回战

观看：5,457次

弹幕：5

上传时间：2025-02-23

相关: 金融股票人工智能财经投资股市量化交易 A股强化学习青年用「财」图鉴青年用「财」图鉴5.0

【贪心2024】最新大模型微调开发训练营

【贪心2024】最新大模型微调开发训练营

作者：IT面试官表哥

观看：17,849次

弹幕：10

上传时间：2024-06-22

相关: 模型科技编程训练营贪心 Spring Cloud 分布式架构

上海交大张伟楠强化学习课程第15讲：AI Agent与决策大模型I

上海交大张伟楠强化学习课程第15讲：AI Agent与决策大模型I

作者：张伟楠SJTU

观看：3,539次

弹幕：2

上传时间：2024-09-09

相关: 人工智能上海交大强化学习

【卢菁老师说】大模型训练为什么要用强化学习

【卢菁老师说】大模型训练为什么要用强化学习

作者：卢菁老师_北大AI博士后

观看：3,383次

弹幕：0

上传时间：2023-05-23

相关: 人工智能 AI 机器学习神经网络强化学习 nlp 模型训练 AIGC chatgpt

2025重新修订！李宏毅机器学习+深度学习+强化学习+Transformer+NLP+大模型一套200集，最全整理收录，李宏毅老师带你一次性学完人工智能全部知识

2025重新修订！李宏毅机器学习+深度学习+强化学习+Transformer+NLP+大模型一套200集，最全整理收录，李宏毅老师带你一次性学完人工智能全部知识

作者：AI技术星球QAQ

观看：2,698次

弹幕：1

上传时间：2025-03-21

相关: 学习人工智能 NLP 机器学习李宏毅神经网络深度学习大模型人工智能入门教程 Transformer教程

推荐视频

⚜4K超清⚜『森林』自然风光和浪漫音乐，优美轻松的音乐 • 放松电影《我们的星球》

⚜4K超清⚜『森林』自然风光和浪漫音乐，优美轻松的音乐 • 放松电影《我们的星球》

作者：Trance_Chai

观看：652,487次

弹幕：786

上传时间：2021-12-14

相关: 放松音乐自然放松电影 4K 治愈向冥想森林大自然自然风光地球

⚜4K超清⚜ 10小时🕊️瑞士令人惊叹的美丽自然与舒缓的轻松音乐〃蒂姆·珍妮斯 (Tim Janis)

⚜4K超清⚜ 10小时🕊️瑞士令人惊叹的美丽自然与舒缓的轻松音乐〃蒂姆·珍妮斯 (Tim Janis)

作者：Trance_Chai

观看：281,638次

弹幕：290

上传时间：2022-01-07

相关: 放松音乐放松电影 4K 冥想自然风光环球旅行风景放松瑞士 Tim Janis

【China中国 4K】美景极致享受 - By Scenic Relaxation

【China中国 4K】美景极致享受 - By Scenic Relaxation

作者：笨蹦崩

观看：352,377次

弹幕：670

上传时间：2022-10-23

相关: 风景摄影美丽中国 4K 自然风光旅游航拍唯美减压大自然

迷人的自然风光，舒缓的音乐放松音乐疗法

迷人的自然风光，舒缓的音乐放松音乐疗法

作者：静音乐屋

观看：184次

弹幕：0

上传时间：2025-02-02

相关: 治愈放松冥想静心助眠

【4K】阿尔卑斯山 - 绝美风景休闲放松影片

【4K】阿尔卑斯山 - 绝美风景休闲放松影片

作者：夏末TnT-纪实影像录

观看：1,545,047次

弹幕：4,629

上传时间：2021-10-04

相关: 风景旅行旅游摄影美景自然 4K 风光阿尔卑斯山航拍

自然风光和安静音乐，优美放松

自然风光和安静音乐，优美放松

作者：静音乐屋

观看：2,649次

弹幕：0

上传时间：2024-12-27

相关: 音乐风景轻音乐放松减压

地球上最惊艳的100个风景【4k测试】【转载】

地球上最惊艳的100个风景【4k测试】【转载】

作者：D3c0mp0s3r

观看：28,258次

弹幕：15

上传时间：2021-07-19

相关: 风景美景 4K 旅游大自然地理 YOUTUBE 自然风光延时摄影航拍

16K 视频超高清杜比视界 HDR - 舒缓的音乐与美丽的自然风光

16K 视频超高清杜比视界 HDR - 舒缓的音乐与美丽的自然风光

作者：洛天依上单

观看：9,671次

弹幕：16

上传时间：2024-10-06

相关: 自然风光生活记录

美国摄影师彼得·里克Peter Lik风光摄影作品（一）

美国摄影师彼得·里克Peter Lik风光摄影作品（一）

作者：摄影档案

观看：59,161次

弹幕：178

上传时间：2022-08-25

相关: 摄影摄影师风景旅行旅游艺术自然风光风光旅拍

10年走遍中国所有省，这些自然风光最美！

10年走遍中国所有省，这些自然风光最美！

作者：谢石头的Nowhere

观看：13,807次

弹幕：2

上传时间：2023-03-08

相关: 2023-bilibili出行达人征集令 2023的第一场旅行中国风景走遍中国记录自然风光