搜索‘大模型强化学习算法’结果

DeepSeek-R1深度解读，大模型+强化学习重挫英伟达！

DeepSeek-R1深度解读，大模型+强化学习重挫英伟达！

作者：ZOMI酱

观看：108,072次

弹幕：120

上传时间：2025-01-21

相关: 英伟达人工智能计算幻方大模型昇腾 DeepSeek

代码实现大模型强化学习(PPO)，看这个视频就够了。

代码实现大模型强化学习(PPO)，看这个视频就够了。

作者：RethinkFun

观看：48,397次

弹幕：62

上传时间：2024-09-29

相关: 人工智能大模型强化学习 LLM PPO

QMT量化交易——强化学习 | FinRL | 大模型量化 | 智能体策略

QMT量化交易——强化学习 | FinRL | 大模型量化 | 智能体策略

作者：交易回战

观看：5,580次

弹幕：5

上传时间：2025-02-23

相关: 金融股票人工智能财经投资股市量化交易 A股强化学习青年用「财」图鉴青年用「财」图鉴5.0

【走进RL强化学习】奖励模型Reward Model训练

【走进RL强化学习】奖励模型Reward Model训练

作者：小鱼儿at青岛

观看：5,350次

弹幕：0

上传时间：2025-02-03

相关: R1 RL 强化学习 PPO DeepSeek Reward Model

【AI大模型与强化学习】大模型DeepSeek R1训练全流程流程详解！GRPO算法原理详解;强化学习赋能大模型本质是什么!大模型课程大模型蒸馏人工智能课程

【AI大模型与强化学习】大模型DeepSeek R1训练全流程流程详解！GRPO算法原理详解;强化学习赋能大模型本质是什么!大模型课程大模型蒸馏人工智能课程

作者：卢菁老师_北大AI博士后

观看：38,133次

弹幕：30

上传时间：2025-02-04

相关: 人工智能 AI 大模型强化学习人工智能课程大模型训练大模型微调 deepseekr1 grpo

【大模型+强化学习】1小时搞懂大语言模型人类反馈强化学习RLHF算法PPO！ChatGPT、数学

【大模型+强化学习】1小时搞懂大语言模型人类反馈强化学习RLHF算法PPO！ChatGPT、数学

作者：唐宇迪AI研究所

观看：367次

弹幕：15

上传时间：2024-10-16

相关: 人工智能机器学习神经网络深度学习大模型强化学习深度强化学习 PPO算法 ChatGPT 人类反馈强化学习

简明讲解-有模型强化学习 Model-based Reinforcement Learning

简明讲解-有模型强化学习 Model-based Reinforcement Learning

作者：陈戈诺

观看：4,980次

弹幕：5

上传时间：2022-09-10

相关: Model-based RL 基于模型的强化学习有模型强化学习强化学习机器学习人工智能规划与优化控制

直播回放 | 具身大模型强化学习微调技术分享与讨论

直播回放 | 具身大模型强化学习微调技术分享与讨论

作者：地瓜机器人D-Robotics

观看：2,487次

弹幕：2

上传时间：2025-01-10

相关: 机器人计算机人工智能机器学习深度学习技术分享大模型 RDK 具身智能地瓜机器人

【卢菁老师说】大模型训练为什么要用强化学习

【卢菁老师说】大模型训练为什么要用强化学习

作者：卢菁老师_北大AI博士后

观看：3,386次

弹幕：0

上传时间：2023-05-23

相关: 人工智能 AI 机器学习神经网络强化学习 nlp 模型训练 AIGC chatgpt

5分钟搞清楚什么是强化学习

5分钟搞清楚什么是强化学习

作者：是花子呀_

观看：102,087次

弹幕：203

上传时间：2025-03-17

相关: 科普科技人工智能 RL 机器学习 ai 强化学习图灵奖 AI IN ALL！理查德萨顿

【AI大模型】十分钟彻底搞懂AI大模型底层原理！带你从0构建对大模型的认知！小白也能看懂！

【AI大模型】十分钟彻底搞懂AI大模型底层原理！带你从0构建对大模型的认知！小白也能看懂！

作者：咕泡AI大模型

观看：101,321次

弹幕：207

上传时间：2024-12-19

相关: 人工智能 AI 干货机器学习深度学习大模型 LLM AI大模型大语言模型大模型教程

强化学习遇上优化-Q learning for最短路

强化学习遇上优化-Q learning for最短路

作者：技术杂货铺_

观看：3,897次

弹幕：4

上传时间：2023-11-23

相关: Python 强化学习 Q-learning

大模型面经--强化学习篇

大模型面经--强化学习篇

作者：qiongsuan

观看：3,087次

弹幕：1

上传时间：2024-10-07

相关: NLP 大模型面经

DeepSeek-R1核心算法GRPO讲解-从强化学习0基础->PPO->GRPO

DeepSeek-R1核心算法GRPO讲解-从强化学习0基础->PPO->GRPO

作者：紫陌洛西

观看：13,647次

弹幕：6

上传时间：2025-02-09

相关: RF 大模型 flappy bird LLM GRPO PPO deepseek 大模型强化学习 deepseek-r1

零基础学习强化学习算法：ppo

零基础学习强化学习算法：ppo

作者：RethinkFun

观看：83,220次

弹幕：372

上传时间：2024-06-10

相关: 人工智能深度学习强化学习 GAE PPO 梯度策略 HFRL

10大模型全栈-强化学习03-RLHF原理以及流程介绍

10大模型全栈-强化学习03-RLHF原理以及流程介绍

作者：大模型解码室

观看：6,133次

弹幕：5

上传时间：2024-06-17

相关: 强化学习 nlp Actor Model RLHF原理 Reference Model Critic Model Reward Model

1小时居然就搞懂了深度强化学习DQN算法及训练！计算机博士详解深度Q学习原理+实例演示+DQN改进与应用技巧！

1小时居然就搞懂了深度强化学习DQN算法及训练！计算机博士详解深度Q学习原理+实例演示+DQN改进与应用技巧！

作者：会AI的哈利波特

观看：34,600次

弹幕：46

上传时间：2024-12-14

相关: 科技人工智能 AI 神经网络深度学习计算机技术强化学习深度强化学习 DQN算法深度Q学习

强化学习 2 无模型学习

强化学习 2 无模型学习

作者：teacher_tu

观看：721次

弹幕：0

上传时间：2022-12-17

相关: 深度学习强化学习机器学习

【大白话03】一文理清强化学习RL基本原理 | 原理图解+公式推导

【大白话03】一文理清强化学习RL基本原理 | 原理图解+公式推导

作者：吃花椒的麦

观看：6,751次

弹幕：12

上传时间：2025-03-27

相关: 教程科普人工智能科研深度学习强化学习 GRPO PPO 图解算法大语言模型

夜话DeepSeek：技术原理与未来方向大规模强化学习技术原理与大模型技术发展研判

夜话DeepSeek：技术原理与未来方向大规模强化学习技术原理与大模型技术发展研判

作者：中国计算机学会

观看：7,850次

弹幕：2

上传时间：2025-02-07

相关: 人工智能 AI 芯片大模型 DeepSeek 推理模型清华大学刘知远

推荐视频

⚜4K超清⚜『森林』自然风光和浪漫音乐，优美轻松的音乐 • 放松电影《我们的星球》

⚜4K超清⚜『森林』自然风光和浪漫音乐，优美轻松的音乐 • 放松电影《我们的星球》

作者：Trance_Chai

观看：652,487次

弹幕：786

上传时间：2021-12-14

相关: 放松音乐自然放松电影 4K 治愈向冥想森林大自然自然风光地球

⚜4K超清⚜ 10小时🕊️瑞士令人惊叹的美丽自然与舒缓的轻松音乐〃蒂姆·珍妮斯 (Tim Janis)

⚜4K超清⚜ 10小时🕊️瑞士令人惊叹的美丽自然与舒缓的轻松音乐〃蒂姆·珍妮斯 (Tim Janis)

作者：Trance_Chai

观看：281,638次

弹幕：290

上传时间：2022-01-07

相关: 放松音乐放松电影 4K 冥想自然风光环球旅行风景放松瑞士 Tim Janis

【China中国 4K】美景极致享受 - By Scenic Relaxation

【China中国 4K】美景极致享受 - By Scenic Relaxation

作者：笨蹦崩

观看：352,377次

弹幕：670

上传时间：2022-10-23

相关: 风景摄影美丽中国 4K 自然风光旅游航拍唯美减压大自然

迷人的自然风光，舒缓的音乐放松音乐疗法

迷人的自然风光，舒缓的音乐放松音乐疗法

作者：静音乐屋

观看：184次

弹幕：0

上传时间：2025-02-02

相关: 治愈放松冥想静心助眠

【4K】阿尔卑斯山 - 绝美风景休闲放松影片

【4K】阿尔卑斯山 - 绝美风景休闲放松影片

作者：夏末TnT-纪实影像录

观看：1,545,047次

弹幕：4,629

上传时间：2021-10-04

相关: 风景旅行旅游摄影美景自然 4K 风光阿尔卑斯山航拍

自然风光和安静音乐，优美放松

自然风光和安静音乐，优美放松

作者：静音乐屋

观看：2,649次

弹幕：0

上传时间：2024-12-27

相关: 音乐风景轻音乐放松减压

地球上最惊艳的100个风景【4k测试】【转载】

地球上最惊艳的100个风景【4k测试】【转载】

作者：D3c0mp0s3r

观看：28,258次

弹幕：15

上传时间：2021-07-19

相关: 风景美景 4K 旅游大自然地理 YOUTUBE 自然风光延时摄影航拍

16K 视频超高清杜比视界 HDR - 舒缓的音乐与美丽的自然风光

16K 视频超高清杜比视界 HDR - 舒缓的音乐与美丽的自然风光

作者：洛天依上单

观看：9,671次

弹幕：16

上传时间：2024-10-06

相关: 自然风光生活记录

美国摄影师彼得·里克Peter Lik风光摄影作品（一）

美国摄影师彼得·里克Peter Lik风光摄影作品（一）

作者：摄影档案

观看：59,161次

弹幕：178

上传时间：2022-08-25

相关: 摄影摄影师风景旅行旅游艺术自然风光风光旅拍

10年走遍中国所有省，这些自然风光最美！

10年走遍中国所有省，这些自然风光最美！

作者：谢石头的Nowhere

观看：13,807次

弹幕：2

上传时间：2023-03-08

相关: 2023-bilibili出行达人征集令 2023的第一场旅行中国风景走遍中国记录自然风光