Reinforcement Learning vs LLM - Search Videos

Reinforcement Learning with LLMs: a new era of AI agents

Reinforcement Learning with LLMs: a new era of AI agents

5.2K views4 months ago

YouTubeShaw Talebi

What is Reinforcement Fine-Tuning (RFT) - Supervised vs. RL LLM Re-training

What is Reinforcement Fine-Tuning (RFT) - Supervised vs. RL LLM Re-training

3.9K viewsMar 16, 2025

YouTubeWhat's AI by Louis-François Bouchard

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

118.6K views11 months ago

YouTubeAI Engineer

Why Reinforcement Learning Unlocks Reasoning in LLMs (Aha Moments Explained)

Why Reinforcement Learning Unlocks Reasoning in LLMs (Aha Moments Explained)

2.6K views5 months ago

YouTubeAI Papers Academy

GDPO Explained: NVIDIA Fixes GRPO for LLM Reinforcement Learning

GDPO Explained: NVIDIA Fixes GRPO for LLM Reinforcement Learning

3.6K views4 months ago

YouTubeAI Papers Academy

Huggingface TRL vs Unsloth RL: Reinforcement Learning Frameworks. How to fine tuning LLMs - Gemma 4

Huggingface TRL vs Unsloth RL: Reinforcement Learning Frameworks. How to fine tuning LLMs - Gemma 4

244 views2 months ago

YouTubeByte Goose AI.

What are Large Reasoning Models? | LLMs vs. LRMs Explained

What are Large Reasoning Models? | LLMs vs. LRMs Explained

287 views3 months ago

YouTubeTestMu AI (Formerly LambdaTest)

Preference Alignment & RLHF in LLMs Explained | RLHF, PPO, DPO, ORPO, RL Basics & Practical Part-1

633 views4 weeks ago

YouTubeSunny Savita

LLM vs. SLM vs. FM: Choosing the Right AI Model

68K views5 months ago

YouTubeIBM Technology

Reinforcement Learning for LLMs in 2025

15.6K viewsFeb 10, 2025

YouTubeTrelis Research

Reinforcement Learning: A (practical) introduction

9.2K views5 months ago

YouTubeShaw Talebi

[UCLA RL-LLM] Chapter 3.1: Reinforcement learning from human feedback (PPO, DPO)

2.3K views11 months ago

YouTubeErnest Ryu

Microsoft Agent Lightning: Next-Gen LLM Reinforcement Learning Framework Explained

930 views7 months ago

YouTubeAI Learning Hub - Byte-Size AI Learn

State of LLMs 2026: RLVR, GRPO, Inference Scaling — Sebastian Raschka

19.3K views4 months ago

YouTubeThe MAD Podcast with Matt Turck

Reinforcement Learning with Verifiable Rewards - Teaching LLMs to Solve Problems

6.1K views7 months ago

YouTubeAdam Lucek

[UCLA RL-LLM] Chapter 0: Course outline and prologue

13.3K views11 months ago

YouTubeErnest Ryu

LLMs in 2026: What’s Real, What’s Hype, and What’s Coming Next

3.2K views4 months ago

YouTubeInfo-Tech Research Group

Reinforcement learning is terrible – Andrej Karpathy

114.2K views8 months ago

YouTubeDwarkesh Clips

See more