1. Home
  2. Summaries
  3. Channels
  4. N/A
YouTube Channel

N/A

1 video summary available

Back to All Summaries
Reinforcement learning is terrible – Andrej Karpathy
Chapters

Reinforcement learning is terrible – Andrej Karpathy

Проблемы обучения с подкреплением в LLM [00:00] - Обучение с подкреплением (RL) работает хуже, чем принято считать, но оно лучше предыдущих методов, основанных на имитации [00:01] - В RL модель пробуе...

N/A
Oct 18, 2025