- Леонид Мурашов - Model-based RL в обучении агентов для онлайн .io игр
- Степан Макаренко - Solving Unity Pyramids tasks with Curiosity
- Дмитрий Еремеев и Алексей Пустынников - Dynamic Attention Model for Vehicle Routing Problems
- Екатерина Крупник и Леонид Морозов и Михаил Тетерин - Non-Monotonic Sequential Text Generation
- Галина Фоминская и Никита Драгунов - Exploration by Random Network Distillation
- Алексей Гришанов - Reinforcement Learning for Recommendation Systems
Запись трансляции доступна по ссылке.