Изложение статьи от том, что давно известные эволюционные стратегии оптимизации могут превзойти алгоритмы обучения с подкреплением.
Преимущества эволюционных стратегий:
- Простота реализации
- Не требуется обратного распространения
- Легко масштабируется в распределенной среде вычислений
- Малое число гиперпараметров.
Читать дальше →
[Перевод] Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением
Source: habrahabr

