Dopamine, ein Tensorflow-basiertes Reinforcement Learning Framework

Google hat ein paar Tagen vorher das Einführung eines neuen Rahmens für flexible und reproduzierbare Forschung im Bereich des verstärkten Lernens (Reinforcement Learning) hier präsentiert.

Dopamine ist ein Forschungsrahmenwerk für schnelles Prototyping von Verstärkungslernalgorithmen. Es zielt darauf ab, den Bedarf an einer kleinen, leicht zu knackenden Codebasis zu decken, in der Benutzer frei mit wilden Ideen experimentieren können (spekulative Forschung).

Designprinzipien von Dopamine sind:

  • Einfaches Experimentieren
  • Flexible Entwicklung
  • Kompakt und zuverlässig
  • Reproduzierbar

Im Geiste dieser Prinzipien konzentriert sich diese erste Version auf die Unterstützung des hochmodernen, ein-GPU- Rainbow-Agenten ( Hessel et al., 2018 ), der auf das Atari 2600-Spiel angewendet wurde ( Bellemare et al., 2013 ). Insbesondere implementiert Dopamine’s Rainbow-Agent die drei Komponenten, die von Hessel et al. als am wichtigsten identifiziert wurden:

Mehr über wie Sie mit Dopamine spielen können, lesen Sie hier.

 

Leave a Comment

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .