Reinforcement Learning

Vor ein paar Wochen habe ich DreamerV2 entdeckt. Es scheint eine gute Wahl zu sein, besonders wenn die Trainingszeit von Reinforcement-Learning-Agenten ein entscheidender Faktor in der durchgeführten Forschung ist. In diesen Tagen versuche ich, einige Reinforcement Learning Agenten im CARLA-Simulator mit DreamerV2 zu implementieren. Im Moment habe ich jedoch noch einige „errors“, aber ich hoffe, [...]

Heute habe ich das Vergnügen, Ihnen die erste Forschungsarbeit vorzustellen, an der ich seit Beginn meiner Tätigkeit als Postdoc in Oldenburg als Hauptautor beteiligt bin: „Increasing the Safety of Adaptive Cruise Control using Physics-guided Reinforcement Learning„, die heute im Energies Journal, Sonderausgabe „Advances in Automated Driving Systems„, angenommen wurde. An diesem Forschungsartikel, der Teil der [...]

High-End Use Case in CARLA

Ich arbeite derzeit an einer Forschungsarbeit, in der ich versuche, Vorwissen in einen High-End-Use-Case (UC) zu integrieren, der aus einer Kombination von Adaptive Cruise Control, Overtaking und Pedestrian UCs besteht. Da es sich um eine Forschungsarbeit handelt, die im Rahmen des KI-Wissen-Projekts veröffentlicht wird, kann ich Ihnen zum jetzigen Zeitpunkt keine weiteren Einzelheiten mitteilen, so [...]

Deep Learning Nieselregen

Ich habe seit ein paar Wochen keinen Beitrag geschrieben, da ich beschäftigt in Rumänien war wegen mein Promotionsstudium die ich in halbes Jahr erfolgreich beenden möchte. Heute habe ich etwas sehr interessant gefunden, und zwar: Deep Learning Drizzle oder Deep Learning Nieselregen, wenn Sie möchten :)) Bringen Sie sich in Deep Learning, Reinforcement Learning, Machine [...]

Google hat ein paar Tagen vorher das Einführung eines neuen Rahmens für flexible und reproduzierbare Forschung im Bereich des verstärkten Lernens (Reinforcement Learning) hier präsentiert. Dopamine ist ein Forschungsrahmenwerk für schnelles Prototyping von Verstärkungslernalgorithmen. Es zielt darauf ab, den Bedarf an einer kleinen, leicht zu knackenden Codebasis zu decken, in der Benutzer frei mit wilden Ideen [...]