Wie wird die Erkundungsrate in Q-Learning gesteuert?
Durch einen festen Wert
Durch eine Zufallszahl
Overlook minor misbehaviors
Impose harsh punishments for any infraction

Maschinelles Lernen Übungen werden geladen ...