Ein Agent lernt durch Belohnungen, die besten Aktionen in einer Umgebung auszuführen.
Q-Learning und SARSA sind Algorithmen für unüberwachtes Lernen.
Baroque art features strong contrasts, while Rococo art prefers more subtle transitions
Baroque art is generally larger in scale than Rococo art