Der digitale Wandel und steigender Wettbewerbsdruck verlangen von Produktionsunternehmen mehr Flexibilität und Effizienz als je zuvor. Insbesondere kleine und mittlere Unternehmen stehen vor der Herausforderung, ihre Produktionsprozesse zu automatisieren, um wettbewerbsfähig zu bleiben – eine Aufgabe, die bisher aufgrund des hohen Entwicklungsaufwands häufig nur bei großen Stückzahlen rentabel war. Diese Arbeit zeigt, wie simulationsgestützte Testumgebungen und Reinforcement Learning zusammengeführt werden können, um die Steuerungsentwicklung zu automatisieren und zu optimieren. Durch die Transformation bestehender Simulationsmodelle in Trainingsumgebungen wird nicht nur der Produktionsstart beschleunigt, sondern auch der gesamte Entwicklungsprozess effizienter gestaltet. Im Fokus stehen drei zentrale Herausforderungen: die Umgestaltung der Test- zur Trainingsumgebung, die Integration lernfähiger Agenten in industrielle Steuerungen und die Ableitung sinnvoller Belohnungsfunktionen für Produktionsaufgaben. Mit Lösungsansätzen, praxisnahen Use Cases und innovativen Ansätzen ebnet diese Arbeit den Weg für eine neue Generation smarter Produktionssysteme.