AKTIONSINFORMATIONS-LERNVORRICHTUNG, AKTIONSINFORMATIONS-OPTIMIERUNGSSYSTEM UND AKTIONSINFORMATIONS-LERNPROGRAMM

Aktionsinformations-Lernvorrichtung (300), umfassend:ein Zustandsinformations-Erfassungsmittel (310) zum Erfassen einer Zustandsinformation, beinhaltend ein Betriebsmuster einer Spindel und eine Kombination von Parametern, die sich auf die Bearbeitung durch eine Werkzeugmaschine (100) beziehen, was...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Inaguchi, Yuuzou, Tong, Zheng, Nishimura, Takuma
Format: Patent
Sprache:ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Aktionsinformations-Lernvorrichtung (300), umfassend:ein Zustandsinformations-Erfassungsmittel (310) zum Erfassen einer Zustandsinformation, beinhaltend ein Betriebsmuster einer Spindel und eine Kombination von Parametern, die sich auf die Bearbeitung durch eine Werkzeugmaschine (100) beziehen, was eine Kombination des Betriebsmusters, das eine Schneidvorschubgeschwindigkeit und/oder eine Haltezeit, um die Spindel dazu zu bringen, eine bezeichnete Zeit lang in Bereitschaft zu sein, enthält, und des Parameters, der eine Zeitkonstante von Beschleunigung oder Verlangsamung und/oder eine Schneidvorschubgeschwindigkeitsüberschreibung enthält, ist;ein Aktionsinformations-Ausgabemittel (320) zum Ausgeben von Aktionsinformation, die eine Justierinformation für das Betriebsmuster und die Kombination von Parametern, die in der Zustandsinformation enthalten sind, beinhaltet;ein Vergütungsrechenmittel (331) zum Erfassen einer Bewertungsinformation, die eine Information für die Temperatur der Werkzeugmaschine (100) und eine Bearbeitungszeit ist, wobei die Bearbeitungszeit sich auf die Bearbeitung durch die Werkzeugmaschine (100) bezieht, und Berechnen eines Wertes einer Vergütung zum Verstärkungslernen, basierend auf der so erfassten Bewertungsinformation; undein Wertfunktions-Aktualisierungsmittel (332) zum Aktualisieren einer Wertefunktion durch Durchführen des Verstärkungslernens, basierend auf dem Wert der Vergütung, der Zustandsinformation und der Aktionsinformation, wobei das Vergütungsrechenmittel (331)den Wert der Vergütung als einen ersten Negativwert in einem Fall, bei dem die Temperatur der Werkzeugmaschine (100) zumindest auf einer vorbestimmten Temperatur ist, einstellt, undden Wert der Vergütung als einen Positivwert in einem Fall, bei dem die Temperatur der Werkzeugmaschine (100) niedriger ist als eine vorbestimmte Temperatur und eine Bearbeitungszeit der Werkzeugmaschine (100) kürzer als eine frühere Bearbeitungszeit ist, einstellt, undden Wert der Vergütung als einen zweiten Negativwert in einem Fall einstellt, bei dem die Temperatur der Werkzeugmaschine (100) niedriger als eine vorbestimmte Temperatur ist und eine Bearbeitungszeit der Werkzeugmaschine (100) länger als eine frühere Bearbeitungszeit ist. To perform reinforcement learning that enables selecting action information for shortening a cycle time while also avoiding the occurrence of overheating. An action information learning device (300) includes: a state information acquisition means (310)