Apprentissage de renforcement pour l'ergonomie des sites Web

Un système mis en œuvre par ordinateur est fourni pour construire et adapter dynamiquement un site de recherche hébergé par un serveur web. Un module d'apprentissage renforcé est couplé au serveur web et utilise un modèle d'apprentissage renforcé pour contrôler l'apparence et/ou la fo...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: RENAUDIE, David, DELAHAYE, Thierry
Format: Patent
Sprache:fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Un système mis en œuvre par ordinateur est fourni pour construire et adapter dynamiquement un site de recherche hébergé par un serveur web. Un module d'apprentissage renforcé est couplé au serveur web et utilise un modèle d'apprentissage renforcé pour contrôler l'apparence et/ou la fonctionnalité du site web de recherche en générant des actions à envoyer au serveur web. Ces actions ont trait au contrôle d'une liste ordonnée de recommandations de voyage obtenue comme résultat de la recherche, qui est affichée par le site web de recherche. Le module d'apprentissage de renforcement est adapté pour recevoir des récompenses, qui sont générées par le site web de recherche sur la base des entrées de l'utilisateur ou par un simulateur d'utilisateur du site web en réponse à une ou plusieurs des actions générées par le module d'apprentissage de renforcement. Les récompenses adaptent le modèle d'apprentissage de renforcement du module d'apprentissage de renforcement. Le simulateur d'utilisateur du site web simule un comportement de saisie de l'utilisateur et alimente le module d'apprentissage de renforcement pour former le module d'apprentissage de renforcement. Figure pour l'abrégé : Fig. 1 Computer-implemented systems and methods for dynamically building and adapting a search website hosted by a webserver. A learning module is coupled to the webserver and employs a reinforcement learning model for controlling appearance and/or functionality of the search website by generating actions to be output to the webserver. The actions relate to controlling an order of elements in an ordered list of travel recommendations obtained as a result from a search request to be displayed by the search website and/or arranging web-site controls on the search website. The reinforcement learning module receives rewards that are generated by the search website based on user input on the search website or by a website user simulator in response to one or more of the actions generated by the learning module based on state information provided by the user simulator. The rewards make the learning module to adapt the learning model.