METHOD AND APPARATUS FOR BUILDING PREDICTION MODELS FROM CUSTOMER WEB LOGS

A computer-implemented method and an apparatus to facilitate building of prediction models from customer Web logs includes receiving a Web log including unstructured data and structured data corresponding to a customer's journey on a Website. The structured data in the Web log is used to genera...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SRI, R. Mathangi, SINGH, Bhupinder
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A computer-implemented method and an apparatus to facilitate building of prediction models from customer Web logs includes receiving a Web log including unstructured data and structured data corresponding to a customer's journey on a Website. The structured data in the Web log is used to generate structured variables and the unstructured data in the Web log is used to generate unstructured variables. The generated structured and unstructured variables are concatenated to form a session string, which serves as a textual representation of the customer's journey on the Website. The session string is subjected to text-based processing to generate a plurality of features. The plurality of features are used to build one or more prediction models for facilitating prediction of at least one response variable corresponding to the customers visiting the Website. La présente invention porte sur un procédé mis en œuvre par ordinateur et sur un appareil permettant de faciliter la construction de modèles de prédiction à partir de blogues de client, lesdits procédé et appareil comprennent la réception d'un blogue comprenant des données non structurées et des données structurées correspondant à une navigation d'un client sur un site Web. Les données structurées dans le blogue sont utilisées pour générer des variables structurées et les données non structurées dans le blogue sont utilisées pour générer des variables non structurées. Les variables structurées et non structurées générées sont concaténées afin de former une chaîne de sessions, qui fait office de représentation textuelle de la navigation du client sur le site Web. La chaîne de sessions est soumise à un traitement à base de texte pour générer une pluralité de caractéristiques. Les multiples caractéristiques sont utilisées pour construire un ou plusieurs modèles de prédiction pour faciliter la prédiction d'au moins une variable de réponse correspondant aux clients consultant le site Web.