CO-DISTILLATION FOR MIXING SERVER-BASED AND FEDERATED LEARNING

A method (300) includes training a client machine learning (ML) model (20) on client training data (121) at a client device (10). While training the client ML model, the method also includes obtaining, from a server (140), server model weights (45) of a server ML model (40) trained on server trainin...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HARD, Andrew, MATHEWS, Rajiv
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method (300) includes training a client machine learning (ML) model (20) on client training data (121) at a client device (10). While training the client ML model, the method also includes obtaining, from a server (140), server model weights (45) of a server ML model (40) trained on server training data (151), the server training data different that the client training data. While training the client ML model, the method also includes: transmitting, to the server, client model weights (25) of the client ML model; updating the client ML model using the server model weights; obtaining, from the server, updated server model weights of the server ML model, the updated server model weights updated based on the transmitted client model weights; and further updating the client ML model using the updated server model weights. Un procédé (300) comprend l'apprentissage d'un modèle d'apprentissage automatique (ML) de client (20) sur des données d'apprentissage de client (121) au niveau d'un dispositif client (10). Pendant l'apprentissage du modèle ML client, le procédé consiste également à obtenir, à partir d'un serveur (140), des poids de modèle serveur (45) d'un modèle ML serveur (40) entraîné sur des données d'apprentissage de serveur (151), les données d'apprentissage de serveur étant différentes des données d'apprentissage de client. Tout en entraînant le modèle ML client, le procédé consiste également : à transmettre, au serveur, des poids de modèle client (25) du modèle ML client ; à mettre à jour le modèle ML client à l'aide des poids de modèle serveur ; à obtenir, à partir du serveur, des poids de modèle serveur mis à jour du modèle ML serveur, les poids de modèle serveur mis à jour étant mis à jour sur la base des poids de modèle client transmis ; et à mettre à jour en outre le modèle ML client à l'aide des poids de modèle serveur mis à jour.