TASK-AWARE RECOMMENDATION OF HYPERPARAMETER CONFIGURATIONS
Providing a task-aware recommendation of hyperparameter configurations for a neural network architecture. First, a joint space of tasks and hyperparameter configurations are constructed using a plurality of tasks (each of which corresponds to a dataset) and a plurality of hyperparameter configuratio...
Gespeichert in:
Hauptverfasser: | , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Providing a task-aware recommendation of hyperparameter configurations for a neural network architecture. First, a joint space of tasks and hyperparameter configurations are constructed using a plurality of tasks (each of which corresponds to a dataset) and a plurality of hyperparameter configurations. The joint space is used as training data to train and optimize a performance prediction network, such that for a given unseen task corresponding to one of the plurality of tasks and a given hyperparameter configuration corresponding to one of the plurality of hyperparameter configurations, the performance prediction network is configured to predict performance that is to be achieved for the unseen task using the hyperparameter configuration.
L'invention concerne la fourniture d'une recommandation sensible aux tâches de configurations d'hyper-paramètre pour une architecture de réseau neuronal. Tout d'abord, un espace conjoint de tâches et des configurations d'hyper-paramètre sont construits à l'aide d'une pluralité de tâches (chacune correspondant à un ensemble de données) et d'une pluralité de configurations d'hyper-paramètre. L'espace conjoint est utilisé en tant que données d'entraînement pour entraîner et optimiser un réseau de prédiction de performances, de telle sorte que, pour une tâche non vue donnée correspondant à l'une de la pluralité de tâches et une configuration d'hyper-paramètre donnée correspondant à l'une de la pluralité de configurations d'hyper-paramètre, le réseau de prédiction de performances soit configuré pour prédire des performances qui doivent être obtenues pour la tâche non vue à l'aide de la configuration d'hyper-paramètre. |
---|