Suchergebnisse - Schoots, Nandi

1

The Propensity for Density in Feed-forward Models von Nandi Schoots, Jackson, Alex, Kholmovaia, Ali, McBurney, Peter, Shanahan, Murray

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Dissecting Language Models: Machine Unlearning via Selective Pruning von Pochinkov, Nicholas, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

Low-Entropy Latent Variables Hurt Out-of-Distribution Performance von Schoots, Nandi, Cope, Dylan

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

Any Deep ReLU Network is Shallow von Villani, Mattia Jacopo, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Training Neural Networks for Modularity aids Interpretability von Golechha, Satvik, Cope, Dylan, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Learning to Communicate with Strangers via Channel Randomisation Methods von Cope, Dylan, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Dissecting Language Models: Machine Unlearning via Selective Pruning von Pochinkov, Nicholas, Nandi Schoots

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Extending Activation Steering to Broad Skills and Multiple Behaviours von van der Weij, Teun, Poesio, Massimo, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Low-Entropy Latent Variables Hurt Out-of-Distribution Performance von Nandi Schoots, Cope, Dylan

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

Improving Activation Steering in Language Models with Mean-Centring von Jorgensen, Ole, Cope, Dylan, Schoots, Nandi, Shanahan, Murray

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Comparing Optimization Targets for Contrast-Consistent Search von Fry, Hugo, Fallows, Seamus, Fan, Ian, Wright, Jamie, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

Hidden in Plain Text: Emergence & Mitigation of Steganographic Collusion in LLMs von Mathew, Yohan, Matthews, Ollie, McCarthy, Robert, Velja, Joan, de Witt, Christian Schroeder, Cope, Dylan, Schoots, Nandi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

Any Deep ReLU Network is Shallow von Villani, Mattia Jacopo, Nandi Schoots

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

Training Neural Networks for Modularity aids Interpretability von Golechha, Satvik, Cope, Dylan, Nandi Schoots

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

Learning to Communicate with Strangers via Channel Randomisation Methods von Cope, Dylan, Nandi Schoots

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Extending Activation Steering to Broad Skills and Multiple Behaviours von Teun van der Weij, Poesio, Massimo, Nandi Schoots

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

A theory of representation learning gives a deep generalisation of kernel methods von Yang, Adam X, Robeyns, Maxime, Milsom, Edward, Anson, Ben, Schoots, Nandi, Aitchison, Laurence

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

Improving Activation Steering in Language Models with Mean-Centring von Jorgensen, Ole, Cope, Dylan, Nandi Schoots, Shanahan, Murray

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Comparing Optimization Targets for Contrast-Consistent Search von Fry, Hugo, Fallows, Seamus, Fan, Ian, Wright, Jamie, Nandi Schoots

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

A theory of representation learning gives a deep generalisation of kernel methods von Yang, Adam X, Robeyns, Maxime, Milsom, Edward, Anson, Ben, Nandi Schoots, Aitchison, Laurence

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

The Propensity for Density in Feed-forward Models von Nandi Schoots, Jackson, Alex, Kholmovaia, Ali, McBurney, Peter, Shanahan, Murray

Dissecting Language Models: Machine Unlearning via Selective Pruning von Pochinkov, Nicholas, Schoots, Nandi

Low-Entropy Latent Variables Hurt Out-of-Distribution Performance von Schoots, Nandi, Cope, Dylan

Any Deep ReLU Network is Shallow von Villani, Mattia Jacopo, Schoots, Nandi

Training Neural Networks for Modularity aids Interpretability von Golechha, Satvik, Cope, Dylan, Schoots, Nandi

Learning to Communicate with Strangers via Channel Randomisation Methods von Cope, Dylan, Schoots, Nandi

Dissecting Language Models: Machine Unlearning via Selective Pruning von Pochinkov, Nicholas, Nandi Schoots

Extending Activation Steering to Broad Skills and Multiple Behaviours von van der Weij, Teun, Poesio, Massimo, Schoots, Nandi

Low-Entropy Latent Variables Hurt Out-of-Distribution Performance von Nandi Schoots, Cope, Dylan

Improving Activation Steering in Language Models with Mean-Centring von Jorgensen, Ole, Cope, Dylan, Schoots, Nandi, Shanahan, Murray

Comparing Optimization Targets for Contrast-Consistent Search von Fry, Hugo, Fallows, Seamus, Fan, Ian, Wright, Jamie, Schoots, Nandi

Hidden in Plain Text: Emergence & Mitigation of Steganographic Collusion in LLMs von Mathew, Yohan, Matthews, Ollie, McCarthy, Robert, Velja, Joan, de Witt, Christian Schroeder, Cope, Dylan, Schoots, Nandi

Any Deep ReLU Network is Shallow von Villani, Mattia Jacopo, Nandi Schoots

Training Neural Networks for Modularity aids Interpretability von Golechha, Satvik, Cope, Dylan, Nandi Schoots

Learning to Communicate with Strangers via Channel Randomisation Methods von Cope, Dylan, Nandi Schoots

Extending Activation Steering to Broad Skills and Multiple Behaviours von Teun van der Weij, Poesio, Massimo, Nandi Schoots

A theory of representation learning gives a deep generalisation of kernel methods von Yang, Adam X, Robeyns, Maxime, Milsom, Edward, Anson, Ben, Schoots, Nandi, Aitchison, Laurence

Improving Activation Steering in Language Models with Mean-Centring von Jorgensen, Ole, Cope, Dylan, Nandi Schoots, Shanahan, Murray

Comparing Optimization Targets for Contrast-Consistent Search von Fry, Hugo, Fallows, Seamus, Fan, Ian, Wright, Jamie, Nandi Schoots

A theory of representation learning gives a deep generalisation of kernel methods von Yang, Adam X, Robeyns, Maxime, Milsom, Edward, Anson, Ben, Nandi Schoots, Aitchison, Laurence

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle