Suchergebnisse - Haimes, Jacob | OPAC THWS

1

View From Above: A Framework for Evaluating Distribution Shifts in Model Behavior von Chopra, Tanush, Li, Michael, Haimes, Jacob

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Rethinking CyberSecEval: An LLM-Aided Approach to Evaluation Critique von Hariharan, Suhas, Majid, Zainab Ali, Veuthey, Jaime Raldua, Haimes, Jacob

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

Benchmark Inflation: Revealing LLM Performance Gaps Using Retro-Holdouts von Haimes, Jacob, Wenner, Cenny, Thaman, Kunvar, Tashev, Vassil, Neo, Clement, Kran, Esben, Schreiber, Jason

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

View From Above: A Framework for Evaluating Distribution Shifts in Model Behavior von Chopra, Tanush, Li, Michael, Haimes, Jacob

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Noise Injection Reveals Hidden Capabilities of Sandbagging Language Models von Tice, Cameron, Kreer, Philipp Alexander, Helm-Burger, Nathan, Shahani, Prithviraj Singh, Ryzhenkov, Fedor, Haimes, Jacob, Hofstätter, Felix, van der Weij, Teun

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Rethinking CyberSecEval: An LLM-Aided Approach to Evaluation Critique von Hariharan, Suhas, Zainab Ali Majid, Veuthey, Jaime Raldua, Haimes, Jacob

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Benchmark Inflation: Revealing LLM Performance Gaps Using Retro-Holdouts von Haimes, Jacob, Wenner, Cenny, Thaman, Kunvar, Tashev, Vassil, Neo, Clement, Kran, Esben, Schreiber, Jason

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Noise Injection Reveals Hidden Capabilities of Sandbagging Language Models von Tice, Cameron, Kreer, Philipp Alexander, Helm-Burger, Nathan, Prithviraj Singh Shahani, Ryzhenkov, Fedor, Haimes, Jacob, Hofstätter, Felix, Teun van der Weij

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Ecclesia Infantum von Keller, Georg Heinrich

Volltext bestellen

Web Resource

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in: