Suchergebnisse - Nagireddy, Manish

1

Alignment Studio: Aligning Large Language Models to Particular Contextual Regulations von Achintalwar, Swapnaja, Baldini, Ioana, Bouneffouf, Djallel, Byamugisha, Joan, Chang, Maria, Dognin, Pierre, Farchi, Eitan, Makondo, Ndivhuwo, Mojsilovic, Aleksandra, Nagireddy, Manish, NatesanRamamurthy, Karthikeyan, Padhi, Inkit, Raz, Orna, Rios, Jesus, Sattigeri, Prasanna, Singh, Moninder, Thwala, Siphiwe, Uceda-Sosa, Rosario A., Varshney, Kush R.

Veröffentlicht in IEEE internet computing

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails von Nagireddy, Manish, Padhi, Inkit, Ghosh, Soumya, Sattigeri, Prasanna

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

SocialStigmaQA: A Benchmark to Uncover Stigma Amplification in Generative Language Models von Nagireddy, Manish, Chiazor, Lamogha, Singh, Moninder, Baldini, Ioana

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

Programming Refusal with Conditional Activation Steering von Lee, Bruce W, Padhi, Inkit, Ramamurthy, Karthikeyan Natesan, Miehling, Erik, Dognin, Pierre, Nagireddy, Manish, Dhurandhar, Amit

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Value Alignment from Unstructured Text von Padhi, Inkit, Ramamurthy, Karthikeyan Natesan, Sattigeri, Prasanna, Nagireddy, Manish, Dognin, Pierre, Varshney, Kush R

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Language Models in Dialogue: Conversational Maxims for Human-AI Interactions von Miehling, Erik, Nagireddy, Manish, Sattigeri, Prasanna, Daly, Elizabeth M, Piorkowski, David, Richards, John T

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Keeping Up with the Language Models: Systematic Benchmark Extension for Bias Auditing von Baldini, Ioana, Yadav, Chhavi, Nagireddy, Manish, Das, Payel, Varshney, Kush R

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

The RealHumanEval: Evaluating Large Language Models' Abilities to Support Programmers von Mozannar, Hussein, Chen, Valerie, Alsobay, Mohammed, Das, Subhro, Zhao, Sebastian, Wei, Dennis, Nagireddy, Manish, Sattigeri, Prasanna, Talwalkar, Ameet, Sontag, David

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Function Composition in Trustworthy Machine Learning: Implementation Choices, Insights, and Questions von Nagireddy, Manish, Singh, Moninder, Hoffman, Samuel C, Ju, Evaline, Ramamurthy, Karthikeyan Natesan, Varshney, Kush R

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

Multi-Level Explanations for Generative Language Models von Paes, Lucas Monteiro, Wei, Dennis, Do, Hyo Jin, Strobelt, Hendrik, Luss, Ronny, Dhurandhar, Amit, Nagireddy, Manish, Ramamurthy, Karthikeyan Natesan, Sattigeri, Prasanna, Geyer, Werner, Ghosh, Soumya

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Contextual Moral Value Alignment Through Context-Based Aggregation von Dognin, Pierre, Rios, Jesus, Luss, Ronny, Padhi, Inkit, Riemer, Matthew D, Liu, Miao, Sattigeri, Prasanna, Nagireddy, Manish, Varshney, Kush R, Bouneffouf, Djallel

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

A Sandbox Tool to Bias(Stress)-Test Fairness Algorithms von Akpinar, Nil-Jana, Nagireddy, Manish, Stapleton, Logan, Cheng, Hao-Fei, Zhu, Haiyi, Wu, Steven, Heidari, Hoda

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails von Nagireddy, Manish, Padhi, Inkit, Ghosh, Soumya, Sattigeri, Prasanna

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

SocialStigmaQA: A Benchmark to Uncover Stigma Amplification in Generative Language Models von Nagireddy, Manish, Chiazor, Lamogha, Singh, Moninder, Baldini, Ioana

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

Exploring How Machine Learning Practitioners (Try To) Use Fairness Toolkits von Deng, Wesley Hanwen, Nagireddy, Manish, Ah Lee, Michelle Seng, Singh, Jatinder, Wu, Zhiwei Steven, Holstein, Kenneth, Zhu, Haiyi

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Keeping Up with the Language Models: Systematic Benchmark Extension for Bias Auditing von Baldini, Ioana, Yadav, Chhavi, Nagireddy, Manish, Das, Payel, Varshney, Kush R

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Programming Refusal with Conditional Activation Steering von Lee, Bruce W, Padhi, Inkit, Karthikeyan Natesan Ramamurthy, Miehling, Erik, Dognin, Pierre, Nagireddy, Manish, Dhurandhar, Amit

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

Value Alignment from Unstructured Text von Padhi, Inkit, Karthikeyan Natesan Ramamurthy, Sattigeri, Prasanna, Nagireddy, Manish, Dognin, Pierre, Varshney, Kush R

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Alignment Studio: Aligning Large Language Models to Particular Contextual Regulations von Achintalwar, Swapnaja, Baldini, Ioana, Bouneffouf, Djallel, Byamugisha, Joan, Chang, Maria, Dognin, Pierre, Farchi, Eitan, Makondo, Ndivhuwo, Mojsilovic, Aleksandra, Nagireddy, Manish, Ramamurthy, Karthikeyan Natesan, Padhi, Inkit, Raz, Orna, Rios, Jesus, Sattigeri, Prasanna, Singh, Moninder, Thwala, Siphiwe, Uceda-Sosa, Rosario A, Varshney, Kush R

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Language Models in Dialogue: Conversational Maxims for Human-AI Interactions von Miehling, Erik, Nagireddy, Manish, Sattigeri, Prasanna, Daly, Elizabeth M, Piorkowski, David, Richards, John T

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails von Nagireddy, Manish, Padhi, Inkit, Ghosh, Soumya, Sattigeri, Prasanna

SocialStigmaQA: A Benchmark to Uncover Stigma Amplification in Generative Language Models von Nagireddy, Manish, Chiazor, Lamogha, Singh, Moninder, Baldini, Ioana

Programming Refusal with Conditional Activation Steering von Lee, Bruce W, Padhi, Inkit, Ramamurthy, Karthikeyan Natesan, Miehling, Erik, Dognin, Pierre, Nagireddy, Manish, Dhurandhar, Amit

Value Alignment from Unstructured Text von Padhi, Inkit, Ramamurthy, Karthikeyan Natesan, Sattigeri, Prasanna, Nagireddy, Manish, Dognin, Pierre, Varshney, Kush R

Language Models in Dialogue: Conversational Maxims for Human-AI Interactions von Miehling, Erik, Nagireddy, Manish, Sattigeri, Prasanna, Daly, Elizabeth M, Piorkowski, David, Richards, John T

Keeping Up with the Language Models: Systematic Benchmark Extension for Bias Auditing von Baldini, Ioana, Yadav, Chhavi, Nagireddy, Manish, Das, Payel, Varshney, Kush R

The RealHumanEval: Evaluating Large Language Models' Abilities to Support Programmers von Mozannar, Hussein, Chen, Valerie, Alsobay, Mohammed, Das, Subhro, Zhao, Sebastian, Wei, Dennis, Nagireddy, Manish, Sattigeri, Prasanna, Talwalkar, Ameet, Sontag, David

Function Composition in Trustworthy Machine Learning: Implementation Choices, Insights, and Questions von Nagireddy, Manish, Singh, Moninder, Hoffman, Samuel C, Ju, Evaline, Ramamurthy, Karthikeyan Natesan, Varshney, Kush R

Multi-Level Explanations for Generative Language Models von Paes, Lucas Monteiro, Wei, Dennis, Do, Hyo Jin, Strobelt, Hendrik, Luss, Ronny, Dhurandhar, Amit, Nagireddy, Manish, Ramamurthy, Karthikeyan Natesan, Sattigeri, Prasanna, Geyer, Werner, Ghosh, Soumya

Contextual Moral Value Alignment Through Context-Based Aggregation von Dognin, Pierre, Rios, Jesus, Luss, Ronny, Padhi, Inkit, Riemer, Matthew D, Liu, Miao, Sattigeri, Prasanna, Nagireddy, Manish, Varshney, Kush R, Bouneffouf, Djallel

A Sandbox Tool to Bias(Stress)-Test Fairness Algorithms von Akpinar, Nil-Jana, Nagireddy, Manish, Stapleton, Logan, Cheng, Hao-Fei, Zhu, Haiyi, Wu, Steven, Heidari, Hoda

When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails von Nagireddy, Manish, Padhi, Inkit, Ghosh, Soumya, Sattigeri, Prasanna

SocialStigmaQA: A Benchmark to Uncover Stigma Amplification in Generative Language Models von Nagireddy, Manish, Chiazor, Lamogha, Singh, Moninder, Baldini, Ioana

Exploring How Machine Learning Practitioners (Try To) Use Fairness Toolkits von Deng, Wesley Hanwen, Nagireddy, Manish, Ah Lee, Michelle Seng, Singh, Jatinder, Wu, Zhiwei Steven, Holstein, Kenneth, Zhu, Haiyi

Keeping Up with the Language Models: Systematic Benchmark Extension for Bias Auditing von Baldini, Ioana, Yadav, Chhavi, Nagireddy, Manish, Das, Payel, Varshney, Kush R

Programming Refusal with Conditional Activation Steering von Lee, Bruce W, Padhi, Inkit, Karthikeyan Natesan Ramamurthy, Miehling, Erik, Dognin, Pierre, Nagireddy, Manish, Dhurandhar, Amit

Value Alignment from Unstructured Text von Padhi, Inkit, Karthikeyan Natesan Ramamurthy, Sattigeri, Prasanna, Nagireddy, Manish, Dognin, Pierre, Varshney, Kush R

Language Models in Dialogue: Conversational Maxims for Human-AI Interactions von Miehling, Erik, Nagireddy, Manish, Sattigeri, Prasanna, Daly, Elizabeth M, Piorkowski, David, Richards, John T

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle