QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS

Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or att...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ITER, Dan, XU, Yichong, ZHU, Chenguang, ZHANG, Yi, LEE, Yin Tat, QIN, Lijuan, PRYZANT, Reid Allen, ELDAN, Ronen, HUANG, Xuedong, LI, Yuanzhi, ZENG, Nanshan, BUBECK, Sebastien, FANG, Yuwei
Format: Patent
Sprache:eng ; fre
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator ITER, Dan
XU, Yichong
ZHU, Chenguang
ZHANG, Yi
LEE, Yin Tat
QIN, Lijuan
PRYZANT, Reid Allen
ELDAN, Ronen
HUANG, Xuedong
LI, Yuanzhi
ZENG, Nanshan
BUBECK, Sebastien
FANG, Yuwei
description Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results. L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2024258584A2</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2024258584A2</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2024258584A23</originalsourceid><addsrcrecordid>eNrjZHALDHX08QyJVHAMDg4NcvRzdlVw8w9ScPF09wxx9FEIcXX28PP38Xf3dA1WCA329HNX8HEMcncFkn7uoY5Ahq-_i6tPMA8Da1piTnEqL5TmZlB2cw1x9tBNLciPTy0uSExOzUstiQ_3NzIwMjEytTC1MHE0MiZOFQBxWy1f</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><source>esp@cenet</source><creator>ITER, Dan ; XU, Yichong ; ZHU, Chenguang ; ZHANG, Yi ; LEE, Yin Tat ; QIN, Lijuan ; PRYZANT, Reid Allen ; ELDAN, Ronen ; HUANG, Xuedong ; LI, Yuanzhi ; ZENG, Nanshan ; BUBECK, Sebastien ; FANG, Yuwei</creator><creatorcontrib>ITER, Dan ; XU, Yichong ; ZHU, Chenguang ; ZHANG, Yi ; LEE, Yin Tat ; QIN, Lijuan ; PRYZANT, Reid Allen ; ELDAN, Ronen ; HUANG, Xuedong ; LI, Yuanzhi ; ZENG, Nanshan ; BUBECK, Sebastien ; FANG, Yuwei</creatorcontrib><description>Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results. L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.</description><language>eng ; fre</language><creationdate>2024</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20241219&amp;DB=EPODOC&amp;CC=WO&amp;NR=2024258584A2$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76290</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20241219&amp;DB=EPODOC&amp;CC=WO&amp;NR=2024258584A2$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>ITER, Dan</creatorcontrib><creatorcontrib>XU, Yichong</creatorcontrib><creatorcontrib>ZHU, Chenguang</creatorcontrib><creatorcontrib>ZHANG, Yi</creatorcontrib><creatorcontrib>LEE, Yin Tat</creatorcontrib><creatorcontrib>QIN, Lijuan</creatorcontrib><creatorcontrib>PRYZANT, Reid Allen</creatorcontrib><creatorcontrib>ELDAN, Ronen</creatorcontrib><creatorcontrib>HUANG, Xuedong</creatorcontrib><creatorcontrib>LI, Yuanzhi</creatorcontrib><creatorcontrib>ZENG, Nanshan</creatorcontrib><creatorcontrib>BUBECK, Sebastien</creatorcontrib><creatorcontrib>FANG, Yuwei</creatorcontrib><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><description>Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results. L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.</description><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2024</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZHALDHX08QyJVHAMDg4NcvRzdlVw8w9ScPF09wxx9FEIcXX28PP38Xf3dA1WCA329HNX8HEMcncFkn7uoY5Ahq-_i6tPMA8Da1piTnEqL5TmZlB2cw1x9tBNLciPTy0uSExOzUstiQ_3NzIwMjEytTC1MHE0MiZOFQBxWy1f</recordid><startdate>20241219</startdate><enddate>20241219</enddate><creator>ITER, Dan</creator><creator>XU, Yichong</creator><creator>ZHU, Chenguang</creator><creator>ZHANG, Yi</creator><creator>LEE, Yin Tat</creator><creator>QIN, Lijuan</creator><creator>PRYZANT, Reid Allen</creator><creator>ELDAN, Ronen</creator><creator>HUANG, Xuedong</creator><creator>LI, Yuanzhi</creator><creator>ZENG, Nanshan</creator><creator>BUBECK, Sebastien</creator><creator>FANG, Yuwei</creator><scope>EVB</scope></search><sort><creationdate>20241219</creationdate><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><author>ITER, Dan ; XU, Yichong ; ZHU, Chenguang ; ZHANG, Yi ; LEE, Yin Tat ; QIN, Lijuan ; PRYZANT, Reid Allen ; ELDAN, Ronen ; HUANG, Xuedong ; LI, Yuanzhi ; ZENG, Nanshan ; BUBECK, Sebastien ; FANG, Yuwei</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2024258584A23</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2024</creationdate><toplevel>online_resources</toplevel><creatorcontrib>ITER, Dan</creatorcontrib><creatorcontrib>XU, Yichong</creatorcontrib><creatorcontrib>ZHU, Chenguang</creatorcontrib><creatorcontrib>ZHANG, Yi</creatorcontrib><creatorcontrib>LEE, Yin Tat</creatorcontrib><creatorcontrib>QIN, Lijuan</creatorcontrib><creatorcontrib>PRYZANT, Reid Allen</creatorcontrib><creatorcontrib>ELDAN, Ronen</creatorcontrib><creatorcontrib>HUANG, Xuedong</creatorcontrib><creatorcontrib>LI, Yuanzhi</creatorcontrib><creatorcontrib>ZENG, Nanshan</creatorcontrib><creatorcontrib>BUBECK, Sebastien</creatorcontrib><creatorcontrib>FANG, Yuwei</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>ITER, Dan</au><au>XU, Yichong</au><au>ZHU, Chenguang</au><au>ZHANG, Yi</au><au>LEE, Yin Tat</au><au>QIN, Lijuan</au><au>PRYZANT, Reid Allen</au><au>ELDAN, Ronen</au><au>HUANG, Xuedong</au><au>LI, Yuanzhi</au><au>ZENG, Nanshan</au><au>BUBECK, Sebastien</au><au>FANG, Yuwei</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><date>2024-12-19</date><risdate>2024</risdate><abstract>Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results. L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2024258584A2
source esp@cenet
title QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T17%3A28%3A17IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=ITER,%20Dan&rft.date=2024-12-19&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2024258584A2%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true