QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS
Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or att...
Gespeichert in:
Hauptverfasser: | , , , , , , , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | |
---|---|
container_issue | |
container_start_page | |
container_title | |
container_volume | |
creator | ITER, Dan XU, Yichong ZHU, Chenguang ZHANG, Yi LEE, Yin Tat QIN, Lijuan PRYZANT, Reid Allen ELDAN, Ronen HUANG, Xuedong LI, Yuanzhi ZENG, Nanshan BUBECK, Sebastien FANG, Yuwei |
description | Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results.
L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation. |
format | Patent |
fullrecord | <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2024258584A2</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2024258584A2</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2024258584A23</originalsourceid><addsrcrecordid>eNrjZHALDHX08QyJVHAMDg4NcvRzdlVw8w9ScPF09wxx9FEIcXX28PP38Xf3dA1WCA329HNX8HEMcncFkn7uoY5Ahq-_i6tPMA8Da1piTnEqL5TmZlB2cw1x9tBNLciPTy0uSExOzUstiQ_3NzIwMjEytTC1MHE0MiZOFQBxWy1f</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><source>esp@cenet</source><creator>ITER, Dan ; XU, Yichong ; ZHU, Chenguang ; ZHANG, Yi ; LEE, Yin Tat ; QIN, Lijuan ; PRYZANT, Reid Allen ; ELDAN, Ronen ; HUANG, Xuedong ; LI, Yuanzhi ; ZENG, Nanshan ; BUBECK, Sebastien ; FANG, Yuwei</creator><creatorcontrib>ITER, Dan ; XU, Yichong ; ZHU, Chenguang ; ZHANG, Yi ; LEE, Yin Tat ; QIN, Lijuan ; PRYZANT, Reid Allen ; ELDAN, Ronen ; HUANG, Xuedong ; LI, Yuanzhi ; ZENG, Nanshan ; BUBECK, Sebastien ; FANG, Yuwei</creatorcontrib><description>Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results.
L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.</description><language>eng ; fre</language><creationdate>2024</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20241219&DB=EPODOC&CC=WO&NR=2024258584A2$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76290</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20241219&DB=EPODOC&CC=WO&NR=2024258584A2$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>ITER, Dan</creatorcontrib><creatorcontrib>XU, Yichong</creatorcontrib><creatorcontrib>ZHU, Chenguang</creatorcontrib><creatorcontrib>ZHANG, Yi</creatorcontrib><creatorcontrib>LEE, Yin Tat</creatorcontrib><creatorcontrib>QIN, Lijuan</creatorcontrib><creatorcontrib>PRYZANT, Reid Allen</creatorcontrib><creatorcontrib>ELDAN, Ronen</creatorcontrib><creatorcontrib>HUANG, Xuedong</creatorcontrib><creatorcontrib>LI, Yuanzhi</creatorcontrib><creatorcontrib>ZENG, Nanshan</creatorcontrib><creatorcontrib>BUBECK, Sebastien</creatorcontrib><creatorcontrib>FANG, Yuwei</creatorcontrib><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><description>Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results.
L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.</description><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2024</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZHALDHX08QyJVHAMDg4NcvRzdlVw8w9ScPF09wxx9FEIcXX28PP38Xf3dA1WCA329HNX8HEMcncFkn7uoY5Ahq-_i6tPMA8Da1piTnEqL5TmZlB2cw1x9tBNLciPTy0uSExOzUstiQ_3NzIwMjEytTC1MHE0MiZOFQBxWy1f</recordid><startdate>20241219</startdate><enddate>20241219</enddate><creator>ITER, Dan</creator><creator>XU, Yichong</creator><creator>ZHU, Chenguang</creator><creator>ZHANG, Yi</creator><creator>LEE, Yin Tat</creator><creator>QIN, Lijuan</creator><creator>PRYZANT, Reid Allen</creator><creator>ELDAN, Ronen</creator><creator>HUANG, Xuedong</creator><creator>LI, Yuanzhi</creator><creator>ZENG, Nanshan</creator><creator>BUBECK, Sebastien</creator><creator>FANG, Yuwei</creator><scope>EVB</scope></search><sort><creationdate>20241219</creationdate><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><author>ITER, Dan ; XU, Yichong ; ZHU, Chenguang ; ZHANG, Yi ; LEE, Yin Tat ; QIN, Lijuan ; PRYZANT, Reid Allen ; ELDAN, Ronen ; HUANG, Xuedong ; LI, Yuanzhi ; ZENG, Nanshan ; BUBECK, Sebastien ; FANG, Yuwei</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2024258584A23</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2024</creationdate><toplevel>online_resources</toplevel><creatorcontrib>ITER, Dan</creatorcontrib><creatorcontrib>XU, Yichong</creatorcontrib><creatorcontrib>ZHU, Chenguang</creatorcontrib><creatorcontrib>ZHANG, Yi</creatorcontrib><creatorcontrib>LEE, Yin Tat</creatorcontrib><creatorcontrib>QIN, Lijuan</creatorcontrib><creatorcontrib>PRYZANT, Reid Allen</creatorcontrib><creatorcontrib>ELDAN, Ronen</creatorcontrib><creatorcontrib>HUANG, Xuedong</creatorcontrib><creatorcontrib>LI, Yuanzhi</creatorcontrib><creatorcontrib>ZENG, Nanshan</creatorcontrib><creatorcontrib>BUBECK, Sebastien</creatorcontrib><creatorcontrib>FANG, Yuwei</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>ITER, Dan</au><au>XU, Yichong</au><au>ZHU, Chenguang</au><au>ZHANG, Yi</au><au>LEE, Yin Tat</au><au>QIN, Lijuan</au><au>PRYZANT, Reid Allen</au><au>ELDAN, Ronen</au><au>HUANG, Xuedong</au><au>LI, Yuanzhi</au><au>ZENG, Nanshan</au><au>BUBECK, Sebastien</au><au>FANG, Yuwei</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS</title><date>2024-12-19</date><risdate>2024</risdate><abstract>Systems and methods are provided for implementing quality assurance for digital technologies using language model ("LM")-based artificial intelligence ("AI") and/or machine learning ("ML") systems. In various embodiments, a first prompt is provided to an LM actor or attacker to cause the LM actor or attacker to generate interaction content for interacting with test software. Responses from the test software are then evaluated by an LM evaluator to produce evaluation results. In some examples, a second prompt is generated that includes the responses from the test software along with the evaluation criteria for the test software. When the second prompt is provided to the LM evaluator, the LM evaluator generates the evaluation results.
L'invention concerne des systèmes et des procédés pour mettre en œuvre une assurance qualité pour technologies numériques à l'aide de systèmes d'intelligence artificielle ("AI") et/ou d'apprentissage automatique ("ML") basés sur un modèle de langage ("LM"). Dans divers modes de réalisation, une première invite est fournie à un acteur ou attaquant LM pour amener l'acteur ou attaquant LM à générer un contenu d'interaction pour interagir avec un logiciel test. Des réponses provenant du logiciel test sont ensuite évaluées par un évaluateur LM pour produire des résultats d'évaluation. Dans certains exemples, une seconde invite est générée qui comprend les réponses provenant du logiciel test conjointement avec les critères d'évaluation pour le logiciel test. Lorsque la seconde invite est fournie à l'évaluateur LM, l'évaluateur LM génère les résultats d'évaluation.</abstract><oa>free_for_read</oa></addata></record> |
fulltext | fulltext_linktorsrc |
identifier | |
ispartof | |
issn | |
language | eng ; fre |
recordid | cdi_epo_espacenet_WO2024258584A2 |
source | esp@cenet |
title | QUALITY ASSURANCE FOR DIGITAL TECHNOLOGIES USING LARGE LANGUAGE MODELS |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T17%3A28%3A17IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=ITER,%20Dan&rft.date=2024-12-19&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2024258584A2%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true |