DETECTING HALLUCINATION IN A LANGUAGE MODEL

Various embodiments discussed herein are directed to improving existing technologies by detecting a likelihood of hallucination arising from one-shot, few-shot, or outside knowledge contexts. For example, regarding the one-shot or few-shot contexts, some embodiments determine a set of tokens in a la...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SOMECH, Haim, KANTOR, Amir, MILLER, Adi L, AVIHOO, Assaf
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator SOMECH, Haim
KANTOR, Amir
MILLER, Adi L
AVIHOO, Assaf
description Various embodiments discussed herein are directed to improving existing technologies by detecting a likelihood of hallucination arising from one-shot, few-shot, or outside knowledge contexts. For example, regarding the one-shot or few-shot contexts, some embodiments determine a set of tokens in a language model output that are not found in target content but are found in at least one example. When such phrases are not very common words, this is highly indicative that the model is hallucinating because these phrases should be located in the target content but are not, but are instead located in the examples. Divers modes de réalisation discutés ici concernent l'amélioration de technologies existantes en détectant une probabilité d'hallucinations survenant à partir de contextes à un exemple, à quelques exemples ou à connaissances extérieures. Par exemple, concernant les contextes à un exemple ou à quelques exemples, certains modes de réalisation déterminent un ensemble de jetons dans une sortie de modèle de langage qui ne sont pas trouvés dans un contenu cible mais sont trouvés dans au moins un exemple. Lorsque de telles phrases ne sont pas des mots très courants, cela est hautement indicatif du fait que le modèle fait une hallucination parce que ces phrases devraient être présentes dans le contenu cible mais ne le sont pas, mais sont plutôt présentes dans les exemples.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2024258599A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2024258599A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2024258599A13</originalsourceid><addsrcrecordid>eNrjZNB2cQ1xdQ7x9HNX8HD08Ql19vRzDPH091Pw9FNwVPBx9HMPdXR3VfD1d3H14WFgTUvMKU7lhdLcDMpuriHOHrqpBfnxqcUFicmpeakl8eH-RgZGJkamFqaWlo6GxsSpAgDvpCWt</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>DETECTING HALLUCINATION IN A LANGUAGE MODEL</title><source>esp@cenet</source><creator>SOMECH, Haim ; KANTOR, Amir ; MILLER, Adi L ; AVIHOO, Assaf</creator><creatorcontrib>SOMECH, Haim ; KANTOR, Amir ; MILLER, Adi L ; AVIHOO, Assaf</creatorcontrib><description>Various embodiments discussed herein are directed to improving existing technologies by detecting a likelihood of hallucination arising from one-shot, few-shot, or outside knowledge contexts. For example, regarding the one-shot or few-shot contexts, some embodiments determine a set of tokens in a language model output that are not found in target content but are found in at least one example. When such phrases are not very common words, this is highly indicative that the model is hallucinating because these phrases should be located in the target content but are not, but are instead located in the examples. Divers modes de réalisation discutés ici concernent l'amélioration de technologies existantes en détectant une probabilité d'hallucinations survenant à partir de contextes à un exemple, à quelques exemples ou à connaissances extérieures. Par exemple, concernant les contextes à un exemple ou à quelques exemples, certains modes de réalisation déterminent un ensemble de jetons dans une sortie de modèle de langage qui ne sont pas trouvés dans un contenu cible mais sont trouvés dans au moins un exemple. Lorsque de telles phrases ne sont pas des mots très courants, cela est hautement indicatif du fait que le modèle fait une hallucination parce que ces phrases devraient être présentes dans le contenu cible mais ne le sont pas, mais sont plutôt présentes dans les exemples.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2024</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20241219&amp;DB=EPODOC&amp;CC=WO&amp;NR=2024258599A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76289</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20241219&amp;DB=EPODOC&amp;CC=WO&amp;NR=2024258599A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>SOMECH, Haim</creatorcontrib><creatorcontrib>KANTOR, Amir</creatorcontrib><creatorcontrib>MILLER, Adi L</creatorcontrib><creatorcontrib>AVIHOO, Assaf</creatorcontrib><title>DETECTING HALLUCINATION IN A LANGUAGE MODEL</title><description>Various embodiments discussed herein are directed to improving existing technologies by detecting a likelihood of hallucination arising from one-shot, few-shot, or outside knowledge contexts. For example, regarding the one-shot or few-shot contexts, some embodiments determine a set of tokens in a language model output that are not found in target content but are found in at least one example. When such phrases are not very common words, this is highly indicative that the model is hallucinating because these phrases should be located in the target content but are not, but are instead located in the examples. Divers modes de réalisation discutés ici concernent l'amélioration de technologies existantes en détectant une probabilité d'hallucinations survenant à partir de contextes à un exemple, à quelques exemples ou à connaissances extérieures. Par exemple, concernant les contextes à un exemple ou à quelques exemples, certains modes de réalisation déterminent un ensemble de jetons dans une sortie de modèle de langage qui ne sont pas trouvés dans un contenu cible mais sont trouvés dans au moins un exemple. Lorsque de telles phrases ne sont pas des mots très courants, cela est hautement indicatif du fait que le modèle fait une hallucination parce que ces phrases devraient être présentes dans le contenu cible mais ne le sont pas, mais sont plutôt présentes dans les exemples.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2024</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZNB2cQ1xdQ7x9HNX8HD08Ql19vRzDPH091Pw9FNwVPBx9HMPdXR3VfD1d3H14WFgTUvMKU7lhdLcDMpuriHOHrqpBfnxqcUFicmpeakl8eH-RgZGJkamFqaWlo6GxsSpAgDvpCWt</recordid><startdate>20241219</startdate><enddate>20241219</enddate><creator>SOMECH, Haim</creator><creator>KANTOR, Amir</creator><creator>MILLER, Adi L</creator><creator>AVIHOO, Assaf</creator><scope>EVB</scope></search><sort><creationdate>20241219</creationdate><title>DETECTING HALLUCINATION IN A LANGUAGE MODEL</title><author>SOMECH, Haim ; KANTOR, Amir ; MILLER, Adi L ; AVIHOO, Assaf</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2024258599A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2024</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>SOMECH, Haim</creatorcontrib><creatorcontrib>KANTOR, Amir</creatorcontrib><creatorcontrib>MILLER, Adi L</creatorcontrib><creatorcontrib>AVIHOO, Assaf</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>SOMECH, Haim</au><au>KANTOR, Amir</au><au>MILLER, Adi L</au><au>AVIHOO, Assaf</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>DETECTING HALLUCINATION IN A LANGUAGE MODEL</title><date>2024-12-19</date><risdate>2024</risdate><abstract>Various embodiments discussed herein are directed to improving existing technologies by detecting a likelihood of hallucination arising from one-shot, few-shot, or outside knowledge contexts. For example, regarding the one-shot or few-shot contexts, some embodiments determine a set of tokens in a language model output that are not found in target content but are found in at least one example. When such phrases are not very common words, this is highly indicative that the model is hallucinating because these phrases should be located in the target content but are not, but are instead located in the examples. Divers modes de réalisation discutés ici concernent l'amélioration de technologies existantes en détectant une probabilité d'hallucinations survenant à partir de contextes à un exemple, à quelques exemples ou à connaissances extérieures. Par exemple, concernant les contextes à un exemple ou à quelques exemples, certains modes de réalisation déterminent un ensemble de jetons dans une sortie de modèle de langage qui ne sont pas trouvés dans un contenu cible mais sont trouvés dans au moins un exemple. Lorsque de telles phrases ne sont pas des mots très courants, cela est hautement indicatif du fait que le modèle fait une hallucination parce que ces phrases devraient être présentes dans le contenu cible mais ne le sont pas, mais sont plutôt présentes dans les exemples.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2024258599A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title DETECTING HALLUCINATION IN A LANGUAGE MODEL
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-04T23%3A33%3A23IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=SOMECH,%20Haim&rft.date=2024-12-19&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2024258599A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true