Similarit\`a per la ricerca del dominio di una frase

English. This document aims to study the best algorithms to verify the belonging of a specific document to a related domain by comparing different methods for calculating the distance between two vectors. This study has been made possible with the help of the structures made available by the Apache...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Morrelli, Massimiliano, Pansini, Giacomo, Polito, Massimiliano, Vitale, Arturo
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator Morrelli, Massimiliano
Pansini, Giacomo
Polito, Massimiliano
Vitale, Arturo
description English. This document aims to study the best algorithms to verify the belonging of a specific document to a related domain by comparing different methods for calculating the distance between two vectors. This study has been made possible with the help of the structures made available by the Apache Spark framework. Starting from the study illustrated in the publication "New frontier of textual classification: Big data and distributed calculus" by Massimiliano Morrelli et al., We wanted to carry out a study on the possible implementation of a solution capable of calculating the Similarity of a sentence using the distributed environment. Italiano. Il presente documento persegue l'obiettivo di studiare gli algoritmi migliori per verificare l'appartenenza di un determinato documento a un relativo dominio tramite un confronto di diversi metodi per il calcolo della distanza fra due vettori. Tale studio \`e stato condotto con l'ausilio delle strutture messe a disposizione dal framework Apache Spark. Partendo dallo studio illustrato nella pubblicazione "Nuova frontiera della classificazione testuale: Big data e calcolo distribuito" di Massimiliano Morrelli et al., si \`e voluto realizzare uno studio sulla possibile implementazione di una soluzione in grado di calcolare la Similarit\`a di una frase sfruttando l'ambiente distribuito.
doi_str_mv 10.48550/arxiv.2002.00757
format Article
fullrecord <record><control><sourceid>arxiv_GOX</sourceid><recordid>TN_cdi_arxiv_primary_2002_00757</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>2002_00757</sourcerecordid><originalsourceid>FETCH-arxiv_primary_2002_007573</originalsourceid><addsrcrecordid>eNpjYJA0NNAzsTA1NdBPLKrILNMzMjAw0jMwMDc152QwCc7MzcxJLMosiUlIVChILVLISVQoykxOLUpOVEhJzVFIyc_NzMvMV0jJVCjNS1RIK0osTuVhYE1LzClO5YXS3Azybq4hzh66YPPjC4oycxOLKuNB9sSD7TEmrAIA89Yxqw</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Similarit\`a per la ricerca del dominio di una frase</title><source>arXiv.org</source><creator>Morrelli, Massimiliano ; Pansini, Giacomo ; Polito, Massimiliano ; Vitale, Arturo</creator><creatorcontrib>Morrelli, Massimiliano ; Pansini, Giacomo ; Polito, Massimiliano ; Vitale, Arturo</creatorcontrib><description>English. This document aims to study the best algorithms to verify the belonging of a specific document to a related domain by comparing different methods for calculating the distance between two vectors. This study has been made possible with the help of the structures made available by the Apache Spark framework. Starting from the study illustrated in the publication "New frontier of textual classification: Big data and distributed calculus" by Massimiliano Morrelli et al., We wanted to carry out a study on the possible implementation of a solution capable of calculating the Similarity of a sentence using the distributed environment. Italiano. Il presente documento persegue l'obiettivo di studiare gli algoritmi migliori per verificare l'appartenenza di un determinato documento a un relativo dominio tramite un confronto di diversi metodi per il calcolo della distanza fra due vettori. Tale studio \`e stato condotto con l'ausilio delle strutture messe a disposizione dal framework Apache Spark. Partendo dallo studio illustrato nella pubblicazione "Nuova frontiera della classificazione testuale: Big data e calcolo distribuito" di Massimiliano Morrelli et al., si \`e voluto realizzare uno studio sulla possibile implementazione di una soluzione in grado di calcolare la Similarit\`a di una frase sfruttando l'ambiente distribuito.</description><identifier>DOI: 10.48550/arxiv.2002.00757</identifier><language>eng</language><subject>Computer Science - Computation and Language</subject><creationdate>2020-01</creationdate><rights>http://arxiv.org/licenses/nonexclusive-distrib/1.0</rights><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>228,230,778,883</link.rule.ids><linktorsrc>$$Uhttps://arxiv.org/abs/2002.00757$$EView_record_in_Cornell_University$$FView_record_in_$$GCornell_University$$Hfree_for_read</linktorsrc><backlink>$$Uhttps://doi.org/10.48550/arXiv.2002.00757$$DView paper in arXiv$$Hfree_for_read</backlink></links><search><creatorcontrib>Morrelli, Massimiliano</creatorcontrib><creatorcontrib>Pansini, Giacomo</creatorcontrib><creatorcontrib>Polito, Massimiliano</creatorcontrib><creatorcontrib>Vitale, Arturo</creatorcontrib><title>Similarit\`a per la ricerca del dominio di una frase</title><description>English. This document aims to study the best algorithms to verify the belonging of a specific document to a related domain by comparing different methods for calculating the distance between two vectors. This study has been made possible with the help of the structures made available by the Apache Spark framework. Starting from the study illustrated in the publication "New frontier of textual classification: Big data and distributed calculus" by Massimiliano Morrelli et al., We wanted to carry out a study on the possible implementation of a solution capable of calculating the Similarity of a sentence using the distributed environment. Italiano. Il presente documento persegue l'obiettivo di studiare gli algoritmi migliori per verificare l'appartenenza di un determinato documento a un relativo dominio tramite un confronto di diversi metodi per il calcolo della distanza fra due vettori. Tale studio \`e stato condotto con l'ausilio delle strutture messe a disposizione dal framework Apache Spark. Partendo dallo studio illustrato nella pubblicazione "Nuova frontiera della classificazione testuale: Big data e calcolo distribuito" di Massimiliano Morrelli et al., si \`e voluto realizzare uno studio sulla possibile implementazione di una soluzione in grado di calcolare la Similarit\`a di una frase sfruttando l'ambiente distribuito.</description><subject>Computer Science - Computation and Language</subject><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2020</creationdate><recordtype>article</recordtype><sourceid>GOX</sourceid><recordid>eNpjYJA0NNAzsTA1NdBPLKrILNMzMjAw0jMwMDc152QwCc7MzcxJLMosiUlIVChILVLISVQoykxOLUpOVEhJzVFIyc_NzMvMV0jJVCjNS1RIK0osTuVhYE1LzClO5YXS3Azybq4hzh66YPPjC4oycxOLKuNB9sSD7TEmrAIA89Yxqw</recordid><startdate>20200131</startdate><enddate>20200131</enddate><creator>Morrelli, Massimiliano</creator><creator>Pansini, Giacomo</creator><creator>Polito, Massimiliano</creator><creator>Vitale, Arturo</creator><scope>AKY</scope><scope>GOX</scope></search><sort><creationdate>20200131</creationdate><title>Similarit\`a per la ricerca del dominio di una frase</title><author>Morrelli, Massimiliano ; Pansini, Giacomo ; Polito, Massimiliano ; Vitale, Arturo</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-arxiv_primary_2002_007573</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>eng</language><creationdate>2020</creationdate><topic>Computer Science - Computation and Language</topic><toplevel>online_resources</toplevel><creatorcontrib>Morrelli, Massimiliano</creatorcontrib><creatorcontrib>Pansini, Giacomo</creatorcontrib><creatorcontrib>Polito, Massimiliano</creatorcontrib><creatorcontrib>Vitale, Arturo</creatorcontrib><collection>arXiv Computer Science</collection><collection>arXiv.org</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>Morrelli, Massimiliano</au><au>Pansini, Giacomo</au><au>Polito, Massimiliano</au><au>Vitale, Arturo</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Similarit\`a per la ricerca del dominio di una frase</atitle><date>2020-01-31</date><risdate>2020</risdate><abstract>English. This document aims to study the best algorithms to verify the belonging of a specific document to a related domain by comparing different methods for calculating the distance between two vectors. This study has been made possible with the help of the structures made available by the Apache Spark framework. Starting from the study illustrated in the publication "New frontier of textual classification: Big data and distributed calculus" by Massimiliano Morrelli et al., We wanted to carry out a study on the possible implementation of a solution capable of calculating the Similarity of a sentence using the distributed environment. Italiano. Il presente documento persegue l'obiettivo di studiare gli algoritmi migliori per verificare l'appartenenza di un determinato documento a un relativo dominio tramite un confronto di diversi metodi per il calcolo della distanza fra due vettori. Tale studio \`e stato condotto con l'ausilio delle strutture messe a disposizione dal framework Apache Spark. Partendo dallo studio illustrato nella pubblicazione "Nuova frontiera della classificazione testuale: Big data e calcolo distribuito" di Massimiliano Morrelli et al., si \`e voluto realizzare uno studio sulla possibile implementazione di una soluzione in grado di calcolare la Similarit\`a di una frase sfruttando l'ambiente distribuito.</abstract><doi>10.48550/arxiv.2002.00757</doi><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier DOI: 10.48550/arxiv.2002.00757
ispartof
issn
language eng
recordid cdi_arxiv_primary_2002_00757
source arXiv.org
subjects Computer Science - Computation and Language
title Similarit\`a per la ricerca del dominio di una frase
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-16T21%3A49%3A06IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-arxiv_GOX&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Similarit%5C%60a%20per%20la%20ricerca%20del%20dominio%20di%20una%20frase&rft.au=Morrelli,%20Massimiliano&rft.date=2020-01-31&rft_id=info:doi/10.48550/arxiv.2002.00757&rft_dat=%3Carxiv_GOX%3E2002_00757%3C/arxiv_GOX%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true