METHOD AND APPARATUS FOR AUTOMATIC WEBSITE OPTIMIZATION
Web pages of a website are parsed and a set of n-grams are generated from the parsed web pages. A relevancy value is determined for each n-gram and a second set of n-grams is generated by removing any n-gram in the first set whose relevancy value is below a threshold. A third set of n-grams is gener...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | |
---|---|
container_issue | |
container_start_page | |
container_title | |
container_volume | |
creator | SAMPATH-KUMAR, SRIHARI P MUKHERJEE, ANINDO |
description | Web pages of a website are parsed and a set of n-grams are generated from the parsed web pages. A relevancy value is determined for each n-gram and a second set of n-grams is generated by removing any n-gram in the first set whose relevancy value is below a threshold. A third set of n-grams is generated at least by removing those of the second set of n-grams that have been determined to be similar to another one of the second set of n-grams. Responsive to determining that there is not a web page that is directed at an n-gram, a web page is automatically created with content directed at that n-gram including reusing existing content of the website that is related to the n-gram. One or more links to the created page are added to web pages so that the created page is not an orphan page.
L'invention concerne notamment un procédé au cours duquel des pages web d'un site web sont analysées et un ensemble de n-grammes est généré à partir des pages web analysées. Une valeur de pertinence est déterminée pour chaque n-gramme et un deuxième ensemble de n-grammes est généré en supprimant tout n-gramme du premier ensemble dont la valeur de pertinence est inférieure à un seuil. Un troisième ensemble de n-grammes est généré au moins en supprimant les éléments du deuxième ensemble de n-grammes dont il était déterminé qu'ils sont similaires à un autre élément du deuxième ensemble de n-grammes. En réaction à une détermination selon laquelle il n'existe pas de page web qui soit dirigée vers un n-gramme, une page web est automatiquement créée avec un contenu dirigé vers le n-gramme en question, notamment en utilisant un contenu existant du site web qui est lié au n-gramme. Un ou plusieurs liens vers la page créée sont ajoutés à des pages web de telle façon que la page créée ne soit pas une page orpheline. |
format | Patent |
fullrecord | <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_CA2919983A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>CA2919983A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_CA2919983A13</originalsourceid><addsrcrecordid>eNrjZDD3dQ3x8HdRcPQD4oAAxyDHkNBgBTf_IAXH0BB_X8cQT2eFcFenYM8QVwX_gBBPX88ooJi_Hw8Da1piTnEqL5TmZlBwcw1x9tBNLciPTy0uSExOzUstiXd2NLI0tLS0MHY0NCZCCQABISgD</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>METHOD AND APPARATUS FOR AUTOMATIC WEBSITE OPTIMIZATION</title><source>esp@cenet</source><creator>SAMPATH-KUMAR, SRIHARI P ; MUKHERJEE, ANINDO</creator><creatorcontrib>SAMPATH-KUMAR, SRIHARI P ; MUKHERJEE, ANINDO</creatorcontrib><description>Web pages of a website are parsed and a set of n-grams are generated from the parsed web pages. A relevancy value is determined for each n-gram and a second set of n-grams is generated by removing any n-gram in the first set whose relevancy value is below a threshold. A third set of n-grams is generated at least by removing those of the second set of n-grams that have been determined to be similar to another one of the second set of n-grams. Responsive to determining that there is not a web page that is directed at an n-gram, a web page is automatically created with content directed at that n-gram including reusing existing content of the website that is related to the n-gram. One or more links to the created page are added to web pages so that the created page is not an orphan page.
L'invention concerne notamment un procédé au cours duquel des pages web d'un site web sont analysées et un ensemble de n-grammes est généré à partir des pages web analysées. Une valeur de pertinence est déterminée pour chaque n-gramme et un deuxième ensemble de n-grammes est généré en supprimant tout n-gramme du premier ensemble dont la valeur de pertinence est inférieure à un seuil. Un troisième ensemble de n-grammes est généré au moins en supprimant les éléments du deuxième ensemble de n-grammes dont il était déterminé qu'ils sont similaires à un autre élément du deuxième ensemble de n-grammes. En réaction à une détermination selon laquelle il n'existe pas de page web qui soit dirigée vers un n-gramme, une page web est automatiquement créée avec un contenu dirigé vers le n-gramme en question, notamment en utilisant un contenu existant du site web qui est lié au n-gramme. Un ou plusieurs liens vers la page créée sont ajoutés à des pages web de telle façon que la page créée ne soit pas une page orpheline.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2015</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20150205&DB=EPODOC&CC=CA&NR=2919983A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25562,76317</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20150205&DB=EPODOC&CC=CA&NR=2919983A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>SAMPATH-KUMAR, SRIHARI P</creatorcontrib><creatorcontrib>MUKHERJEE, ANINDO</creatorcontrib><title>METHOD AND APPARATUS FOR AUTOMATIC WEBSITE OPTIMIZATION</title><description>Web pages of a website are parsed and a set of n-grams are generated from the parsed web pages. A relevancy value is determined for each n-gram and a second set of n-grams is generated by removing any n-gram in the first set whose relevancy value is below a threshold. A third set of n-grams is generated at least by removing those of the second set of n-grams that have been determined to be similar to another one of the second set of n-grams. Responsive to determining that there is not a web page that is directed at an n-gram, a web page is automatically created with content directed at that n-gram including reusing existing content of the website that is related to the n-gram. One or more links to the created page are added to web pages so that the created page is not an orphan page.
L'invention concerne notamment un procédé au cours duquel des pages web d'un site web sont analysées et un ensemble de n-grammes est généré à partir des pages web analysées. Une valeur de pertinence est déterminée pour chaque n-gramme et un deuxième ensemble de n-grammes est généré en supprimant tout n-gramme du premier ensemble dont la valeur de pertinence est inférieure à un seuil. Un troisième ensemble de n-grammes est généré au moins en supprimant les éléments du deuxième ensemble de n-grammes dont il était déterminé qu'ils sont similaires à un autre élément du deuxième ensemble de n-grammes. En réaction à une détermination selon laquelle il n'existe pas de page web qui soit dirigée vers un n-gramme, une page web est automatiquement créée avec un contenu dirigé vers le n-gramme en question, notamment en utilisant un contenu existant du site web qui est lié au n-gramme. Un ou plusieurs liens vers la page créée sont ajoutés à des pages web de telle façon que la page créée ne soit pas une page orpheline.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2015</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZDD3dQ3x8HdRcPQD4oAAxyDHkNBgBTf_IAXH0BB_X8cQT2eFcFenYM8QVwX_gBBPX88ooJi_Hw8Da1piTnEqL5TmZlBwcw1x9tBNLciPTy0uSExOzUstiXd2NLI0tLS0MHY0NCZCCQABISgD</recordid><startdate>20150205</startdate><enddate>20150205</enddate><creator>SAMPATH-KUMAR, SRIHARI P</creator><creator>MUKHERJEE, ANINDO</creator><scope>EVB</scope></search><sort><creationdate>20150205</creationdate><title>METHOD AND APPARATUS FOR AUTOMATIC WEBSITE OPTIMIZATION</title><author>SAMPATH-KUMAR, SRIHARI P ; MUKHERJEE, ANINDO</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_CA2919983A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2015</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>SAMPATH-KUMAR, SRIHARI P</creatorcontrib><creatorcontrib>MUKHERJEE, ANINDO</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>SAMPATH-KUMAR, SRIHARI P</au><au>MUKHERJEE, ANINDO</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>METHOD AND APPARATUS FOR AUTOMATIC WEBSITE OPTIMIZATION</title><date>2015-02-05</date><risdate>2015</risdate><abstract>Web pages of a website are parsed and a set of n-grams are generated from the parsed web pages. A relevancy value is determined for each n-gram and a second set of n-grams is generated by removing any n-gram in the first set whose relevancy value is below a threshold. A third set of n-grams is generated at least by removing those of the second set of n-grams that have been determined to be similar to another one of the second set of n-grams. Responsive to determining that there is not a web page that is directed at an n-gram, a web page is automatically created with content directed at that n-gram including reusing existing content of the website that is related to the n-gram. One or more links to the created page are added to web pages so that the created page is not an orphan page.
L'invention concerne notamment un procédé au cours duquel des pages web d'un site web sont analysées et un ensemble de n-grammes est généré à partir des pages web analysées. Une valeur de pertinence est déterminée pour chaque n-gramme et un deuxième ensemble de n-grammes est généré en supprimant tout n-gramme du premier ensemble dont la valeur de pertinence est inférieure à un seuil. Un troisième ensemble de n-grammes est généré au moins en supprimant les éléments du deuxième ensemble de n-grammes dont il était déterminé qu'ils sont similaires à un autre élément du deuxième ensemble de n-grammes. En réaction à une détermination selon laquelle il n'existe pas de page web qui soit dirigée vers un n-gramme, une page web est automatiquement créée avec un contenu dirigé vers le n-gramme en question, notamment en utilisant un contenu existant du site web qui est lié au n-gramme. Un ou plusieurs liens vers la page créée sont ajoutés à des pages web de telle façon que la page créée ne soit pas une page orpheline.</abstract><oa>free_for_read</oa></addata></record> |
fulltext | fulltext_linktorsrc |
identifier | |
ispartof | |
issn | |
language | eng ; fre |
recordid | cdi_epo_espacenet_CA2919983A1 |
source | esp@cenet |
subjects | CALCULATING COMPUTING COUNTING ELECTRIC DIGITAL DATA PROCESSING PHYSICS |
title | METHOD AND APPARATUS FOR AUTOMATIC WEBSITE OPTIMIZATION |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-09T17%3A19%3A03IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=SAMPATH-KUMAR,%20SRIHARI%20P&rft.date=2015-02-05&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3ECA2919983A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true |