Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico

Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en dive...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação 2023-12 (52), p.61
Hauptverfasser: Cocón, Felipe, Pérez-Cruz, Dámaris, Pérez-Rejón, José Ángel, Zavaleta-Carrillo, Patricia, Barradas-Arenas, Ulises, Gómez-Ramón, RubÃ, Cruz, José Alonso Pérez
Format: Artikel
Sprache:por
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue 52
container_start_page 61
container_title RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação
container_volume
creator Cocón, Felipe
Pérez-Cruz, Dámaris
Pérez-Rejón, José Ángel
Zavaleta-Carrillo, Patricia
Barradas-Arenas, Ulises
Gómez-Ramón, RubÃ
Cruz, José Alonso Pérez
description Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en diversas carreras en México, así como la distribución relacionada con género y salarios en varios estados del país. El artículo tiene como objetivo principal ilustrar cómo se pueden recopilar datos mediante una herramienta de extracción. Además, se destaca la importancia de acceder a fuentes de datos confables y se proporciona una descripción detallada del proceso de extracción de datos utilizando la herramienta WebHarvy. En última instancia, se destaca la importancia del web scraping como una técnica poderosa y ética profesional para recopilar datos valiosos de la web de manera eficaz y responsable. Palabras-clave: Educación; extracción; laboral; mercado; scraping. This article provides a thorough review of the main web scraping tools available on the market and it is comparing their features and functionalities. A specific tool is selected to demonstrate it is use in obtaining data on percentages of graduates in various careers in Mexico, as well as the distribution related to gender and salaries in several states of the country. The main objective of the article is to illustrate how data can be collected using a data extraction tool. Additionally, the importance of accessing reliable data sources is highlighted and a detailed description of the data extraction process using the WebHarvy tool is provided. Ultimately, it is highlighting the importance of web scraping as a powerful technique and professional ethical to collect valuable data from the web to efectively and responsibly. Keywords: Education; extraction; employment; scraping; professions.
doi_str_mv 10.17013/risti.52.61-73
format Article
fullrecord <record><control><sourceid>gale</sourceid><recordid>TN_cdi_gale_infotracmisc_A789571068</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><galeid>A789571068</galeid><sourcerecordid>A789571068</sourcerecordid><originalsourceid>FETCH-LOGICAL-g678-6d9dc0b322c8b3bdaeebec42120a62daef8e4f09539c07a4cf82cec7e5e1f20f3</originalsourceid><addsrcrecordid>eNptkM1KAzEQx3NQsNSevQY87zbJfnsrxS-oeKl4LNlkUiLbpGy22LtP49k30DfwiZxoDyImhzDDzO_3J4SccZbyivFs2tsw2LQQacmTKjsiI17mZdLUTXFCJiE8MTwFy5pajMjnI7Q0qF5urVtf0IfgqQa67eQgje83MsQS9kMvlbIfL-9vLja0HHygcttZJTXOSLpzNNjBevoceb7tEdJ7A8F6B4GCo3e4_bq3yk__KoF6E5HyIEKM-44QE0QNekDTwaMH8egBKlu_Gw6K6AjUogIi_5QcG9kFmBzeMVleXS7nN8ni_vp2Plsk67Kqk1I3WrE2E0LVbdZqCdCCygUXTJYCS1NDblhTZI1ilcyVqYUCVUEB3AhmsjE5_8GuZQcr64yP2Tc2qNWswr-uOCtrnEr_mcKrYYNZHRiL_V8LX9yRk5A</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico</title><source>Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals</source><creator>Cocón, Felipe ; Pérez-Cruz, Dámaris ; Pérez-Rejón, José Ángel ; Zavaleta-Carrillo, Patricia ; Barradas-Arenas, Ulises ; Gómez-Ramón, Rubà ; Cruz, José Alonso Pérez</creator><creatorcontrib>Cocón, Felipe ; Pérez-Cruz, Dámaris ; Pérez-Rejón, José Ángel ; Zavaleta-Carrillo, Patricia ; Barradas-Arenas, Ulises ; Gómez-Ramón, Rubà ; Cruz, José Alonso Pérez</creatorcontrib><description>Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en diversas carreras en México, así como la distribución relacionada con género y salarios en varios estados del país. El artículo tiene como objetivo principal ilustrar cómo se pueden recopilar datos mediante una herramienta de extracción. Además, se destaca la importancia de acceder a fuentes de datos confables y se proporciona una descripción detallada del proceso de extracción de datos utilizando la herramienta WebHarvy. En última instancia, se destaca la importancia del web scraping como una técnica poderosa y ética profesional para recopilar datos valiosos de la web de manera eficaz y responsable. Palabras-clave: Educación; extracción; laboral; mercado; scraping. This article provides a thorough review of the main web scraping tools available on the market and it is comparing their features and functionalities. A specific tool is selected to demonstrate it is use in obtaining data on percentages of graduates in various careers in Mexico, as well as the distribution related to gender and salaries in several states of the country. The main objective of the article is to illustrate how data can be collected using a data extraction tool. Additionally, the importance of accessing reliable data sources is highlighted and a detailed description of the data extraction process using the WebHarvy tool is provided. Ultimately, it is highlighting the importance of web scraping as a powerful technique and professional ethical to collect valuable data from the web to efectively and responsibly. Keywords: Education; extraction; employment; scraping; professions.</description><identifier>ISSN: 1646-9895</identifier><identifier>DOI: 10.17013/risti.52.61-73</identifier><language>por</language><publisher>AISTI (Iberian Association for Information Systems and Technologies)</publisher><subject>Web sites</subject><ispartof>RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação, 2023-12 (52), p.61</ispartof><rights>COPYRIGHT 2023 AISTI (Iberian Association for Information Systems and Technologies)</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,27901,27902</link.rule.ids></links><search><creatorcontrib>Cocón, Felipe</creatorcontrib><creatorcontrib>Pérez-Cruz, Dámaris</creatorcontrib><creatorcontrib>Pérez-Rejón, José Ángel</creatorcontrib><creatorcontrib>Zavaleta-Carrillo, Patricia</creatorcontrib><creatorcontrib>Barradas-Arenas, Ulises</creatorcontrib><creatorcontrib>Gómez-Ramón, RubÃ</creatorcontrib><creatorcontrib>Cruz, José Alonso Pérez</creatorcontrib><title>Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico</title><title>RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação</title><description>Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en diversas carreras en México, así como la distribución relacionada con género y salarios en varios estados del país. El artículo tiene como objetivo principal ilustrar cómo se pueden recopilar datos mediante una herramienta de extracción. Además, se destaca la importancia de acceder a fuentes de datos confables y se proporciona una descripción detallada del proceso de extracción de datos utilizando la herramienta WebHarvy. En última instancia, se destaca la importancia del web scraping como una técnica poderosa y ética profesional para recopilar datos valiosos de la web de manera eficaz y responsable. Palabras-clave: Educación; extracción; laboral; mercado; scraping. This article provides a thorough review of the main web scraping tools available on the market and it is comparing their features and functionalities. A specific tool is selected to demonstrate it is use in obtaining data on percentages of graduates in various careers in Mexico, as well as the distribution related to gender and salaries in several states of the country. The main objective of the article is to illustrate how data can be collected using a data extraction tool. Additionally, the importance of accessing reliable data sources is highlighted and a detailed description of the data extraction process using the WebHarvy tool is provided. Ultimately, it is highlighting the importance of web scraping as a powerful technique and professional ethical to collect valuable data from the web to efectively and responsibly. Keywords: Education; extraction; employment; scraping; professions.</description><subject>Web sites</subject><issn>1646-9895</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2023</creationdate><recordtype>article</recordtype><recordid>eNptkM1KAzEQx3NQsNSevQY87zbJfnsrxS-oeKl4LNlkUiLbpGy22LtP49k30DfwiZxoDyImhzDDzO_3J4SccZbyivFs2tsw2LQQacmTKjsiI17mZdLUTXFCJiE8MTwFy5pajMjnI7Q0qF5urVtf0IfgqQa67eQgje83MsQS9kMvlbIfL-9vLja0HHygcttZJTXOSLpzNNjBevoceb7tEdJ7A8F6B4GCo3e4_bq3yk__KoF6E5HyIEKM-44QE0QNekDTwaMH8egBKlu_Gw6K6AjUogIi_5QcG9kFmBzeMVleXS7nN8ni_vp2Plsk67Kqk1I3WrE2E0LVbdZqCdCCygUXTJYCS1NDblhTZI1ilcyVqYUCVUEB3AhmsjE5_8GuZQcr64yP2Tc2qNWswr-uOCtrnEr_mcKrYYNZHRiL_V8LX9yRk5A</recordid><startdate>20231201</startdate><enddate>20231201</enddate><creator>Cocón, Felipe</creator><creator>Pérez-Cruz, Dámaris</creator><creator>Pérez-Rejón, José Ángel</creator><creator>Zavaleta-Carrillo, Patricia</creator><creator>Barradas-Arenas, Ulises</creator><creator>Gómez-Ramón, RubÃ</creator><creator>Cruz, José Alonso Pérez</creator><general>AISTI (Iberian Association for Information Systems and Technologies)</general><scope>INF</scope></search><sort><creationdate>20231201</creationdate><title>Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico</title><author>Cocón, Felipe ; Pérez-Cruz, Dámaris ; Pérez-Rejón, José Ángel ; Zavaleta-Carrillo, Patricia ; Barradas-Arenas, Ulises ; Gómez-Ramón, Rubà ; Cruz, José Alonso Pérez</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-g678-6d9dc0b322c8b3bdaeebec42120a62daef8e4f09539c07a4cf82cec7e5e1f20f3</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>por</language><creationdate>2023</creationdate><topic>Web sites</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Cocón, Felipe</creatorcontrib><creatorcontrib>Pérez-Cruz, Dámaris</creatorcontrib><creatorcontrib>Pérez-Rejón, José Ángel</creatorcontrib><creatorcontrib>Zavaleta-Carrillo, Patricia</creatorcontrib><creatorcontrib>Barradas-Arenas, Ulises</creatorcontrib><creatorcontrib>Gómez-Ramón, RubÃ</creatorcontrib><creatorcontrib>Cruz, José Alonso Pérez</creatorcontrib><collection>Gale OneFile: Informe Academico</collection><jtitle>RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Cocón, Felipe</au><au>Pérez-Cruz, Dámaris</au><au>Pérez-Rejón, José Ángel</au><au>Zavaleta-Carrillo, Patricia</au><au>Barradas-Arenas, Ulises</au><au>Gómez-Ramón, RubÃ</au><au>Cruz, José Alonso Pérez</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico</atitle><jtitle>RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação</jtitle><date>2023-12-01</date><risdate>2023</risdate><issue>52</issue><spage>61</spage><pages>61-</pages><issn>1646-9895</issn><abstract>Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en diversas carreras en México, así como la distribución relacionada con género y salarios en varios estados del país. El artículo tiene como objetivo principal ilustrar cómo se pueden recopilar datos mediante una herramienta de extracción. Además, se destaca la importancia de acceder a fuentes de datos confables y se proporciona una descripción detallada del proceso de extracción de datos utilizando la herramienta WebHarvy. En última instancia, se destaca la importancia del web scraping como una técnica poderosa y ética profesional para recopilar datos valiosos de la web de manera eficaz y responsable. Palabras-clave: Educación; extracción; laboral; mercado; scraping. This article provides a thorough review of the main web scraping tools available on the market and it is comparing their features and functionalities. A specific tool is selected to demonstrate it is use in obtaining data on percentages of graduates in various careers in Mexico, as well as the distribution related to gender and salaries in several states of the country. The main objective of the article is to illustrate how data can be collected using a data extraction tool. Additionally, the importance of accessing reliable data sources is highlighted and a detailed description of the data extraction process using the WebHarvy tool is provided. Ultimately, it is highlighting the importance of web scraping as a powerful technique and professional ethical to collect valuable data from the web to efectively and responsibly. Keywords: Education; extraction; employment; scraping; professions.</abstract><pub>AISTI (Iberian Association for Information Systems and Technologies)</pub><doi>10.17013/risti.52.61-73</doi></addata></record>
fulltext fulltext
identifier ISSN: 1646-9895
ispartof RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação, 2023-12 (52), p.61
issn 1646-9895
language por
recordid cdi_gale_infotracmisc_A789571068
source Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals
subjects Web sites
title Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T13%3A44%3A13IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-gale&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Web%20scraping:%20Uso%20de%20plataformas%20de%20extracci%C3%83%C2%B3n%20de%20datos%20aplicadas%20a%20un%20sitio%20web%20sobre%20profesiones%20en%20M%C3%83%C2%A9xico/Web%20scraping:%20Use%20of%20data%20extraction%20platforms%20applied%20to%20a%20website%20about%20professions%20in%20Mexico&rft.jtitle=RISTI%20:%20Revista%20Ib%C3%A9rica%20de%20Sistemas%20e%20Tecnologias%20de%20Informa%C3%A7%C3%A3o&rft.au=Coc%C3%83%C2%B3n,%20Felipe&rft.date=2023-12-01&rft.issue=52&rft.spage=61&rft.pages=61-&rft.issn=1646-9895&rft_id=info:doi/10.17013/risti.52.61-73&rft_dat=%3Cgale%3EA789571068%3C/gale%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_galeid=A789571068&rfr_iscdi=true