Web scraping: Uso de plataformas de extracción de datos aplicadas a un sitio web sobre profesiones en México/Web scraping: Use of data extraction platforms applied to a website about professions in Mexico

Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en dive...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação 2023-12 (52), p.61
Hauptverfasser: Cocón, Felipe, Pérez-Cruz, Dámaris, Pérez-Rejón, José Ángel, Zavaleta-Carrillo, Patricia, Barradas-Arenas, Ulises, Gómez-Ramón, RubÃ, Cruz, José Alonso Pérez
Format: Artikel
Sprache:por
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Este artículo realiza una revisión exhaustiva de las principales herramientas de web scraping disponibles en el mercado y compara sus características y funcionalidades. Se selecciona una herramienta específica para demostrar su uso en la obtención de datos sobre porcentajes de egresados en diversas carreras en México, así como la distribución relacionada con género y salarios en varios estados del país. El artículo tiene como objetivo principal ilustrar cómo se pueden recopilar datos mediante una herramienta de extracción. Además, se destaca la importancia de acceder a fuentes de datos confables y se proporciona una descripción detallada del proceso de extracción de datos utilizando la herramienta WebHarvy. En última instancia, se destaca la importancia del web scraping como una técnica poderosa y ética profesional para recopilar datos valiosos de la web de manera eficaz y responsable. Palabras-clave: Educación; extracción; laboral; mercado; scraping. This article provides a thorough review of the main web scraping tools available on the market and it is comparing their features and functionalities. A specific tool is selected to demonstrate it is use in obtaining data on percentages of graduates in various careers in Mexico, as well as the distribution related to gender and salaries in several states of the country. The main objective of the article is to illustrate how data can be collected using a data extraction tool. Additionally, the importance of accessing reliable data sources is highlighted and a detailed description of the data extraction process using the WebHarvy tool is provided. Ultimately, it is highlighting the importance of web scraping as a powerful technique and professional ethical to collect valuable data from the web to efectively and responsibly. Keywords: Education; extraction; employment; scraping; professions.
ISSN:1646-9895
DOI:10.17013/risti.52.61-73