Gender and Intersectional Disparities in Biographies on English and Spanish Wikipedia Front Pages (2013-2023)

DOI

El següent dataset conté dos carpetes amb dades diferents, les quals inclouen:

El conjunt de dades de la carpeta amb nom "Gender" proporciona la distribució per gènere de les persones que han estat destacades a les portades de les versions anglesa i espanyola de Wikipedia, durant el període 2013-2023. Pel que fa a l'edició en castellà, les dades s'han recollit de les seccions "Artículos buenos" i "Artículos destacados" i es mostren en forma agregada.

El conjunt de dades de la carpeta amb nom "Intersectionality" proporciona la distribució per diferents atributs sociodemogràfics de les persones que han estat destacades a les portades de les versions en anglès i en espanyol de Wikipedia, en el període del 2013 al 2023. Està estructurat en quatre CSV. Tres d'aquests CSV corresponen a l'edició de Wikipedia en anglès: el CSV English 3C que conté les dades de les seccions "Did you know...", "In the news" i "On this day..."; un CSV dedicat a "English Featured Article", i un altre a "English Featured Picture". El quart CSV conté les dades de l'edició en castellà de la Wikipedia, extretes de les seccions "Artículo Destacado" i "Artículo Bueno". A cada CSV, les dades es presenten en columnes, cadascuna dedicada a un atribut sociodemogràfic.

The following dataset contains two folders with different data, which include:

The data set of the folder with name "Gender" provides the gender distribution of individuals featured on the front pages of the English and Spanish versions of Wikipedia from 2013 to 2023. For the Spanish edition, data has been collected from the "Artículos buenos" and "Artículos destacados" sections and is displayed in an aggregated format.

The data set of the folder with name "Intersectionality" provides the distribution based on various sociodemographic attributes of individuals who have been featured on the front pages of the English and Spanish versions of Wikipedia from 2013 to 2023. It is structured into four CSV. Three of these CSV correspond to the English Wikipedia edition: the English 3C CSV containing data from the sections "Did you know...", "In the news," and "On this day..."; a CSV dedicated to "English Featured Article," and another to "English Featured Picture." The fourth CSV contains data from the Spanish edition of Wikipedia, extracted from the sections "Artículo Destacado" and "Artículo Bueno." Within each CSV, the data is presented in columns, each dedicated to a sociodemographic attribute.

Identifier
DOI https://doi.org/10.34810/data1427
Metadata Access https://dataverse.csuc.cat/oai?verb=GetRecord&metadataPrefix=oai_datacite&identifier=doi:10.34810/data1427
Provenance
Creator Bejarano Randazzo, Andrés; Centelles Velilla, Miquel ORCID logo; Ferran-Ferrer, Núria ORCID logo; Fernández Aguilera, Laura ORCID logo
Publisher CORA.Repositori de Dades de Recerca
Contributor Centelles Velilla, Miquel; Universitat de Barcelona
Publication Year 2024
Funding Reference Plan Nacional I+D+I of the Ministry of Science and Innovation of Spain PID2020-116936RA-I00
Rights CC BY 4.0; info:eu-repo/semantics/openAccess; http://creativecommons.org/licenses/by/4.0
OpenAccess true
Contact Centelles Velilla, Miquel (Universitat de Barcelona)
Representation
Resource Type Observation data/ratings; Dataset
Format text/plain; text/csv; text/tab-separated-values; text/comma-separated-values
Size 3485; 277034; 26112; 28325; 1133; 29816; 60
Version 1.0
Discipline Humanities