Skip to content

Latest commit

 

History

History
137 lines (72 loc) · 24.3 KB

Capítulo 2_1.md

File metadata and controls

137 lines (72 loc) · 24.3 KB

Recopilación de Datos Feministas: Construyendo una Visión de un Sistema Inclusivo

Este es un artículo de revisión que examina recomendaciones y ejemplos de cómo implementar los principios del feminismo de datos presentados anteriormente en este capítulo por D'Ignazio y Klein.

Escrito por Amelia Pittman, Deirdre Appel y Open Data Watch Publicado en 13 de septiembre de 2021.


Introducción

Existen sesgos en las prácticas actuales de recopilación de datos, que dejan a mujeres y niñas invisibles en los datos. Es necesario realizar esfuerzos deliberados para superar los problemas de los métodos tradicionales de recopilación de datos. En un sistema de recopilación de datos feminista, los promedios se deconstruirían mediante una desagregación adecuada y sería posible efectuar análisis inter seccionales. El uso de fuentes de datos inexploradas se expandiría mientras se mitigan sus desafíos. Las nuevas fuentes de datos y tecnologías como la IA ofrecen enormes oportunidades, pero también existen sesgos en este contexto. Es necesario hacer esfuerzos deliberados para garantizar que las mujeres y las niñas sean tomadas en cuenta. Necesitamos repensar todos los aspectos de la recopilación de datos para garantizar una mayor inclusión. A menos que se adopte un enfoque feminista a través de estos grandes esfuerzos, la recopilación de datos dejará invisibles a las mujeres y las niñas.

Un sistema de recopilación de datos inclusivo implica la combinación de fuentes de datos tradicionales e inexploradas sobre la base de un enfoque deliberado en la inclusión. Las fuentes tradicionales requieren mejores preguntas de encuesta, estructuras y prácticas de recolección inclusivas. Se pueden incorporar fuentes inexploradas para mejorar las fuentes tradicionales y crear un sistema de recopilación de datos inclusivo basado en principios feministas. Sin embargo, en cada etapa del proceso, es fundamental siempre hacer las preguntas correctas. Estas preguntas son:

  • ¿Quién define el problema que será resuelto por los datos?
  • ¿Quién decide qué datos recopilar?
  • ¿Quién recopila los datos y cómo?
  • ¿Quién analiza y cuestiona los datos?
  • ¿Quién utiliza los datos y para qué decisiones?

Exploramos los problemas que existen actualmente en los métodos tradicionales de recopilación de datos y luego consideramos nuevas fuentes de datos que pueden contribuir a la construcción de un sistema inclusivo al tiempo que abordan los problemas que plantean.

Abordando los problemas de la recopilación tradicional de datos

Los métodos tradicionales de recopilación de datos, incluidos los censos, las encuestas de población activa, las encuestas demográficas y de salud, entre otros, experimentan deficiencias que deben ser superadas para hacer posible un enfoque feminista de los datos. Estas fuentes pueden contener sesgos en su diseño y lagunas críticas en los datos producidos por falta de inclusión. El sesgo de género habita en la redacción de las preguntas de la encuesta y en cómo se formulan esas preguntas. Los datos recopilados a nivel del hogar también pueden pasar por alto las desigualdades dentro del hogar. Los grupos marginados a menudo no se registran, lo que deja a las mujeres en las situaciones más vulnerables sin contar por completo. Estos problemas de fuentes y métodos tradicionales deben abordarse para garantizar una recopilación de datos inclusiva.

Diseño de preguntas de encuasta

El diseño de preguntas de encuesta influye en los datos recopilados, creando el potencial para perpetuar el sesgo de género. Considere las encuestas de fuerza laboral, que refuerzan los roles de género tradicionales a través de la estructura de sus preguntas. Las preguntas que indagan sobre las contribuciones económicas de una persona solo indagan sobre la fuente principal. En el caso de las mujeres, la respuesta suele ser ama de casa. No se hacen más preguntas, fallando en registrar el trabajo remunerado que pudiera ser una fuente secundaria de ingresos. Esto da como resultado una falta de comprensión entre los formuladores de políticas sobre cómo las mujeres agregan valor a la economía.1 Es necesario centrarse en identificar y corregir el sesgo en el diseño de las preguntas de la encuesta desde el principio.

Desagregación de datos

Los datos recopilados a nivel del hogar pueden pasar por alto las desigualdades dentro del hogar. Es fundamental desagregar los datos por sexo, edad, quintil de ingresos y otras características para identificar las desigualdades en la propiedad de activos dentro del hogar. Y para hacer esto, se deben repensar las herramientas de medición estandarizadas, ya que faltan datos desagregados en los principales conjuntos de datos globales.2

Llegar a los grupos marginados

Los grupos marginados a menudo no se registran, lo que deja a las mujeres en las situaciones más vulnerables sin contar por completo. Aunque las poblaciones de refugiados y afectadas por conflictos corren mayor riesgo de sufrir violencia de género, las situaciones de conflicto a menudo impiden los esfuerzos estándar de recopilación de datos. Y donde sea posible la recopilación de datos, se deben implementar metodologías apropiadas para abordar las preocupaciones éticas y producir datos útiles.3 Otro grupo marginado son las personas que se identifican como no binarias. A menos que se incorporen categorías de género no binarias en las prácticas de recopilación de datos, no se registrarán las realidades vividas y, lo que es más importante, la violencia de género contra las mujeres transgénero. Es fundamental garantizar que los datos inter seccionales estén disponibles para resaltar los desafíos únicos que enfrentan los diferentes grupos marginados.

Expansión del uso de fuentes de datos inexploradas

Las fuentes de datos inexploradas pueden crear un sistema de datos más inclusivo que los métodos tradicionales de recopilación de datos por sí solos. Un uso más sistemático de los registros administrativos puede complementar las fuentes tradicionales como los censos y las encuestas demográficas y de hogares. El uso generalizado de teléfonos móviles crea oportunidades para que los datos generados por los ciudadanos mejoren la información sobre las condiciones generales de vida. Las encuestas de texto SMS pueden proporcionar evaluaciones rápidas de situaciones en evolución. Los registros de detalles de llamadas y otras formas de Datos Masivos pueden proporcionar información más granular y casi en tiempo real, especialmente en lugares donde las encuestas tradicionales no pueden recopilar información. Y el uso de la inteligencia artificial ofrece importantes oportunidades para mejorar los procesos y reducir los costos de análisis de los datos disponibles.

Datos administrativos

Las fuentes de datos administrativos, como los sistemas de registro civil y estadísticas vitales, registros de inscripción, registros de salud y otros, pueden proporcionar datos desagregados sobre salud, educación, trabajo y otros indicadores críticos para validar y cerrar las brechas en las fuentes de datos tradicionales. Para aprovechar el potencial de los datos administrativos, los países deben implementar disposiciones legales apropiadas. Como ejemplo, en 2015 Vietnam adoptó una ley estadística que permite y regula el uso estadístico de datos administrativos.4 Se necesitará promoción para incorporar el empleo de registros administrativos. Para ayudar a los tomadores de decisiones a ver su utilidad, los defensores deben mapear los registros administrativos existentes. Sin embargo, los sistemas estadísticos débiles y la falta de recursos presentan barreras para la utilización de datos administrativos.5 La promoción también debe centrarse en abordar estas barreras subyacentes, exigiendo una financiación adecuada y fortaleciendo los sistemas estadísticos.

Muchos ejemplos concretos demuestran el potencial de expandir el uso de fuentes de datos inexploradas. Una investigación de la Universidad Carnegie Mellon muestra cómo el análisis de datos administrativos sobre violaciones denunciadas utilizando técnicas de minería de datos reveló patrones de violencia sexual en El Salvador. El análisis, que examinó dos variables usando visualizaciones de mapas de calor, respondió preguntas correspondientes a la distribución condicional, como quiénes eran los principales perpetradores de violencia sexual en función de la edad o la ubicación. Y un enfoque en los patrones de tiempo y ubicación podría ayudar a identificar dónde y cuándo aumenta la violencia sexual. Dicho análisis podría llevarse a cabo en tiempo real, lo que permitiría la detección temprana de patrones emergentes para informar a los organismos encargados de hacer cumplir la ley y a los encargados de formular políticas6, aunque este tipo de técnicas analíticas están sujetas a desafíos éticos y cuestiones de equidad que se analizan más a fondo en el capítulo 3.

Datos generados por ciudadanos

Los datos generados por los ciudadanos son posibles gracias al uso generalizado de teléfonos móviles. Involucrar a los ciudadanos en el proceso de recopilación de datos es un componente importante del feminismo de datos y altera la distribución del poder de los datos. Estos datos también tienen el potencial de aumentar la granularidad de los datos sobre una amplia gama de temas de desarrollo y promover una mayor inclusión. Si bien los métodos tradicionales de recopilación de datos pueden tener un acceso limitado a las poblaciones tradicionalmente excluidas y económicamente desfavorecidas, los datos generados por los ciudadanos tienen el potencial de llegar a estas poblaciones a través del apoyo de la sociedad civil.7 Sin embargo, si bien se han reconocido la relevancia y las contribuciones potenciales de los datos generados por los ciudadanos, existen preocupaciones sobre la cobertura, la comparabilidad, la capacidad y la sostenibilidad de los datos generados por los ciudadanos como complemento de las fuentes de datos tradicionales.8 Estos son desafíos que deben mitigarse, pero no disminuyen el gran potencial de los datos generados por los ciudadanos.

El Proyecto de mejora de la nutrición y la salud materno infantil9 ofrece un ejemplo de cómo aprovechar los beneficios de las encuestas basadas en teléfonos Android para evaluar el desempeño de la financiación comunitaria basada en el desempeño para mejorar los resultados nutricionales de la salud materno infantil. Debido a la ineficiencia de los informes en papel, los informes directos de la comunidad sobre el desempeño son posibles a través de teléfonos inteligentes, lo que evita demoras, limitaciones de capacidad y desafíos de calidad de datos asociados con los métodos tradicionales de recopilación de datos. Basado en el éxito de este piloto, el Gobierno de Ghana considerará una ampliación a nivel nacional.10

Datos Masivos

Los sistemas de datos masivos pueden producir información granular en tiempo real, lo que ofrece un gran potencial para cambiar la recopilación de datos hacia los principios feministas, cerrar las brechas en las bases de datos tradicionales y proporcionar datos donde no están disponibles. Las fuentes inexploradas de datos masivos incluyen datos de redes sociales, registros de detalles de llamadas, datos de radio, imágenes satelitales y otros. Los datos de estas fuentes pueden ayudar a abordar las cuestiones de medición y validación de las tradicionales fuentes11, corregir sesgos y proporcionar mayor desagregación, todo esto con mayor frecuencia. Sin embargo, será necesario desarrollar e implementar protocolos legales y técnicos con cuidado para abordar los desafíos clave relacionados con la interpretación de datos y la protección de la privacidad de los ciudadanos.

Como ejemplo, la Fundación Flowminder investigó el potencial de los datos masivos para apoyar los esfuerzos del gobierno de Nepal por un desarrollo con equidad de género. El proyecto combinó datos de encuestas con etiquetas geográficas de la Encuesta demográfica y de salud de Nepal (NDHS) de 2016, imágenes satelitales y datos de teléfonos móviles para mapear indicadores relacionados con el género, incluida la alfabetización, las ocupaciones basadas en la agricultura y los nacimientos en centros de salud. La combinación de estos datos permitió a los investigadores modelar y mapear las variaciones espaciales y las desigualdades basadas en el género de estos indicadores, proporcionando una mejor comprensión de la vida de las mujeres y las niñas. Sin embargo, para aprovechar todos los beneficios de la combinación de datos, los gobiernos deben aumentar el tamaño de la muestra de los datos de encuestas subyacentes y desarrollar la capacidad dentro de las agencias estadísticas para utilizar estos enfoques de modelado.12

Inteligencia Artificial

La inteligencia artificial ofrece potencial para mejorar los procesos y reducir los costos de análisis de los datos masivos disponibles, así como para avanzar en técnicas de datos sintéticos más precisas. Aquí definimos inteligencia artificial como cualquier tecnología de software con al menos una de las siguientes capacidades: percepción (incluyendo audio, visual, textual y táctil), toma de decisiones, predicción, extracción automática de conocimiento y reconocimiento de patrones a partir de datos, comunicación interactiva, lógica y razonamiento.13 Recopilar los datos correctos con métodos que aseguren el desglose correcto es un primer paso importante, pero para crear un sistema de datos más inclusivo, estos datos también deben analizarse e interpretarse utilizando métodos apropiados y eficientes.

Mitigando los desafíos de las fuentes de datos inexploradas

El uso de datos de fuentes tradicionales y inexploradas ofrece potencial para hacer que los sistemas de recopilación de datos sean más inclusivos y para ayudar a cerrar las brechas y superar los sesgos a través de la validación, pero los gobiernos y los investigadores deberán implementar los estándares correctos para garantizar la privacidad y superar los sesgos que siguen siendo inherentes a los datos y métodos de investigación. La innovación y la tecnología ofrecen oportunidades significativas para lograr prácticas inclusivas de recopilación de datos, pero no es la solución completa. Y una solución no se ajustará a todos los contextos, cada contexto tendrá sus propios desafíos únicos que deberán mitigarse para ser inclusivos y abordar los problemas del mundo real.

Sesgos en los datos y algoritmos

Si bien la inteligencia artificial tiene un gran potencial, los algoritmos basados ​​en datos sesgados amplifican las desigualdades raciales y de género, proliferando sesgos no examinados. Los datos masivos y la ciencia de datos se basan abrumadoramente en narrativas blancas, masculinas y tecno-heroicas, una narrativa que debe ser cuestionada. Cuestionar el sistema binario masculino/femenino permite reexaminar otros sistemas de clasificación sesgados.14 Los sesgos no solo pueden perpetuar las desigualdades, sino que también pueden representar un riesgo para la vida de las mujeres, por ejemplo. El diseño de cinturones de seguridad y bolsas de aire ofrece un ejemplo de los peligros de los diseños basados ​​en datos sesgados. Debido a que no se tomaron en cuenta los senos de las mujeres ni los cuerpos de las embarazadas, las mujeres tienen un 47 % más de probabilidades de lesionarse y un 17 % más de probabilidades de morir que un hombre en accidentes automovilísticos.15 Se deben establecer pautas específicas de contexto y de género para cubrir la recopilación de datos, el manejo de datos y las compensaciones específicas del tema. Y las narrativas sociales subyacentes de los sesgos deben examinarse a través de más investigaciones.16

Para ayudar a abordar los problemas de sesgo, es importante examinar el contexto en el que se generan los datos. Quién está en el equipo de investigación y quién hace las preguntas son cuestiones críticas a considerar.17

Interpretación de datos

La combinación de fuentes de datos tradicionales y de datos inexploradas tiene potencial, pero solo la interpretación correcta de estos datos producirá conocimientos útiles. Es importante asegurarse de que los investigadores consideren las normas sociales y las realidades políticas relacionadas con la igualdad de género y los desafíos que enfrentan las mujeres y las niñas para interpretar de manera efectiva los conocimientos de fuentes de datos tradicionales y inexploradas. Por ejemplo, al interpretar los datos de las redes sociales, es fundamental que los investigadores consideren que lo que las mujeres se sienten cómodas diciendo en línea puede no reflejar sus opiniones. Las amenazas digitales ocasionadas por cuestiones de privacidad y acoso y abuso en línea pueden impedir que las mujeres se sientan cómodas expresándose en línea.18

Protección de la privacidad y consentimiento informado

El uso responsable de datos masivos para llenar los vacíos de datos y generar información crítica sobre la vida de las mujeres y las niñas requiere respeto por la privacidad individual. Si bien existen muchos principios de privacidad de datos de larga data para las fuentes tradicionales, aún deben abordarse muchos problemas de privacidad relacionados con los grandes datos. Las muchas interconexiones posibles de las fuentes de datos masivos hacen que sea difícil garantizar una des identificación irreversible. Incluso los datos agregados a nivel comunitario, que minimizan el riesgo de reidentificación individual, aún pueden usarse para causar daño a grupos identificables.19 Hay una necesidad de marcos normativos multilaterales. El Grupo de Desarrollo Sostenible de las Naciones Unidas (GDNU) ha desarrollado un conjunto de pautas sobre privacidad de datos, protección de datos y ética de datos con respecto a la utilización de datos masivos. Estas pautas enfatizan la importancia del conocimiento y consentimiento adecuado de las personas sobre las que se recopilan los datos.20 Sin embargo, los gobiernos deben asegurarse de que se desarrollen protocolos legales y técnicos apropiados de acuerdo con las necesidades de su contexto particular y se implementen para garantizar que se proteja la privacidad.

Es fundamental garantizar que las comunidades sobre las que se recopilan datos participen en el proceso y que tengan la oportunidad de dar su consentimiento informado para el uso de sus datos. Los métodos de recopilación de datos deben incluir transparencia y educación sobre los riesgos y beneficios del uso y no uso de los datos. Los investigadores deben realizar evaluaciones de riesgo en contextos determinados y asegurarse de que el consentimiento proporcionado esté bien informado.21

Ampliando el impacto

Muchos proyectos han demostrado el potencial del uso de los datos masivos para cerrar brechas y proporcionar datos donde no hay ninguno disponible. Sin embargo, la mayoría de estos ejemplos son proyectos de investigación únicos o proyectos piloto. Para obtener todos los beneficios de estas fuentes de datos inexploradas, los proyectos deben ampliarse y ver una implementación generalizada. Los gobiernos deben asumir un papel activo para aprovechar el potencial de estas fuentes de datos inexploradas y adoptar enfoques feministas para la recopilación de datos. En muchos contextos, los gobiernos deberán invertir en desarrollar la capacidad del personal técnico para poder aprovechar los beneficios de las tecnologías innovadoras y las fuentes de datos inexploradas. Ofrecer políticas que no dejen a nadie atrás requerirá una mayor inversión en datos.

Las asociaciones del sector público-privado ofrecen más oportunidades mediante el aprovechamiento de los grandes datos del sector privado para el bien público. Al establecer la administración de datos como una función dentro del sector privado, la práctica de colaboraciones de datos entre el gobierno y las empresas puede volverse más predecible y sostenible.22

Conclusión

Cambiar las prácticas de recopilación de datos no será un proceso simple ni fácil. Las desigualdades actuales deben ser examinadas, desafiadas y cambiadas. Requerirá un cambio colectivo en los métodos de recopilación de datos y un desafío a las estructuras de poder existentes, pero son fundamentales para realizar sistemas de datos más inclusivos. Los protocolos legales y técnicos correctos para mitigar los desafíos de las fuentes de datos tradicionales y inexploradas serán esenciales. Pero solo a través de un esfuerzo concertado y dedicación a la inclusión, se puede implementar la recopilación de datos feministas para garantizar que nadie se quede atrás.

Footnotes

  1. Buvinic, Mayra and Levine, Ruth. 2016. Closing the gender data gap. Royal Statistical Society.

  2. OECD. 2018. Development Co-operation Report 2018: Joining Forces to Leave No One Behind.

  3. The Global Women’s Institute. 2017. Gender-Based Violence Research, Monitoring, and Evaluation with Refugee and Conflict-Affected Populations: A Manual and Toolkit for Researchers and Practitioners. George Washington University.

  4. Vietnam National Assembly. 2015. Law on Statistics. Hanoi.

  5. OCED 2018

  6. De-Arteaga, Maria, and Artur Dubrawski. 2017 ‘Discovery of Complex Anomalous Patterns of Sexual Violence in El Salvador’. ArXiv:1711.06538 [Stat],

  7. OCED 2018

  8. OCED 2018

  9. World Bank., “Ghana - Maternal, Child Health and Nutrition Project.” Project ID P145792 (2014).

  10. Lopes, Claudia Abreau and Bailur, Savita. 2018. Gender Equality and Big Data. UN Women.

  11. Lopes et al. Gender Equality and Big Data

  12. The Flowminder Foundation. 2019. “Towards high-resolution sex-disaggregated dynamic mapping.”

  13. Vinuesa, R., Azizpour, H., Leite, I. et al. 2020. “The role of artificial intelligence in achieving the Sustainable Development Goals.” Nature Communications 11, 233 (2020).

  14. D’Ignazio, Catherine and Klein, Lauren F. 2020. Data Feminism.

  15. Perez, Caroline Criado. 2019. Invisible Women

  16. Collett, Clementine and Dillon, Sarah. 2019. AI and Gender: Four Proposals for Future Research. Cambridge: The Leverhulme Centre for the Future of Intelligence.

  17. D’Ignazio and Klein 2020

  18. Lopes and Bailur 2018

  19. Ibid

  20. UNSDG. ‘Data Privacy, Ethics and Protection: Guidance Note on Big Data for Achievement of the 2030 Agenda’. Accessed 24 March 2021.

  21. Lopes and Bailur 2018

  22. GovLab. n.d. Data Stewards.