La gestión de datos de investigación (GDI) se refiere a la organización, el almacenamiento y la conservación de los datos creados durante un proyecto de investigación. Abarca la planificación inicial, los procesos cotidianos y el archivo e intercambio a largo plazo.
Suele incluir los siguientes elementos:
- Creación de un plan de gestión de datos para el proyecto de investigación. Esto puede ser un requisito del financiador de su investigación y puede formar parte de la solicitud de financiación.
- Trabajar con los datos durante el propio proyecto. Hay que pensar en cómo se organizan los datos, se almacenan, se aseguran y se comparten con los colaboradores de la investigación.
- Clasificar y documentar los datos, y hacer una selección para su conservación y puesta en común.
Datos de investigación
Los datos de la investigación pueden adoptar muchas formas, pero son esencialmente las pruebas utilizadas para informar o apoyar las conclusiones de la investigación. Algunos ejemplos de datos de investigación son
- Grabaciones de vídeo y voz
- Cuestionarios y transcripciones de entrevistas
- Resultados de pruebas en archivos de texto y hojas de cálculo
- Materiales de archivo y notas manuscritas
- Código y software
- Fotografías y diapositivas
- Cuadernos de laboratorio
Los datos de investigación son toda la información que se ha recogido, observado, generado o creado para validar los resultados originales de la investigación. Aunque suelen ser digitales, los datos de investigación también incluyen formatos no digitales, como cuadernos de laboratorio y cuadernos de dibujo.
¿Qué es la gestión de datos de investigación?
La gestión de datos de investigación es simplemente el manejo eficaz de la información que se crea durante la investigación.
La gestión de los datos de investigación suele ser una parte integral del proceso de investigación, por lo que probablemente ya lo hagas. La mayor parte de las actividades deberían resultarle familiares: nombrar los archivos para poder encontrarlos rápidamente; hacer un seguimiento de las diferentes versiones y eliminar las que no sean necesarias; hacer copias de seguridad de los datos y resultados valiosos; y controlar quién tiene acceso a sus datos.
El tratamiento de los datos de investigación depende del tipo de datos, de la forma en que se hayan creado o recogido y de cómo se vayan a utilizar ahora y en el futuro. Por ejemplo, la mayoría de los datos de los experimentos son reproducibles; otros datos pueden no ser repetibles, como las observaciones de campo.
Sin embargo, todos los resultados o datos de la investigación pueden utilizarse para demostrar los resultados publicados o pueden combinarse con otros datos para producir nuevos tipos de registros de datos.
La gestión eficaz de los datos se lleva a cabo durante todo el ciclo de vida de los mismos, desde su creación hasta su difusión, publicación y archivo. Los aspectos de la gestión de datos suelen continuar mucho después de que el proyecto de investigación inicial haya finalizado.
Ciclo de vida de los datos
La gestión de los datos de investigación implica la organización activa y el mantenimiento de los datos a lo largo del proceso de investigación y el archivo adecuado de los datos al finalizar el proyecto. Se trata de una actividad continua durante todo el ciclo de vida de los datos.
Planificar: La planificación puede incluir la revisión de las fuentes de datos existentes, el tratamiento del consentimiento informado, la consideración de los costes y la preparación de un plan.
Crear: Los investigadores producen datos (experimento, observación, medición, simulación) y/o recogen y organizan datos y materiales de terceros. Se capturan y crean los metadatos y los materiales relacionados.
Procesar: Los datos se convierten a formato digital (transcritos, convertidos, digitalizados, curados) de acuerdo con las normas de garantía de calidad. Los datos se comprueban, se validan, se limpian, se recodifican, se versionan y, si es necesario, se anonimizan. Todos estos procesos se documentan y los datos se describen utilizando la norma de metadatos de descubrimiento adecuada.
Analizar: Los datos se interpretan y analizan para producir resultados de investigación, publicaciones y productos intelectuales. Se citan las fuentes de datos.
Conservar: Los datos se guardan en formatos que se ajustan a las mejores prácticas de conservación, se crean documentos de usuario y metadatos de descubrimiento, se añade un identificador digital (es decir, DOI) y los datos se vinculan a cualquier producto publicado, se tiene en cuenta la seguridad y la propiedad intelectual.
Compartir: Se confirman los derechos de acceso (consideraciones éticas y de propiedad intelectual). Los datos, junto con la documentación del usuario y los metadatos, se hacen accesibles, por ejemplo, en un servidor de dominio público o en un repositorio controlado.
Reutilización: Se localizan y obtienen los datos, la documentación del usuario y los metadatos potencialmente útiles. El análisis secundario se lleva a cabo una vez completadas las transformaciones de datos necesarias. La transformación se documenta y se citan las fuentes de datos.
¿Por qué debería gestionar mis datos de investigación?
Participar en el proceso de gestión de datos de investigación en su institución puede ser beneficioso tanto para usted como para sus estudiantes, otros investigadores, su institución y sus colaboradores y socios externos.
Los datos de su investigación son cruciales, ya que constituyen la base de pruebas de los resultados de su investigación. Sus datos de investigación también son un recurso valioso cuya creación habrá costado mucho tiempo y dinero.
Hay varias razones excelentes por las que los datos de la investigación deben gestionarse de forma adecuada y oportuna, y las asociamos a las razones para compartir los datos. Podrían considerarse tanto palos (requisitos) como zanahorias (beneficios).
Los palos – o requisitos de gestión de datos de investigación
Cumplimiento de las políticas
Una buena gestión de datos de investigación le beneficiará a usted y a su institución al garantizar el cumplimiento de las expectativas y políticas de los financiadores en materia de datos de investigación. Las políticas institucionales también pueden estar en vigor, a menudo en respuesta a los mandatos de los financiadores.
Algunos organismos de financiación han introducido requisitos normativos. La política del RCUK sobre el acceso abierto establece que «todos los artículos deben incluir… si procede, una declaración sobre cómo se puede acceder a los materiales de investigación subyacentes, como datos, muestras o modelos»».
Asegúrese de que sus datos son accesibles y compartibles
En cuanto al cumplimiento de la normativa, los editores de revistas exigen cada vez más a los investigadores que pongan a disposición, sin restricciones, todos los datos subyacentes a los resultados descritos en su manuscrito en el momento de la publicación. Esto suele significar que los datos se depositan en un centro o depósito de datos accesible. Este requisito se aplica tanto a la investigación comercial como a la financiada con fondos públicos.
Demuestre una práctica responsable
Al gestionar los datos de su investigación y ponerlos a disposición del público, podrá demostrar el uso responsable de los recursos públicos para financiar la investigación. Las buenas prácticas de RDM mejoran la validación de los resultados de la investigación y la integridad de la misma.
Un grupo de financiadores de la investigación, organismos del sector y expertos en infraestructuras trabajan en colaboración para promover el uso responsable de las métricas de investigación. El foro cuenta con un programa de actividades que incluye el asesoramiento y la mejora de la infraestructura de datos que sustenta el uso de las métricas.
¿Cuáles son las zanahorias -o los beneficios- de una buena GRD?
Una buena gestión de los datos de investigación puede reportarle muchos beneficios a usted, a otros investigadores y a la comunidad en general:
- Eficiencia y facilidad en el control de los datos, con menor riesgo de pérdida de los mismos,
- Mayor visibilidad de los datos, lo que conduce a un aumento de las citas y a futuras colaboraciones,
- Demostración de la integridad de la investigación y validación de sus resultados,
- Cumplimiento de las políticas y expectativas institucionales y de los financiadores,
- Mayor impacto de la investigación a través de la transferencia de conocimientos,
- Avances en la investigación gracias a la reutilización de los datos por parte de investigadores de todo el mundo.
A continuación se ofrecen más detalles al respecto:
Mantenga su investigación segura y protegida
Puede reducir el riesgo de pérdida de datos manteniendo los datos de su investigación seguros y protegidos: el uso de instalaciones de almacenamiento de datos sólidas y apropiadas ayudará a reducir la pérdida de sus datos por accidentes o negligencia.
Trabaje con el personal de apoyo a la investigación de su institución para dejar claras sus necesidades de conservación y preservación de datos. Esto les ayudará a establecer o asesorar sobre el almacenamiento adecuado de sus datos.
Aumente la eficacia de su investigación
Puede aumentar la eficiencia de su investigación: una buena gestión de los datos de investigación le permitirá organizar sus archivos y datos para acceder a ellos y analizarlos sin dificultad. De este modo, podrá seguir el progreso más fácilmente y mitigar el riesgo de que un miembro del equipo se marche llevándose valiosos conocimientos sobre la naturaleza y el alcance del trabajo realizado.
Mejore la integridad de su investigación
Una buena gestión de los datos puede mejorar la integridad de la investigación y servir para validar los resultados de la misma. Unos datos de investigación precisos y completos son una parte esencial de las pruebas necesarias para evaluar y validar los resultados de la investigación y para reconstruir los acontecimientos y procesos que conducen a ellos.
Haga más visibles los resultados de su investigación
Hacer que sus datos estén disponibles mejora la visibilidad de sus resultados de investigación y aumenta el número de citas. Los datos de investigación, si están correctamente formateados, descritos y atribuidos, tendrán un valor significativo y podrán seguir teniendo un impacto mucho después de la finalización de un proyecto de investigación. Piwowar y Vision (2013) descubrieron un «sólido beneficio de citación de los datos abiertos».
Tal vez las razones más comunes para conservar y gestionar los datos de investigación sean garantizar la reproducibilidad y facilitar el intercambio en línea.
Permitir la colaboración
A medida que la investigación es cada vez más compleja, los investigadores pueden poner en común sus recursos para lograr un objetivo común: nuevos descubrimientos. Las colaboraciones no sólo benefician a los investigadores, sino también a las revistas. Por ejemplo, revistas como Nature y Science han encontrado una correlación positiva entre el número de autores de una publicación y su factor de impacto.
Usted podría ofrecer oportunidades de colaboración con otros investigadores de su disciplina, o incluso con otras disciplinas, facilitando el intercambio y la reutilización de los datos de investigación para futuras investigaciones. Compartir datos de investigación bien gestionados y permitir que otros los utilicen también ayudará a evitar la duplicación de esfuerzos.
Cómo empezar
Como creadores y usuarios de datos de investigación, los investigadores son cruciales en el desarrollo de servicios de gestión y puesta en común de datos de investigación.
En general, si gestionan bien sus datos y se ajustan a las políticas y los marcos que se les exigen, podrían aumentar el debate y el potencial de nuevas investigaciones en su campo. Esto le ayudará a seguir recibiendo financiación y a abrirse a la innovación y a posibles nuevos usos de los datos.
Existen excelentes programas de formación en línea, como Mantra, un curso gratuito en línea. Mantra está diseñado para investigadores u otras personas que gestionan datos digitales como parte de un proyecto de investigación.
Trabajar con su institución
Para poner en marcha una infraestructura de apoyo, su institución debe comprender su investigación, sus pautas y calendarios, motivaciones y prioridades. La dirección de su universidad debe definir las expectativas a través de una política de GDR, y el personal de apoyo prestará los servicios.
Como principal creador de datos, procure
- Gestionar sus datos adecuadamente dentro de su política institucional y de las directrices establecidas a nivel local o para su disciplina; la principal forma de hacerlo es creando un plan de gestión de datos al inicio de un proyecto y revisándolo regularmente;
- Asegúrate de articular claramente -en términos de creación, uso y gestión de datos- los requisitos, oportunidades y obstáculos que podrías encontrar mientras realizas tu investigación para que tu institución u otros proveedores de infraestructuras puedan ayudarte a mantener tus datos seguros;
- Utiliza tu repositorio institucional, o un repositorio disciplinar adecuado, para almacenar los datos, resultados y publicaciones de tu investigación.