Consulta a tu biblioteca de centro
954 551 130
954 550 921
Por gestión de datos de investigación (RDM, Research Data Management) entendemos el conjunto de tareas que permiten la recopilación, organización, documentación, almacenamiento y preservación de los datos utilizados o generados durante un proyecto de investigación. Gestionar los datos de investigación es importante para asegurar la reproducibilidad de la investigación, así como para demostrar la veracidad de la información y la metodología de la misma.
Recomendaciones generales:
Aspectos éticos
En la Universidad de Sevilla, si la investigación implica experimentación con animales o seres humanos, se debe contar con la autorización previa de los Comités Éticos. Si se va a trabajar con datos personales o sensibles, es necesario contactar con la delegada de Protección de Datos para cumplir con los requisitos del Tratamiento de Datos Personales en Actividades de Investigación.
Además, en el caso de que la investigación incluya estudios con personas, deben obtenerse consentimientos informados de las personas implicadas en el proyecto para el tratamiento de sus datos.
Otros recursos:
Protección de datos personales
Todas las actividades de investigación e innovación deben cumplir con los principios éticos y la legislación pertinente a nivel nacional, europeo e internacional. La protección de datos personales es una cuestión prioritaria, por lo que se debe planificar desde el comienzo del proyecto de investigación ya que afecta al medio de almacenamiento elegido, al acceso a los datos, a la compartición de copias, a los protocolos de seguridad, al tratamiento de datos personales, etc.
Hay que tener en cuenta varias normas básicas en materia de protección de datos:
Anonimización
Cuando se trabaja con datos personales es obligatorio garantizar la privacidad y el anonimato de las personas implicadas. Para ello es necesario anonimizar los datos; la anonimización de datos es el proceso que permite eliminar las posibilidades de identificación de las personas.
Para anonimizar datos, OpenAire recomienda utilizar la herramienta Amnesia. Para más información, consulta la guía de uso, la presentación y el vídeo del webinar organizado por Open Aire en junio de 2020.
Se deben tener en cuenta también las Orientaciones y garantías en los procedimientos de anonimización de datos personales de la Agencia Española de Protección de Datos.
Otros recursos:
El formato elegido debe garantizar la reutilización y preservación de los datos, así como cumplir los requerimientos de los organismos financiadores y los requisitos de los repositorios donde se van a depositar. Se recomienda utilizar formatos abiertos, no propietarios, para garantizar que la mayoría de los software sean capaces de interpretar los datos.
Recomendaciones:
Formatos de archivos FAIR:
Fuente: How to FAIR. (s.f.). File formats.
Herramientas para la conversión de formatos:
Más información
La nomenclatura utilizada para nombrar los archivos ha de ser significativa, coherente y descriptiva, de forma que facilite la gestión y localización de archivos.
Recomendaciones:
Herramientas para renombrar ficheros
Organización de los archivos
El nombre, la estructura de las carpetas y el control de versiones de los ficheros deben facilitar la búsqueda, localización y comprensión de los datos.
Control de versiones
Cuando se actualizan los archivos de datos, es importante tener un control de las diferentes versiones. Algunos consejos para evitar confundir los diferentes estados de los archivos son:
Herramientas para gestionar versiones
Documentar adecuadamente los datos garantiza la correcta comprensión, interpretación y reutilización de los datos ya sea por los propios miembros del grupo de investigación en una fecha posterior como por otras personas interesadas cuando se depositan y comparten.
Existen varias formas de documentar los datos:
La forma más habitual es crear un fichero “README” en formato txt. Dicho fichero se ubicará junto con el resto de ficheros que contienen los datos de investigación y contendrá la siguiente información (en inglés):
Existen diversas guías y plantillas de ayuda para elaborar el archivo:
Almacenamiento
Se trata de elegir qué sistemas o herramientas se utilizarán para guardar los datos durante la investigación para hacer que sean accesibles para los miembros de grupo; determinar qué personas accederán, quién controlará el acceso a los datos y cómo se controlará que el acceso sea seguro.
Los datos se pueden almacenar en:
Se recomienda utilizar los servicios de almacenamiento institucionales; en el caso de la Universidad de Sevilla el Disco Virtual y OneDrive (servicio de Microsoft suscrito por la US) porque ofrece copias de seguridad, creación de grupos para compartir información y permite el acceso a los colaboradores externos del proyecto.
Seguridad
Utilizar contraseñas robustas y cambiarlas cada cierto tiempo para resistir ataques informáticos y encriptación de datos altamente sensibles.
No enviar datos por correo electrónico y utilizar sistemas de encriptado.
Otras herramientas para el almacenamiento de datos
Muchas agencias de financiación, instituciones y revistas académicas tienen mandatos y políticas sobre la publicación en acceso abierto de los datos de investigación. El cumplimiento de estos mandatos y políticas se suele realizar a través del depósito de los datos de investigación en un repositorio de datos.
"Tan abierto como sea posible, tan cerrado como sea necesario": la obligatoriedad de depositar los datos resultantes de una investigación financiada con fondos públicos no es incompatible con diversas situaciones que justifican que el acceso a los datos esté restringido temporal o permanentemente debido a cuestiones de seguridad, cláusulas de confidencialidad, explotación comercial o industrial, etc.
Licencias de uso
Para facilitar la reutilización de los datos depositados en acceso abierto, es necesario indicar los usos permitidos a otras personas. En el contexto de la Ciencia Abierta, se recomienda la utilización de licencias que permitan a terceros acceder, explotar, reproducir y difundir los datos
Existen diferentes tipos de licencias de uso:
Página para seleccionar la licencia http://creativecommons.org/choose/?lang=es_ES
Más información sobre licencias Creative Commons
La herramienta gratuita License Selector es muy útil para decidir qué licencia de uso se ajusta mejor a cada tipo de dataset o software asociado.
Los datos deben citarse correctamente, siguiendo un formato de citas específico y deben aparecer con el resto de referencias bibliográficas de la publicación resultante.
DOI Citation Formatter es un servicio ofrecido por DataCite que construye automáticamente las citas a partir del DOI asignado a los datos y conforme al estilo que seleccionemos.