Ir al contenido principal

Datos de investigación

Datos de investigación

Según la OECDdatos de investigación o research data son todo el material que ha sido registrado y utilizado como fuente primaria durante la investigación científica, y que es comúnmente aceptado por la comunidad científica como necesario para validar los resultados de la investigación. Un conjunto de datos constituye una representación sistemática y parcial del tema investigado.

Se consideran datos de investigación: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria, cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, objetos digitales, algoritmos, scripts, bases de datos, metadatos y esquemas de metadatos, configuraciones de software y las comprobaciones y las respuestas de la prueba. (FECYT, 2012).  El código de software utilizado para generar, comentar o analizar los datos también puede ser considerado como dato.

No son considerados datos finales de investigación: notas de laboratorio, sets de datos parciales, análisis preliminares, borradores de trabajos, planes para investigaciones futuras, comunicaciones con colegas, objetos físicos, ejemplares de laboratorio como ratones  y muestras de laboratorio o cepas de bacterias. 

Los datos pueden ser numéricos, descriptivos o visuales.  

Clasificación:

  • Según su naturaleza: cualitativos o cuantitativos. 
  • Según su nivel de procesamiento: en estado bruto (datos primarios), procesados o analizados. 
  • Según la fuente de la que provienen: experimentales (ej. cromatografías), observacionales (ej. encuestas) o computacionales (obtenidos mediante simulación). 
  • Según su formato: textuales (Word, PDF, RTF...), numéricos (Excel, CSV...), multimedia (JPEG, MPEG, WAV...), estructurados (XML, MySQL...), código de software (Java, C...), específicos de un software (Mesh, 3D CAD, modelo estadístico...) o específicos de una disciplina o instrumento. 

El camino de la ciencia abierta estimula que otros puedan colaborar y contribuir, cuando los datos de investigación y otros procesos de investigación son de acceso abierto y con términos que permitan la reutilización, la redistribución y la reproducción de la investigación.

Para que los datos de investigación cumplan con los requerimientos de la Ciencia abierta y con las condiciones impuestas por la Comisión Europea a través de su programa de financiación Horizonte Europa, deben depositarse en abierto siguiendo los principios FAIR, que garantizan que los mismos sean localizables, accesibles, interoperables y reutilizables. 

El lema de los principios FAIR es "Tan abierto como sea posible, tan cerrado como sea necesario"

 

 

Findable (localizables)

Tanto los datos como sus descripciones (metadatos) deben ser fáciles de encontrar. Para ello:

  • Se les asigna un identificador único y persistente (DOI, Handle).
  • Se describen con metadatos enriquecidos.
  • Se depositan en repositorios o bases de datos que pueden ser rastreados por un motor de búsqueda. 

 

Accesible (accesibles)

Facilitar el acceso a los datos, tanto z personas como máquinas, bajo condiciones específicas o restricciones cuando sea necesario:

  • Se utilizan programas y protocolos de comunicación estandarizados, abiertos y gratuitos.
  • Se utilizan procedimientos de autentificación y autorización cuando el acceso deba ser restringido.
  • Se garantiza que los metadatos sean accesibles, incluso cuando los datos ya no estén disponibles. 

 

Interoperables

Los datos y sus metadatos deben ajustarse a formatos y estándares reconocidos, usados ampliamente y preferiblemente abiertos para permitir su combinación e intercambio:

  • Los ficheros y los datos deben representarse en lenguajes y esquemas informáticos estandarizados capaces de ser leídos por máquinas.
  • La descripción de los conjuntos de datos se realiza mediante lenguajes informáticos controlados e identificadores únicos y persistentes.
  • Los conjuntos de datos enlazan con otros que los completan y se explica en qué consiste esa relación entre ambos.

 

Reutilizables:

Es necesario dotar a los datos con una licencia clara y accesible sobre su uso y reutilización; asociarlos con información sobre su procedencia y cumplir con los estándares relevantes que use la comunidad de ese dominio concreto:

  • La información sobre datos es detallada y relevante.
  • Tienen asignada una licencia clara y accesible sobre la reutilización de los datos.
  • Información sobre el contenido de los datos (procedencia, metodología, software, responsables, etc.)
  • Los datos siguen estándares relevantes para su descripción, almacenamiento e intercambio.

 

Más información 

https://www.go-fair.org/fair-principles/ 

https://zenodo.org/record/1065991#.YZToKWBByUk 

 

Herramientas de verificación

Horizonte Europa, el nuevo programa de inversión en investigación e innovación para el período 2021-2027, mantiene y refuerza el apoyo a la ciencia abierta que se había promovido en el programa anterior:

  • Acceso abierto inmediato de las publicaciones sin tiempos de embargo a través de un repositorio y bajo licencia CC BY, además sólo se reembolsarán los gastos de publicar en revistas de acceso abierto completo (no híbridas)
  • Se proporcionará información a través del repositorio sobre cualquier resultado de la investigación o cualquier otra herramienta e instrumentos necesarios para validar las conclusiones de la publicación científica.
  • El mandato de acceso abierto se amplia a libros y otras publicaciones extensas, en estos casos las licencias pueden excluir usos comerciales y obra derivada  (CC BY-NC, CC BY-ND)
  • Énfasis en la gestión de datos de investigación cumpliendo con los requisitos FAIR y los planes de gestión de datos.
  • Se crea Open Research Europe, una plataforma de publicación en acceso abierto disponible para los beneficiarios de los programas H2020 y Horizonte Europa.

Presentación Programa Horizonte Europa

Más información: Horizon Europe (HORIZON) Euratom Research and Training Programme (EURATOM) General Model Grant Agreement EIC Accelerator Contract (HE MGA — Multi & Mono). Versión 1.0, 1 June 2021 

El Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023, a través de las actuaciones que financia, tiene como objetivo impulsar un modelo de investigación responsable y abierta a la sociedad a través de la incorporación del modelo de Ciencia Abierta. En el apartado de Transparencia y rendición de cuentas de las ayudas concedidas y del procedimiento de concesión, se habla tanto del acceso abierto como de los datos de investigación que deberán seguir los principios FAIR y difundirse en abierto, siempre que sea posible.

El marco de referencia plurianual para el fomento de la investigación científica, técnica y de innovación en España es la “Estrategia Española de Ciencia, Tecnología e Innovación (EECTI) 2021-2027".  Está diseñada específicamente para facilitar la articulación de las políticas I+D+I con las políticas de la Unión Europea y para promover la máxima coordinación entre la planificación y programación Estatal y Autonómica.  

DataCite Search: Buscador generalista de datasets abiertos con DOI

dataMED: Buscador de datasets y repositorios en el ámbito biomédico

DataONE: Buscador de datasets en repositorios sobre datos de la tierra y medio ambiente

Research Data : Buscador de datasets de Elsevier, en su mayoría de artículos de Elsevier

Dryad: Buscador de datasets asociados a publicaciones de ciencias y medicina

Eudat B2FIND: Buscador generalista de datasets mantenido por EUDAT

Figshare: Buscador internacional en el que se pueden recuperar datos por categorías temáticas

Google Dataset Search: Buscador de datasets en repositorios de datos científicos, bases de datos y sitios web de editores y autores y otras fuentes

Zenodo: Buscador de datos de investigación de la Unión Europea

datos.gob.es: Punto de encuentro entre los agentes del ecosistema de los datos abiertos en España

Datos abiertos del INE: Espacio Datos abiertos del instituto Nacional de estadística

Centro de Investigaciones Sociológicas: Banco de Datos en abierto del Centro de Investigaciones Sociológicas

Eurostat: Estadísticas y datos de alta calidad sobre Europa

DataPortals.org: Una lista completa de portales de datos abiertos de todo el mundo

Licencia Creative Commons
2.985.468 visitas     Biblioteca de la Universidad de Sevilla Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.