Jornada técnica "Avances en la gestión de datos de investigación en España": Presentación

En los últimos años vienen incrementándose las iniciativas orientadas a la implantación de estrategias para la gestión y la publicación sistemáticas de los datos brutos de investigación. Países como Reino Unido, Alemania, Holanda y Dinamarca (los cuatro integrantes de la organización Knowledge Exchange) han diseñado exitosos programas nacionales para el desarrollo de proyectos e infraestructura de soporte de la RDM (Research Data Management), y la Unión Europea está asimismo promoviendo la identificación y puesta en práctica de buenas prácticas en la materia a través de convocatorias y proyectos varios en el marco del Séptimo Programa Marco de Investigación (FP7) y del Programa Horizonte 2020.

Por otra parte, en numerosas disciplinas científicas la compartición de datos brutos de investigación es una práctica habitual desde hace mucho tiempo, como atestiguan plataformas como el Protein Data Bank (PDB) para ciencias biomédicas o SIMBAD en astronomía (además de muchas de las recogidas en esta lista internacional de repositorios de datos). A menudo son los editores de revistas científicas quienes con mayor eficacia han fomentado dichas prácticas (con el mandato de Nature en 1978 de archivar los datos en PDB como gran impulsor del depósito de contenidos en dicha plataforma o la actual JDAP o política conjunta de archivo de datos que constituye la base de la recolección de datasets por parte del repositorio temático Dryad). Sin embargo, más allá de las disciplinas donde existe una tradición consolidada de compartir datos de investigación, los esfuerzos institucionales por desarrollar una infraestructura tecnológica que pueda dar soporte al data sharing and re-use son significativamente escasos fuera de Estados Unidos, Australia, Canadá y los países de Knowledge Exchange en Europa (pese a excepciones dignas de mención como la organización IASSIST en el ámbito de las Ciencias Sociales). Aunque existen iniciativas específicas –bien que tímidas y aisladas– para compartir y reutilizar los datos de investigación a nivel institucional en prácticamente todos los países, son muy pocos los que han definido estrategias para la puesta en marcha de políticas armonizadas encaminadas a promover la gestión, compartición y publicación de los datos de investigación.

España no es una excepción en este sentido. Pese a la existencia de plataformas como el repositorio de datos CEACS DataVerse de la Biblioteca de la Fundación Juan March o el Centro Nacional de Datos Polares (CNDP) del IGME, de iniciativas como la creación de la comunidad “Recursos y datos primarios” en el e-Repositori de la UPF y de informes oficiales elevados al Ministerio como “Reflexiones sobre la gestión y custodia de datos oceanográficos en España: Recursos existentes y recomendaciones para el futuro”, no existe en este momento una política armonizada para promover el desarrollo de iniciativas e infraestructura para la gestión de datos primarios de investigación a nivel institucional en el país. Tampoco cuenta España, pese a los diversos intentos realizados hasta el momento, con ningún repositorio institucional de datos de investigación en ciencias experimentales.

Dada la complejidad de la actividad de gestión de datos de investigación -con notables variaciones de procedimiento y requisitos de unas disciplinas a otras- y las frecuentemente elevadas necesidades de potencia de procesamiento y espacio de almacenamiento, a menudo los investigadores no consideran que las instituciones puedan ofrecer gran ayuda en este ámbito específico y prefieren –comprensiblemente– organizarse en redes temáticas apoyadas directamente sobre iniciativas para la creación de infraestructura (un buen ejemplo de ello es la Red española de e-Ciencia para el desarrollo de actividades Grid y de Supercomputación).

Sin embargo, consideraciones de sostenibilidad de las iniciativas, de extensión de las mismas y de lograr la máxima difusión de su existencia hacen aconsejable apoyarse asimismo en la ya muy consolidada red de instituciones y profesionales que trabajan en el ámbito de los repositorios de acceso abierto desde universidades y centros de investigación. Así se está procediendo en los países más avanzados en la materia, en los que las mismas oficinas nacionales que promovieron en su día el desarrollo del movimiento de acceso abierto (el JISC en Gran Bretaña, la DFG en Alemania, la SURF Foundation en Holanda o DEFF en Dinamarca) están ahora financiando programas y proyectos para la implantación de iniciativas institucionales y/o temáticas de gestión de datos brutos de investigación.

Además de la dificultad intrínseca de la materia –que es a la vez mucho más compleja y conceptualmente bastante distinta de las iniciativas para ofrecer acceso abierto a las publicaciones científicas, con las que tiene no obstante numerosos puntos en común– existe un doble cuello de botella en la implantación de dichas iniciativas que explica que sean prácticamente inexistentes en los países que carecen de un organismo nacional de coordinación y financiación de las mismas: existe en primer lugar un cuello de botella top-down constituido por la falta de convicción de los agentes rectores y financiadores de la actividad científica respecto a la gestión de datos de investigación como un ámbito prioritario de desarrollo, y hay por otro lado un cuello de botella bottom-up en la relativa falta de recursos humanos, técnicos y económicos de los equipos que desarrollan los proyectos de repositorios de acceso abierto a publicaciones científicas en universidades y centros de investigación. Fruto de este doble bloqueo de las iniciativas RDM y pese a la existencia de proyectos europeos con representación de muchos países, la brecha entre los países más avanzados en la materia en Europa y el resto continúa incrementándose, y resulta imposible encontrar a día de hoy en España un proyecto de gestión de datos de investigación similar al LAGOVirtual latinoamericano, conceptualmente sencillo y apoyado directamente sobre la infraestructura de repositorios de acceso abierto pero a la vez muy ambicioso - integrando las contribuciones en materia de datos de investigación en astrofísica de cuatro países de la América de habla hispana.

 

Para debatir las dificultades y los avances recientes en la puesta en marcha de iniciativas de gestión y publicación de datos brutos de investigación en España, GrandIR organiza conjuntamente con el Servei de Biblioteques i Documentació (SBD) de la Universitat Politècnica de Catalunya una nueva jornada técnica de debate, que se celebrará el próximo 10 de mayo en Barcelona. Como es habitual, la jornada estará específicamente dirigida a la comunidad de profesionales que trabajan en el ámbito del acceso abierto y los repositorios, pero en esta ocasión es particularmente importante contar además con la presencia y el testimonio de los propios investigadores, que aportarán su propio punto de vista sobre las necesidades de infraestructura para la gestión de datos de investigación que perciben en su trabajo cotidiano. Es por ello que el programa de la sesión aunará la presencia de organismos y profesionales orientados a la gestión de la información científica con otros de carácter más estrictamente científico. Entre los primeros se contará la FECYT, que presentará su visión del proyecto europeo OpenAIREplus encaminado a enriquecer la infraestructura OpenAIRE ya existente con la promoción de iniciativas RDM basadas en el estándar 'Enhanced publications' de la Unión Europea, o el Grupo de Trabajo de Repositorios de Datos financiado y promovido por Recolecta, en tanto que aportarán una visión más estrictamente científica organismos como el Centro de Datos de la Unidad de Tecnología Marina (UTM-CSIC), o el Centro de Servicios Científicos y Académicos de Cataluña (CESCA), así como una representación de investigadores que aportarán su punto de vista sobre los caminos que debería transitar la gestión de datos de investigación en España.