Archivos de Tags: version 6

¿y si empezamos a adaptar los repositorios a OpenAIRE 4 ?

OpenAIRE publicó en noviembre de 2017 para su consulta pública antes de su aplicación efectiva, las especificaciones OpenAIRE 4 para repositorios de publicaciones, OpenAIRE 4 Guidelines for Literature Repository Managers.

Esta nueva recomendación OpenAIRE, a fecha de escribir esto, aún con estatus de borrador, tiene dos objetivos principales, orientados a mejorar la calidad de la medida, control y seguimiento de los resultados de investigación: conectar correctamente los autores con su producción científica, y enlazar la información de financiación con esa producción.

Para lograr esta interoperabilidad, que de eso trata OpenAIRE, se propone un nuevo perfil de aplicación para la exposición OAI-PMH basado en Dublin Core y DataCite.

De interés en este perfil tenemos elementos ampliados de metadatación de autoría, recomendándose la inclusión de identificadores ISNI u ORCID.

<datacite:creator> 
<datacite:creatorName>Wallentin, Carl‐Johan 
</datacite:creatorName>
 <datacite:nameIdentifier 
 nameIdentifierScheme="ORCID" 
 schemeURI=“http://orcid.org"> 
 http://orcid.org/0000-0003-1983-9378 
</datacite:nameIdentifier> 
</datacite:creator>

Igualmente para la identificación de proyectos y agencias financiadoras se incorporan nuevos elementos de metadatación, fundingReference.

 <datacite:fundingReference>
 <datacite:funderName>European Commission</datacite:funderName> 
<fundingStream>H2020 Marie Skłodowska-Curie Actions</fundingStream> <datacite:funderIdentifier 
funderIdentifierType="Crossref Funder ID"> 
</datacite:funderIdentifier> 
<datacite:awardNumber>
awardURI="http://cordis.europa.eu/project/rcn/195983_en.html">660668 
</datacite:awardNumber> 
 <datacite:awardTitle>ACT against AMR</datacite:awardTitle>
</datacite:fundingReference>

No menos importante son los cambios de sintaxis de los metadatos de tipología, con inclusión de vocabularios COAR, versionados, etc..

¿Y en qué afecta a los repositorios? 

Básicamente la inclusión de ORCID, realizada ya por un número considerable de repositorios institucionales, deberá ir pareja a la adaptación del interfaz OAI-PMH al nuevo esquema de recolección oaire.  En un reciente proyecto piloto para la FECYT, hemos realizado una primera adaptación de un repositorio institucional  para esa exposición OAI-PMH. Os informaremos próximamente de este proyecto, señalando además que el código es de uso público.

Igualmente los repositorios deberán capturar información (mas) precisa sobre los proyectos y la financiación de la que se derivan los resultados de investigación. Deseamos la aparición de servicios de consulta (APIs públicas) para facilitar esta tarea a los repositorios.

¡ Una nueva etapa para el ecosistema de repositorios y recolectadores con OpenAIRE4 !

 

API de ORCID V1 y V2, acceso público

Creemos que son interesantes para los repositorios DSpace los servicios de integración que ofrece ORCID a través de su API (Application Programming Interface). La API, en su versión actual v2.0, ofrece un serie de funcionalidades que permiten a los repositorios (y otros sistemas) interactuar con ORCID.

  1. Obtener el ORCID iD
  2. Leer/recuperar datos públicos (ORCID iDs y datos autorizados por los autores)
  3. Leer/recuperar datos privados (Si los autores han concedido autorización al que accede)
  4. Notificaciones de actualización del perfil (webhooks)
  5. Notificaciones cuando ocurren cambios en los ORCID iDs que se monitorean
  6. Añadir y actualizar datos de registros ORCID
  7. Creación de nuevos registros ORCID

Sólo algunas funciones API (1 y 2) son de libre uso, la denominada API-pública, mientras que el resto están restringidas al uso por aquellas organizaciones que contribuyen a la financiación de ORCID con una cuota anual (membresía básica y premium)

 

DSpace tiene incluidas desde el año 2014, con el lanzamiento de la versión 5, algunas capacidades de integración con ORCID usando la API-Pública, que se constuyeron por Atmire en el contexto de un proyecto con la Universidad de Missouri. La funcionalidad construida permite la  consulta de identificadores correspondientes a los nombres de autor, y tras la validación,  la incorporación del identificador y otros datos del registro ORCID a DSpace. Como aspecto importante de esta integración, se realizó con la API disponible en ese momento, V1. Lamentablemente esa versión de API ha sido retirada (deprecated) y mas lamentable aún, la V2 no ha mantenido la compatibilidad con los modos de recuperación de información de la versión anterior.

Just an FYI that ORCID.org has finally deprecated the v1 API that DSpace was using to look up authors. Their mailing list announcement[0] says that as of February 1, 2018 the default API version for calls to pub.orcid.org will become v2, and that v1 will move to a new URL until March 1, 2018, but this appears to be broken currently

Los usuarios del lookup de autoridades en este momento ya no pueden validar contra ORCID, en tanto no se desarrolla y prueba el acceso a la versión 2 de la API. El impacto es bastante limitado, pues la mayoría de repositorios con ORCID iDs no validaban directamente contra la bbdd de ORCID, sino únicamente contra la bbdd de autoridades del propio repositorio, no afectando en principio a las operativas de validación de autoridades.

Os mantendremos al corriente de los avances en los desarrollos de la nueva integración de DSpace con la API v2.

Versiones en DSpace

Nos preguntan en ocasiones qué significan los números de las versiones de Dspace. Vamos a intentar explicarlo:

Antes de 2012, las versiones se numeraban como 1.x, 1.6, 1.7 y 1.8.. Cada año aproximadamente se lograba terminar una versión nueva y se liberaba.  En ese momento, 2008 -2010,  se tenía en mente la version «definitiva», DSpace 2. Todavía hay documentos indexados por google que hablan de esa versión.

Pero esa versión 2 nunca llegó, así que en 2013 se decidió comenzar un nuevo esquema de numeración de versiones en forma [major].[minor].  Dspace desde entonces se numera como 3.0 (la primera tras el cambio de criterio) 3.1, 3.2…. 4.0,  4.1. Nunca hubo una versión 2 de Dspace.

¿Y cómo se decide el [major].[minor]…?

Incrementar el primer número, [major], significa que estamos ante una versión principal de Dspace. Esta incluye: nuevas funcionalidades, cambio de arquitectura, mejoras del sistema y corrección de errores.  Así, las versiones 3.0, 4.0, 5.0, 6.0 y la próxima 7.0, suponen una evolución sustancial del software.  Evolucionar entre versiones, cambiando el primer número, supone por lo general un esfuerzo considerable para:

  • La comunidad de desarrolladores de Dspace, que intenta mantener un calendario de una [major] por año, aunque no siempre se consigue.
  • Los repositorios DSpace, las instalaciones propiamente dichas, que deben ejecutar procedimientos de migración de datos y código entre versiones, prueba de la nueva versión, formación en las nuevas funcionalidades, etc. Es decir, proyectos por lo general, complejos.

Dspace releases

Las versiones menores [minor] son las que incrementan el segundo número. Sólo incluyen parches y resolución de bugs (bugs fixes) de la versión principal. Así tenemos p.ej. 5.1, 5.2, 5.3, 5.4, 5.5 y 5.6 por ahora.  Moverse entre versiones menores es un proceso por lo general simple. Basta con (haciendo un backup) actualizar nuestra version en los directorios fuente, y desplegar. Por lo general es un proceso simple…(¡¡o al menos mucho mas simple que un cambio de versión mayor¡¡)

El compromiso de la comunidad Dpsace es proporcionar parches de seguridad a las tres últimas versiones mayores de Dspace.  Es decir si , ahora al escribir esto, mayo de 2017, hay una vulnerabilidad  detectada y se corrige con un parche, se emitiría una actualización, denominándose 4.8 , 5.7 y 6.1 que son los siguientes numeros [minor] que hay disponibles…… Sin embargo, la comunidad de desarrollo DSpace solo nos comprometemos a parches funcionales para la versión última (aunque a veces se aprovecha para meter algún parche a versiones mayores anteriores….)

DSpace versión 6

Bien, la versión 6 ya está aquí, se anunció su disponibilidad el 24 de octubre y ya está lista para ser instalada…

¿y qué nos trae de nuevo la versión 6? Pues unas cuantas funcionalidades y cambios:

  • Incorporación de Hibernate, herramienta de mapeo objeto-relacional, paso necesario para poder abordad la refactorización de la API de Dspace (estamos pensando en la versión 7). Si teníais código propio que accedía a la base de datos de Dspace, posiblemente tengas que reescribirlo…
  • Se mejora el sistema de configuración de Dspace, que ahora usa la sintaxis de Apache Commons Configurations. Las configuraciones de dspace.cfg pueden recargarse sin rearrancar el Tomcat, el fichero de configuración build.properties se ha cambiado por un local.cfg  y algunas mejoras más. Algunas mejoras, pero al ser un nuevo sistema pues hay que volver a aprender la forma de hacer despliegues…
  • Se ha retirado el soporte al sistema de acceso al almacenamiento (assetstore) basado en SRB (no habia constancia de que lo usasen muchas instalaciones). Para compensar, se ha añadido soporte al sistema Amazon S3.
  • Ya no se distribuye la interfaz LNI (poco o nulo uso).  Quedará no obstante como «add-on»
  • El motor de búsqueda basado en Lucene y los métodos de browse basados en base de datos desaparecen por completo del código (deprecated, en terminología de desarrollo de software). Ya se desaconsejaba su uso en la v4, si querías usarlo daba muchísimos problemas en la V5 y se ha finalizado eliminando estos elementos de código.
  • Tenemos unos nuevos informes, denominados Healthcheck (chequeo de salud) que revisan una serie de parámetros del repositorio y pueden enviar esos informes al administrador, por correo electrónico. Nos parece un avance sobre las posibilidades de comprobación existentes en versiones anteriores.
  • Es posible exportar los resultados de una búsqueda a CSV  (en XMLUI)
  • Hay un panel de control administrativo ampliado y configurable, las opciones del control panel, crecen y crecen….
  • Se anuncia el framework de importación de metadatos (aclaremos que realmente estaba  ya funcionando e incluso documentado extensamente en la versión 5) pero parece que hacen ahora el anuncio oficial. Será porque se aprovecha este framework para posibilitar la importación de metadataciones desde Pubmed, CrossRef, ScienceDirect, que insistimos, ya se podía hacer en la versión anterior….
  • La interface REST admite los mismos métodos de autenticación que las UI (hasta ahora solo se soportaba el login-password). Parece lógico, ¿verdad? sobre todo desde que se plantea para la próxima versión desagregar DSpace de las interfaces de usuario…
  • Aparece un sistema de chequeo de metadatos (REST metadata quality control) que permite interrogar via la interface REST sobre los valores de metadatos que tenemos en nuestros ítems..¡¡¡ muy curioso el funcionamiento !!! recomendable….
  • El operador de búsqueda de Discovery pasa a ser AND (el OR causaba más preguntas de la cuenta, pero realmente el cambio es mínimo, unas lineas en un fichero de configuración)
  • Se posibilita el indexado de documentos que se escriben de derecha a izquierda (RTL), como el árabe o el hebreo.
  • Se actualiza a PDfbox 2.0 y se incluye un nuevo generador de miniaturas de PDF (por lo que ya no es necesario el xpdf)

y seguro que me dejo algo….

Novedades Dspace en la conferencia Open Repositories 2016

La Conferencia Internacional de Repositorios Abiertos (11th International Conference on Open Repositories) se acaba de celebrar la semana pasada en Dublín. Al ser uno de los eventos principales en el mundo de los repositorios, pues no nos lo pudimos perder, pues concentra un gran número de novedades, presentaciones, proyectos, comunicaciones y  asistentes, de evidente interés.

Además, la Conferencia se aprovecha para la sesión plenaria de DuraSpace, en que la dirección rinde cuentas a los miembros de la organización, ver las diapositivas de la presentación y se anunció la nueva política de transparencia y apertura, openness, de DuraSpace.

Adicionalmente se celebraron los DSpace Interest Groups,  en que se actualiza el estado del proyecto. Tim Donohue, responsable técnico del proyecto DSpace, junto con un grupo de desarrolladores proporcionó una visión de la versión 6, del proyecto DSpace-CRIS y de la nueva interface de Dspace basada en Angular2.js. Ampliaremos estos temas en otro post.

Y no acabó ahí la conferencia, pues el jueves el DSpace Steering Group hizo una presentación sobre el Estado de Dspace, hablando sobre el modelo de gobernanza, la financiación, la membresía, el papel de los diversos grupos en el ecosistema DSpace  (DCAT, Registered Service Providers, Marketing Interest Group…) y la planificación o roadmap.

En cuanto a nosotros, pues la conferencia era un lugar ideal para presentar a una audiencia especializada el módulo OPRM que os hablamos en otro post. Y alli hablamos,  junto con Pandelis Perakakis, responsable del proyecto Open Peer Review, e Isabel Bernal, de digital.CSIC. Os mantendremos informados de novedades en este módulo.
IMAG1154

¿Por qué debiera interesarte la versión 6 de Dspace?

Hemos de decir que DSpace 6 es, principalmente, una versión de transición hacia la versión 7, esa esperada versión en la que sólo habrá una única interfaz de usuario. Por eso, para poder abordar una transición manejable a la V7, se ha tenido que re-escribir la mayor parte de la Java API de DSpace. Igualmente se ha mejorado el sistema de configuración, para evolucionar hacia un sistema más flexible y con capacidad de carga dinámica de las configuraciones.

Para dar una idea del esfuerzo tras este cambio, unas cifras del mismo:

      La refactorizacion de la Java API ha requerido cambiar 1,440 de los ficheros java de la apliciación DSpace.
      El Sistema Mejorado de Configuración (Enhanced Configuration System) modifica menos ficheros ¡solo 324¡¡¡ pero afecta a unas 6,000 líneas de código con el fin de lograr un sistema más flexible de configuración de Dspace.

Si a lo anterior el añadimos unos procesos de prueba de Dspace (los testhaton son una parte de este proceso…) mas intensos, pues tenemos unas cuantas buenas razones para el retraso que esta versión está sufriendo (de finales de 2015 a enero de 2016, luego al 8 de febrero y luego a una fecha indeterminada entre marzo y abril o mayo, quién sabe…)

Bien, y funcionalmente ¿qué ofrece la nueva versión?

  • Mejoras a los plugins de almacenamiento físico, incluyendo soporte para el almacenamiento Amazon S3
  • Chequeo del estado del repositorio, con informes al administrador via correo electrónico.
  • Panel de control administrativo ampliado
  • mejoras a la REST API con soporte a todos los métodos de autenticación,  Shibboleth, LDAP, etc
  • mejoras a XMLUI : importación de metadatos de fuentes externas como Pubmed y  ScienceDirect).
  • mejoras a XMLUI:  exportación de resultados de búsqueda a CSV

Posiblemente no encuentres muchas razones (funcionales) para  plantear una migración, excepto que tu versión actual sea realmente antigua y quieras recoger los frutos funcionalmente jugosos de las versiones 3, 4 y 5.