Recolectar, organizar y centralizar datos es un componente fundamental de la investigación científica. Sin embargo, para el CIAT y para el CGIAR en general, hacer que los datos de investigación agrícola estén ampliamente disponibles y sean reutilizables es una iniciativa relativamente reciente. Como resultado de esto, una política de acceso abierto y gestión de datos está en proceso de implementación, estableciendo la necesidad de recopilar y organizar datos históricos.

Como una respuesta directa a esta necesidad, el CIAT creó un nuevo equipo de gestión de datos e información liderado por la Unidad de Coordinación de Programas del Centro. Este equipo incluye cinco practicantes. El propósito de este texto es resaltar la importancia de su contribución en cubrir las necesidades de la gestión de datos en varias áreas de investigación.

Gracias a la labor de estos practicantes, se ha avanzado en la recolección de datos que no sólo estaban dispersos en diferentes ordenadores y servidores, sino también almacenados en diferentes formatos y archivos. Esta labor se inició con el programa de yuca (equipo que cuenta con Lizbeth Pino, quien cumple el rol de mediación entre los requerimientos del programa y el equipo de gestión de datos) y continuó con forrajes tropicales, arroz, fríjol y suelos. También se incluyó información ya codificada de proyectos y ensayos en África.

estudiantes en práctica (Carlos Medina, Derlyn Lourido, Luis Gonzáles, Andrea Mora y Kenji Tanaka) han ayudado a centralizar, estandarizar y organizar información que contiene datos de investigación desde los años setenta hasta la actualidad.

¿Cómo lo hacen?

Un componente importante para este proceso de estandarización de datos es la ontología, que permite definir cómo hacer mediciones de características (de cultivos) que sean comunes tanto en su método como en su escala, permitiendo la estandarización de la información de los cultivos, lo que posibilita la comparación de los datos entre diferentes Centros de investigación.

Los practicantes también han contribuido a la Integrated Breeding Platform y su Breeding Management System (BMS). BMS ha sido diseñado específicamente para ayudar a los mejoradores a gestionar sus actividades diarias a través de todas las fases de sus programas de mejoramiento. Con BMS, todos los Centros del CGIAR pueden compartir la misma ontología. Esto brinda la oportunidad de integrar información y así aprovechar los datos disponibles de las investigaciones realizadas a través de los años.

Por ejemplo, para el programa de yuca, además de incluir todos los cruzamientos, todo lo que es pedigrí de los materiales, los aportes de los practicantes fueron vitales para agregar también a este sistema los resultados de todos los ensayos que han hecho en este cultivo desde 1978 hasta 2012. Actualmente, uno de los practicantes está desarrollando un software que permita importar datos de Excel u Oracle a BMS, sin necesidad de entrarlos uno por uno.

Se espera que el próximo año, todos los datos de los cultivos del CIAT estén actualizados y disponibles en línea. A partir de ahí, la idea es que los investigadores, usando el software BMS, puedan poner directamente los resultados de los ensayos en las bases de datos.

Desarrollo de software

Además de trabajar en el almacenamiento y difusión de los resultados de los procesos de investigación y los proyectos desarrollados en el CIAT, los practicantes del equipo de gestión de datos también han aportado al desarrollo y fortalecimiento de ssmtaoluciones de software que se adecúan a las necesidades de las áreas de investigación. Por ejemplo, para atender el tema de transferencia de materiales se diseñó un software hace algún tiempo para el Acuerdo Normalizado de Transferencia de Material (Standard Material Transfer Agreement, SMTA) que permite hacer trazabilidad a cualquier material que se trasfiera de cualquier país a otro.

También, en el marco de la tesis de uno de los practicantes, se desarrolló una nueva versión de un paquete de software que permite realizar una gestión de todos los aspectos relacionados con genética de yuca.

Hacia una cultura de datos abiertos

Estos estudiantes en práctica han contribuido a fortalecer los procesos de investigación del CIAT y han facilitado los avances del Centro hacia una cultura de datos abiertos. En este sentido, la resistencia inicial de los investigadores frente a la publicación de sus datos ha tenido una evolución interesante.

Históricamente, los científicos han protegido sus datos incluso yendo tan lejos como para decir “mis datos son mis datos”, y no compartirlos ni con su propio equipo. Cuando accedían a ponerlos en las bases de datos, tenían una condición: que no le entregaran eso a nadie en particular.

Ahora, con la política institucional de acceso abierto hay una mayor conciencia y un liderazgo más fuerte que hace énfasis en la importancia de asegurar que los datos estén disponibles y sean accesibles. Por esto, la creación de este nuevo equipo, más cercano a los investigadores y con una mayor visibilidad dentro de la institución, se considera muy oportuna.

Datos, aprendizaje y conocimiento

by Arturo Franco, coordinador de sistemas de bases de datos

Los practicantes y sus roles continuarán siendo esenciales en este proceso, pues con su entusiasmo e ideas frescas, aportan innovación al desafío de que los datos de investigación del CIAT lleguen al mayor número de beneficiarios, maximizando su accesibilidad global y su impacto potencial.

Para más información acerca del grupo de Gestión de Datos e Información del CIAT contacte a:

Leroy Mwanzia, manager gestión de datos e información (l.mwanzia@cgiar.org)
Arturo Franco, coordinador de sistemas de bases de datos (a.franco@cgiar.org)
Carolina Garcia, analista de sistemas (c.garcia-ciat@cgiar.org)
Paola Cruz, analista de sistemas (p.a.cruz@cgiar.org)

Pin It on Pinterest

Share This