What is a “biocurator”?

Tras dos meses y medio trabajando aquí, creo que ha llegado el momento  de responder a esta pregunta que me han hecho muchas veces, sobre todo en mi familia, y para la que todavía no he tenido una respuesta muy elaborada. ¿Qué es un biocurador? (y, ¿cómo se traduciría esta palabra al castellano?).

Para hacernos una idea, veamos por ejemplo la definición de la Sociedad Internacional de Biocuración.

La biocuración consiste en el análisis, interpretación e integración de información relevante para la biología dentro de una base de datos o recurso que permite añadir valor interconectando literatura científica y grandes conjuntos de datos dentro de un mismo contexto.

¿Se correspondería esta definición con lo que hacemos nosotros? Pues yo creo que, si cambiamos la palabra “biología” por otra más apropiada como toxicología, patología o investigación farmacológica, tenemos una definición bastante buena. Lo que hacemos es interconectar información que procede de fuentes muy diversas dentro de lo que se llama el “Programa de Inteligencia en Seguridad” (en inglés lo conocemos por SIP, pero creo que las siglas españoles no serían tan atractivas…). El “contexto” del que habla la definición, en este caso, sería la farmacología. Nuestro SIP es utilizado en diferentes fases de la investigación de nuevos fármacos, ya sea bien para predecir efectos adversos asociados a una determinada estructura química o diana farmacológica, o bien para encontrar la explicación para una toxicidad observada en animales o pacientes.

El primer paso de la biocuración es la identificación de fuentes de información relevantes para la investigación farmacológica. Pueden ser de todo tipo: artículos científicos, etiquetado de fármacos, informes de la FDA, ensayos clínicos y preclínicos, high throughput screening, bases de datos preexistentes… etcétera.

Una vez hemos identificado la información que queremos incorporar, hay que extraerla. Este proceso puede ser más o menos complicado dependiendo de cuál sea la fuente. Si se trata de texto, como por ejemplo el resumen de un artículo, no tenemos más que confirmar que la frase “fuente” concuerda con la afirmación que vamos a hacer. Por ejemplo, si la frase fuera: “Tras la administración del fármaco X, se observó un aumento de peso significativo”, podríamos decir “Fármaco X – AUMENTA – Peso”, y añadir el contexto, por ejemplo: Rata, Sprague-Dawley, tejido indefinido.

Sin embargo, en ocasiones querremos extraer información obtenida a partir de resultados de experimentos; por ejemplo, expresión génica medida en microarrays, resultados de ensayos expresados en forma de IC50, Ki, EC50, cuestionarios psicométricos, parámetros de bioquímica clínica… Para estos casos, hay que determinar la mejor forma de analizar la información, y una vez hecho esto, extraer aquellos resultados que sean significativos.

Por último, y una vez que hemos hecho esto, realizaremos un control de calidad para asegurarnos de que se alcanza la precisión requerida, y añadiremos los resultados a la base de datos.

¡Los biocuradores manejan conjuntos tan grandes de datos que necesitan dos pantallas!

¡Los biocuradores manejan conjuntos tan grandes de datos que necesitan dos pantallas!

¿Cómo sería un día en la vida de un biocurador? Hoy, por ejemplo, he dedicado la mañana a investigar sobre cómo comparar resultados de IC50 para diferentes ligandos y receptores y poder armonizarlos. Después hemos tenido una reunión del departamento de “Life Sciences”, en la que los más nuevos hemos comentado los avances que habíamos hecho en la curación y los mayores han contado sus conversaciones con clientes potenciales. Después, me he dedicado a extraer la información de un microarray que venía como tabla suplementaria en un artículo, y finalmente he curado afirmaciones sobre efectos de compuestos en el aparato respiratorio, que habían sido extraídas de PubMed. A lo largo de estas semanas, me he dado cuenta de que sería muy útil tener conocimientos de programación, esto facilitaría bastante el manejar volúmenes grandes de datos, por lo que voy a tratar de aprender Perl durante los próximos meses.

Si os interesa saber más, os recomiendo este artículo de la revista Database. En él hablan de cosas como el perfil del biocurador típico, los motivos por los que se escoge este trabajo, qué habilidades son más importantes o cuáles son los aspectos más positivos del trabajo. Me ha hecho mucha gracia que una de las recompensas del trabajo, según estos biocurradores, sea “una sensación cuantificable de progreso”. No sé si otras profesiones darían esa respuesta, sobre todo teniendo el cuenta que el 41% de ellos dan como motivo para elegir la profesión “apartarse de la investigación experimental”.

Y esto es todo. Espero que con este blog os hayáis acercado un poco más al misterioso mundo de las bases de datos biológicas. Especialmente espero que Ade, Jaime, Alberto, Marta, Ramiro y Jimi hayan podido despejar sus dudas. De Gon no digo nada porque doy por hecho que ya debe de saberlo todo sobre el tema. 😉

Anuncios

13 Respuestas a “What is a “biocurator”?

  1. El inglés te ha jugado una mala pasada: “Hoy, por ejemplo, he dedicado la mañana a investigar sobre cómo comparar resultados de IC50 para diferentes ligandos y receptores y poder harmonizarla.”

    ¿No sonaría mejor “anotador” que biocurador? A mi es que me suena raro, raro…

    • Suena raro, si! “Anotador” lo asociaría más a aquél que anota las funciones de los genes en un genoma, (que quizás sea un tipo de biocurador tmb)…y tmb podemos traducirlo como “biocurrante”, no suena mal!

  2. Pues si, ayuda mucho para entender lo que haces.

    La verdad es que el perl no es complicado, como todo, es complicado manejarlo bien.

    Yo a lo mejor me ongo a recordar perl por otros motivos (para analizar cantidades de otros datos 😉 Estoy hecho un copiota….

  3. Python! Python, no Perl! (a mi es que me tiene enamorado…)
    Pero coincido con lo que dicen más arriba! Da gusto leerte!!!! Muy buena explicacion de lo que es curar además (y no sabes lo que se agradece el pillar datos curados por personas para usarlos luego…madre mía, pero una barbaridad)

    que tal los microarrays? se dejan domar?

    • Lo siento Edu, pero aquí son de Perl! No puedo elegir!
      Los microarrays en unos días estarán domados, sí señor! Igual que sus amigos los IC50 y los alanina aminotransferasa!
      Cómo va EduMind?

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s