La vergüenza de las FPI

22 nov

Esta semana en la sección de actualidad del blog de piratas de la ciencia es mi turno y quiero denunciar al vergüenza de la resolución de las becas FPI:

”Sequro que “crisis” está entre las palabras más pronunciadas y escritas en los últimos cinco años. Y asociadas a este concepto vienen detrás todas esas palabras feas y deprimentes que inundan nuestro día a día. Sin duda para mi la que más daño hace es el “pesimismo”. Nos paraliza, nos condiciona y, sobretodo, nos hunde un poco más.

Los que trabajamos en ciencia sabíamos que esta crisis nos vendría con retraso. Y no porque seamos unos priviliegiados, sino porque nuestros presupuestos se aprueban por año y no suele ser muy habitual que nos afecten las crisis puntuales. Y el pesimismo, con ella. Personalmente, la crisis me afecta como a todos, en el bolsillo y en el ánimo. Pero no quiero caer en el pesimismo, pienso que saldremos algún día, aun no sé si mejor o peor, pero seguro que diferentes.

Seguir leyendo en castellano o en valencià.

Mezclando una paella y un western blot

7 sep

Este es el post de esta semana para el blog de piratas de la ciencia. Si has trabajado en un laboratorio seguro que has pensado muchas veces que simplemente es cuestión de seguir una buena receta, como si estuvieras en una cocina…

Cocinando un western blot

Voy al super y compro todos los ingredientes para hacer un arroz de pescado.

Voy al incubador de 37ºC y selecciono las placas Petri de esas células que llevo preparando desde hace dos meses.

Friego bien la paella y le pongo un poco de fairy por debajo.
Empiezo a montar la cámara de electroforesis y preparo y añado el separador de poliacrilamida.

Pelo los gambones. Pongo a hervir las cáscaras en el caldo previamente preparado (o comprado).
Recojo las células cuidadosamente con tampón RIPA muy frío y las conservo en hielo.

Seguir leyendo…

A map of human microRNA variation uncovers unexpectedly high levels of variability

24 ago

 

Abstract (provisional)

Background

MicroRNAs (miRNAs) are key components of the gene regulatory network in many species. During the past few years, these regulatory elements have been shown to be involved in an increasing number and range of diseases. Consequently, the compilation of a comprehensive map of natural variability in healthy population seems an obvious requirement for future research on miRNA-related pathologies.

Methods

Data on 14 populations from the 1000 Genomes Project were analysed, along with new data extracted from 60 exomes of healthy individuals from a southern Spain population, sequenced in the context of the Medical Genome Project, to derive an accurate map of miRNA variability.

Results

Despite the common belief that miRNAs are highly conserved elements, analysis of the sequences of the 1,152 individuals indicated that the observed level of variability is double what was expected. A total of 527 variants were found. Among these, 45 variants affected the recognition region of the corresponding miRNA and were found in 43 different miRNAs, 26 of which are known to be involved in 57 diseases. Different parts of the mature structure of the miRNA were affected to different degrees by variants, which suggests the existence of a selective pressure related to the relative functional impact of the change. Moreover, 41 variants showed a significant deviation from the Hardy-Weinberg equilibrium, which supports the existence of a selective process against some alleles. The average number of variants per individual in miRNAs was 28.

Conclusions

Despite an expectation that miRNAs would be highly conserved genomic elements, our study reports a level of variability comparable to that observed for coding genes.

Paper: Genome Medicine

La igualdad de la diferencia

16 jul

La semana pasada volví a escribir en el blog de piratas de la ciencia. Siempre me ha maravillado la variabilidad generada por únicamente las cuatro bases que forman el genoma y es lo que intenté refliejar en este post:

“Siempre me han llamado la atención las diferencias entre las personas. Todos tenemos ese detalle o defecto que nos hace diferentes. Unos morenos, otras rubias; narices prominentes, narices finas; ojos marrones y grandes, ojos azules y bizcos; manos enormes y dedos gordos, manos enanas y dedos finos, y así el resto del cuerpo. Cuando era pequeño siempre me preguntaba por qué seríamos todos tan diferentes si todos éramos personas. La respuesta completa la conocí bastantes años más tarde. Y no, no era Dios.

Han pasado ya unos cuantos años desde que entendí que todas estas diferencias se deben al ADN. Aún así, sigo desconcertado y maravillado por…”

Continuar leyendo…

 

¿Compartirías tu genoma?

14 mar

Foto: mqciencia

En el post de esta semana que he publicado en el blog de piratas de la ciencia hablamos sobre la secuenciación del exoma, de cómo podrá afectar a nuestras vidas y del caso de Manuel Corpas, un investigador que ha compartido su secuenciación de exoma con la comunidad científica.

Cuando se presentaron los primeros resultados del proyecto genoma humano a principios de siglo, pocos podían imaginar que durante 2011, apenas 10 años después, se secuenciarían un total de 5.000 genomas, y que la previsión para 2012 fuera de 30.000. Por supuesto, tampoco se iban a imaginar que aquel proyecto cuyo presupuesto era de 90.000 millones de dólares y se tardó 13 años, ahora se intente abaratar a 1000$ y en un tiempo de dos semanas. El avance es más que significativo.

Desde que trabajo con datos de plataformas de ultrasecuenciación, no dejo de asombrarme todos los días. Unos días, me sorprende el gran potencial de diagnóstico que tenemos en nuestras manos; otros, me asusta la falta de privacidad a la que podemos estar abocados. De lo que sin duda estoy convencido es que todo este rapísimo desarrollo tecnológico nos lleva hacia un cambio total en el análisis y utilización de nuestro genoma sin vuelta a atrás.

Seguir leyendo…

Línea de comandos para contar posiciones de un archivo BED

7 mar

Cuando trabajas con datos genómicos, es muy habitual encontrarse con archivos BED, como por ejemplo en análisis de exoma. Si quieres conocer el número total de bases detalladas en el archivo, lo puedes calcular con esta simple línea de comandos:

j=0; for i in `awk -F'\t' '{print $3-$2}' file.bed`; do let j=$j+$i; echo $j; done | tail -1

En resumen, se resta la tercera columna a la segunda, hay que tener en cuenta que el archivo BED es 0-based por lo que no hace falta restarle una posición, y se van acumulando los valores en la variable $j. Cuando acabamos de recorrer todo el fichero, seleccionamos la última línea.

 

¿Nos sobra ADN?

25 ene

Esta es mi entrada de hoy en el blog de piratas de la ciencia. Es la segunda. La primera fue: Investigar jugando.

 

DNA basura

A todos los que estudiamos genética hace algunos años, nos enseñaron que la mayor parte del ADN de muchos organismos no tiene ninguna función conocida. De hecho, el nombre de  ”ADN basura” (“junk DNA” en inglés) con el que lo denominaron algunos grandes científicos, entre ellos el mismísimo Francis Crick, es totalmente descriptivo de lo que se esperaba de él. Incluso se pensaba que ni siquiera se expresaba en las células. Esta explicación chocó de frente con lo que yo siempre había pensado: “los seres vivos son máquinas con engranajes casi perfectos y optimizados durante miles de años”. ¿Cómo iba a dejar un organismo que la inmensa mayoría de la información que le caracteriza no sirviera para nada?

Gracias a las investigaciones llevadas a cabo en los últimos años sobre estas regiones, ahora sabemos que no es así. En los últimos años se está sustituyendo el nombre de “ADN basura” por el de “ADN no codificante“.  El término “no codificante” significa que no van a dar lugar a proteínas. Podemos encontrar gran variedad de unidades reguladoras, como los microARNs, que son moléculas de ARN con una importancia crucial en la regulación de muchos procesos, copias de  genes que han perdido su función, llamados pseudogenes, o zonas repetitivas en tándem. En definitiva, multitud de elementos reguladores y elementos cuyas funciones son completamente desconocidas y que regulan las zonas consideradas clásicamente como “importantes”.

Si nos centramos en el genoma humano, entre el 98.5 y el 98% es ADN no codificante. Es decir, la inmensa mayoría de nuestro genoma no se traduce a proteína y no sabemos asignarle ninguna función conocida. Con la secuenciación del genoma humano a principios de siglo, pensábamos que entraríamos en la fase de la proteómica, era el momento de definir todas las proteínas y conocer su función. En parte sí fue así, pero el problema se complicó con estos nuevos elementos. El horizonte de la regulación de la expresión genética se alejó y era como si hubiéramos vuelto a empezar el camino de su entendimiento.

En definitiva, cuanto más sabemos acerca de cómo está estructurada la información genética, más preguntas brotan sobre su estructura y más se complica entender cómo se comporta tanto a nivel funcional como estructural. Aunque se están haciendo muchos esfuerzos por entender estas regiones (como ejemplo, el número de artículos relacionados con los microRNAs: 14.613), aun estamos lejos de conocer todos los procesos en los que están implicados. Quedan muchas incógnitas por resolver. ¿Qué tendrá más importancia, los elementos funcionales o sus reguladores? ¿Cuántos de ellos regularán el mismo proceso? ¿Cuántos nuevos elementos reguladores aparecerán? ¿Habrá un cambio sustancial en cómo entendemos el genoma y su función?

Fuente de la imagen aquí.

—————–

Versió en valencià

A tots els que estudiàrem genètica fa alguns anys, ens ensenyaren que la major part de l’ADN de molts organismes no té cap funció coneguda. De fet, el nom “ADN escombraire” (“junk DNA” en anglès) amb el que denominaren alguns grans científics, entre ells el mateix Francis Crick, és totalment descriptiu del que s’espera d’ell. Inclús es pensava que ni tan sols s’expressava en les cèl·lules. Esta explicació va xocar de front amb el que jo havia pensat sempre: “els éssers vius són màquines amb engranatges quasi perfectes i optimitzats durant milers d’anys”. Cóm anava a deixar un organisme que la immensa majoria de la informació que el caracteritza no servira per res?

Gràcies a les investigacions dutes a terme en els últims anys sobre estes regions, ara sabem que no és així. En els últims anys s’està substituint el nom “d’ADN escombraire” pel de “ADN no codificant“. El terme “no codificant” significa que no van a donar lloc a proteïnes. Podem trobar una gran varietat d’unitats reguladores, com els microARNs, que són molècules d’ARN amb una importància crucial en la regulació de molts processos, còpies de gens que han perdut la seua funció, anomenats pseudogens, o zones repetitives en tàndem. En definitiva, multitud d’elements reguladors i elements les funcions dels quals són completament desconegudes i que regulen les zones considerades clàssicament com “importants”.

Si ens centrem en el genoma humà, entre el 98.5 i el 98% és ADN no codificant. És a dir, la immensa majoria del nostre genoma no es tradueix a proteïna i no sabem assignar-li cap funció coneguda. Amb la seqüenciació del genoma humà a principis de segle, pesàvem que entraríem en la fase de la proteòmica, era el moment de definir totes les proteïnes i conèixer la seua funció. En part si fou així, però el problema es va complicar amb estos nous elements. L’horitzó de la regulació de l’expressió genètica s’allunyà i era com si haguérem tornat a començar el camí del seu enteniment.

En definitiva, quant més sabem sobre cóm està estructurada la informació genètica, més preguntes brollen sobre la seua estructura i més es complica entendre cóm es comporta tant a nivell funcional com estructural. Encara que s’estan fent molts esforços per entendre estes regions (com exemple, el nombre d’articles relacionats amb els microRNAs: 14.613), encara estem lluny de conèixer tots els processos en els que estan implicats. Queden moltes incògnites per resoldre. Què tindrà més importància, els elements funcionals o els seus reguladors? Quants d’ells regularan el mateix procés? Quants nous elements reguladors apareixeran? Hi haurà un canvi substancial en cóm entenem el genoma i la seua funció?

Hoy es un día triste

25 nov

Hoy es un día triste. Más de un centenar de compañer@s del Centro de Investigación Príncipe Felipe no han venido a trabajar. Gente que ama la ciencia, que le gusta la innovación y han dedicado muchos años de su vida a intentar explicar procesos y mecanismos biológicos, simplemente con el objetivo de mejorar la vida de los demás. Gente que ha dedicado horas de sueño, energía vital y muchísimos esfuerzos solamente a mejorar el mundo que conoce. Pero nuestro país es así, ellos son de los primeros en pagar las consecuencias de la mala gestión. Y es un día triste porque la realidad nos ha golpeado a todos. Las cosas están mal, pero estarán peor. Y, lamentablemente, este no parece ser el único ERE en un centro de investigación. Y no nos podemos quedar parados, hay que actuar e intentar que no vuelva a pasar. ¿Qué podemos hacer? Explicar a la gente qué hacemos, para qué sirve investigar y por qué no tenemos otro camino que la inversión en la investigación y en la innovación para mejorar nuestras vidas. Ellos no lo quieren ver, pero es la única salida.

No a los recortes en invesitgación! No al retroceso social!

Un momento de completa felicidad

13 nov

Tenía la piel de gallina y estaba abrumado. Su ruina y matrimonio destrozado ya no importaban. No era como él pensaba, sino como nunca había imaginado. Podía ver y sentir todas las ondas que viajaban a su alrededor: la luz de aquella lámpara oxidada, el calor del radiador, los colores de la habitación, los ladridos del perro, TODAS! Billones de ondas le rodeaban, y chocaban contra él, confirmando la dualidad que tanto le había costado interiorizar. Era una persona completamente feliz. Ahora solo quería descansar. Se levantó y, cansadísimo, no fue capaz de evitar la atracción de aquella fuente de luz tan vibrante. Al tocarla, recordó las palabras de su padre: “Ten cuidado con este viejo cable que no tiene toma tierra”. Ese fue su último pensamiento. Su cuerpo se desplomó y con él se desvanecieron su sonrisa y las respuestas a los principios más básicos de la física.

Este fue el microrrelato que presenté para el concurso de microrrelatos de Feelsynapsis.

Fuente de la imagen.

How to extract regions with a minimum value of coverage

2 nov

One of the most important parameters in NGS analysis is coverage. Coverage (or depth) is defined as the number of times one base has been sequenced. It’s a very important parameter in variant and small indels detection and, generally, the sequencing processes are designed depending on this parameter. Last week I found with the problem that I had to retrieve the intervals with coverage greater than 30 from a alignment file in bam format. How could we do that?

You need to install samtools and bedtools in your machine. And with only one command line you can get these intervals:

samtools mpileup -B -Q 0 -d 8000 -f reference_genome.fasta alingment.bam | awk -F'\t' '{if($4>=30) print $1"\t"$2-1"\t"$2}' | mergeBed -i stdin


Firstly, with samtools program we convert the alignment bam file in pileup format. Secondly, awk helps us to extract only the positions with coverage greater than 30 and print them in bed format. As bed format is 0-based, we must print the position less 1 as start of the interval in each position. Finally, with bedtools, function mergeBed, we merge overlapping repetitive elements into a single entry.

That’s it.