0

Línea de comandos para contar posiciones de un archivo BED

Cuando trabajas con datos genómicos, es muy habitual encontrarse con archivos BED, como por ejemplo en análisis de exoma. Si quieres conocer el número total de bases detalladas en el archivo, lo puedes calcular con esta simple línea de comandos:

j=0; for i in `awk -F'\t' '{print $3-$2}' file.bed`; do let j=$j+$i; echo $j; done | tail -1

En resumen, se resta la tercera columna a la segunda, hay que tener en cuenta que el archivo BED es 0-based por lo que no hace falta restarle una posición, y se van acumulando los valores en la variable $j. Cuando acabamos de recorrer todo el fichero, seleccionamos la última línea.

 

Jorge

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *