Cuando trabajas con datos genómicos, es muy habitual encontrarse con archivos BED, como por ejemplo en análisis de exoma. Si quieres conocer el número total de bases detalladas en el archivo, lo puedes calcular con esta simple línea de comandos:
j=0; for i in `awk -F'\t' '{print $3-$2}' file.bed`; do let j=$j+$i; echo $j; done | tail -1
En resumen, se resta la tercera columna a la segunda, hay que tener en cuenta que el archivo BED es 0-based por lo que no hace falta restarle una posición, y se van acumulando los valores en la variable $j
. Cuando acabamos de recorrer todo el fichero, seleccionamos la última línea.