[RISOLTO]Grep o AWK per estrarre blocco di testo
Inviato: giovedì 5 maggio 2016, 19:32
Ciao ragazzi, altro giro altro dubbio, allora ho un giga file di testo di questo tipo:
Devo riuscire ad estrarre (in bash) il blocco di genoma fra i due >gi.... questo per 400 blocchi, iterarlo per 400 volte è l'ultimo dei miei problemi, il problema risiede nell'estrazione del blocco ho tentato con:
senza risultato, qualcuno di voi potrebbe risolvermi il dubbio? Grazie mille davvero!
Codice: Seleziona tutto
>gi|526245010|ref|NC_021865.1| Paenibacillus phage phiIBB_Pl23, complete genome
TTTGTGGCATTGTGAACTCTCTTATACAAGCCGACACGACTACGATTTTCAACCAATTCCAGAAATGGTTTGAAAGCCGT
ACAGCAGACTTTGAAAAAGAGTGGAAAGAATGGCTGGAGAAGATGAAAGATCAAGGGGGAGGGAAATTTGGTGTAACATC
CGTCAATGGTAAGACCGGGGATGTAATACTGATGGCCAAACATGTAGGGGCCCCAAGTATAAATGATCTCAGAGCATACG
CCCTGAAAGGCGAACCCGCGGGGCAGTACACGCCTACGTTTTTGAATGGTTGGTACGTACAAGCAGGTGAAGTCAAAGGG
GTTTGCTACTACAAGGATCAATTCGGCTACGTCCACCTTTATGGCACTTGCTCAGGGACTAAAACTGAGTTTGGCACACC
TTTATTCAACCTCCCGGCTGGGTTTCGTCCAAGTGGTGTAATCCGCGTTGGTTGTCTGATGATCGACTTTGCAGACTACT
CCAGATCTATTCAATTTCTAGGTGTATATCCCAGTGGAGAGGTATTGATAGAAAGTTATGGGTTACCCGGTTTTGTCTCG
etc...
TTTAGCATTTTCCCCTCCTCATTTTACGGGCAAAGGTAGGTGTTTGAGATGGATAAGATCATACAAGCGAGTCGAGTAGA
CAAAGCAGGTAAATACGTAGAAGCGTTGGCACTCATAGAGAAAGATGGCAAGTATTTTAACCTTTTAGATCAAGAGGTAC
CCATAGATGATACTGTCGTATTTGATCCTTTACCCATGCCGATTTATACGCCTATTTGGGATTTTAAAACTAAGACATGG
AAAGAAGGTTTATCTCAAGAGGAAATTGATCAGATCAAAAATCGCCCAGATCCTCCAAACCCAATGAAGGTCATGGAAAA
>gi|460042095|ref|NC_020479.1| Bacillus phage Curly, complete genome
CCCCCACCCCGATGAGGTCGCCTTCTCGTTCCCTGACACCAGAAGCTAATAAGGAGGAATACATATGAGTAAAAGTTGGA
AAGACAAGGATTACGAAGCAAAACACGAGGCAGAACACATTAGACACTACATCAGGAAAGCCAAGAAAGACCCCGAGGCG
GACTATCTGGCGGAGCTGATGTAAAAGCTATTCAGACAACTAACGCAGACTTCATTGGATACATTGAGCACCACGACCGC
AAGATCATGGAATCACTCCTTGTACCGCCATCCCTTCTAGGATTATCTCGTGGTCAATCTGGCTCTTATGCGCTGTCTTC
etc...
>gi|460042095|ref|NC_020479.1| Bacillus phage Curly, complete genome
etc...
Codice: Seleziona tutto
awk '/>gi/,/^$/{print}' viral.1.1.genomic.fna
sed -n '/>gi/, /'\n'/p' viral.1.1.genomic.fna