[Python] Manipolare colonne e nome di un file.dat
Inviato: martedì 15 aprile 2014, 12:21
Ciao a tutti.
Come ho accennato nel titolo, mi capita spesso di dover manipolare il contenuto e il nome file.dat.
Per manipolazione del contenuto intendo quanto segue.
Il file.dat contiene un numero arbitrario di campi (che in quanto segue indico con $1, $2, ... $N) divisi da un separatore (generalmente uso il tab).
Mi trovo spesso a rielaborare questo tipo di contenuto, nel senso che (riga per riga) devo manipolare matematicamente i dati contenuti nelle varie colonne, con funzioni generiche, e riscriverli in un file che, a priori, contenga un numero di colonne anche differente dal numero di colonne da cui sono partito.
Per essere meno generici e più "matematici", devo prendere queste $1, $2, ... , $N e produrre un file con abbia come i-esima colonna una funzione nota solo al momento in cui lancio il programma.
Vorrei pertanto qualche suggerimento su come impostare la funzione print (python 3.x) in modo che "capisca" a run time le varie funzioni con cui rielaborare le colonne del file.dat e scrivere poi l'output.
Un'idea la ho, ma è un po' troppo complessa, quindi evito di scriverla per non confondere chi volesse aiutarmi.
Per manipolazione del nome di file.dat, intendo che il file di output avrà un nome ovviamente diverso da quello iniziale, ma che spesso è una "manipolazione" di quest'ultimo, in cui semplicemente aggiungo "qualcosa" che faccia capire il tipo di elaborazione fatta sulle colonne del file di partenza.
Anche per questo problema, avrei bisogno di qualche consiglio per muovermi in modo oculato (e come prima ho in mente alcune soluzioni che però sono un po' "complesse").
Vi ringrazio in anticipo per l'attenzione e per gli aiuti
Come ho accennato nel titolo, mi capita spesso di dover manipolare il contenuto e il nome file.dat.
Per manipolazione del contenuto intendo quanto segue.
Il file.dat contiene un numero arbitrario di campi (che in quanto segue indico con $1, $2, ... $N) divisi da un separatore (generalmente uso il tab).
Mi trovo spesso a rielaborare questo tipo di contenuto, nel senso che (riga per riga) devo manipolare matematicamente i dati contenuti nelle varie colonne, con funzioni generiche, e riscriverli in un file che, a priori, contenga un numero di colonne anche differente dal numero di colonne da cui sono partito.
Per essere meno generici e più "matematici", devo prendere queste $1, $2, ... , $N e produrre un file con abbia come i-esima colonna una funzione nota solo al momento in cui lancio il programma.
Vorrei pertanto qualche suggerimento su come impostare la funzione print (python 3.x) in modo che "capisca" a run time le varie funzioni con cui rielaborare le colonne del file.dat e scrivere poi l'output.
Un'idea la ho, ma è un po' troppo complessa, quindi evito di scriverla per non confondere chi volesse aiutarmi.
Per manipolazione del nome di file.dat, intendo che il file di output avrà un nome ovviamente diverso da quello iniziale, ma che spesso è una "manipolazione" di quest'ultimo, in cui semplicemente aggiungo "qualcosa" che faccia capire il tipo di elaborazione fatta sulle colonne del file di partenza.
Anche per questo problema, avrei bisogno di qualche consiglio per muovermi in modo oculato (e come prima ho in mente alcune soluzioni che però sono un po' "complesse").
Vi ringrazio in anticipo per l'attenzione e per gli aiuti