volevo chiedere come posso scrivere in pandas che 'raggruppi' il mio dataframe per ip destinazione e 'sommi' i byte trasmessi a intervalli di 15 minuti.
il dataframe ha questa struttura:
timestamp - source addr (sempre uguale) - dest addr - byte trasmessi - pacchetti trasmessi
una cosa come:
- 2012-12-01 16:04:00 localhost google.com 100 2
2012-12-01 16:05:00 localhost canonical.org 20 1
2012-12-01 16:07:00 localhost google.com 120 2
2012-12-01 16:24:00 localhost canonical.org 120 30
2012-12-01 16:24:00 localhost google.com 5 1
2012-12-01 16:27:00 localhost canonical.org 90 3
2012-12-01 16:27:00 localhost google.com 40 1
- 2012-12-01 16:15:00 localhost google.com 220 4
2012-12-01 16:15:00 localhost canonical.org 20 1
2012-12-01 16:30:00 localhost google.com 45 2
2012-12-01 16:30:00 localhost canonical.org 210 33
edit:
con
Codice: Seleziona tutto
grouped=d.groupby(['destination', 'time'])
grouped['byte','packets'].agg(np.sum)
