Pagina 1 di 1

PYTHON - analizzare log

Inviato: venerdì 20 maggio 2016, 11:41
da DavideDaSerra
Ciao, devo analizzare un log,
volevo chiedere come posso scrivere in pandas che 'raggruppi' il mio dataframe per ip destinazione e 'sommi' i byte trasmessi a intervalli di 15 minuti.

il dataframe ha questa struttura:
timestamp - source addr (sempre uguale) - dest addr - byte trasmessi - pacchetti trasmessi

una cosa come:
  • 2012-12-01 16:04:00 localhost google.com 100 2
    2012-12-01 16:05:00 localhost canonical.org 20 1
    2012-12-01 16:07:00 localhost google.com 120 2
    2012-12-01 16:24:00 localhost canonical.org 120 30
    2012-12-01 16:24:00 localhost google.com 5 1
    2012-12-01 16:27:00 localhost canonical.org 90 3
    2012-12-01 16:27:00 localhost google.com 40 1
dovrebbe diventare:
  • 2012-12-01 16:15:00 localhost google.com 220 4
    2012-12-01 16:15:00 localhost canonical.org 20 1
    2012-12-01 16:30:00 localhost google.com 45 2
    2012-12-01 16:30:00 localhost canonical.org 210 33

edit:
con

Codice: Seleziona tutto

grouped=d.groupby(['destination', 'time'])
grouped['byte','packets'].agg(np.sum)
riesco a raggruppare per destinazione, ma non a raggruppare per quarto d'ora

Re: PYTHON - analizzare log

Inviato: venerdì 20 maggio 2016, 18:46
da Zoff
Puoi usare un Grouper: http://pandas.pydata.org/pandas-docs/ve ... ouper.html


Tirando ad indovinare la sintassi:

Codice: Seleziona tutto

grouped=d.groupby(['destination', 'time',Grouper(key='date', freq='900s')])