[Qualsiasi Linguaggio]Raggruppare liste per similiarità

Linguaggi di programmazione: php, perl, python, C, bash e tutti gli altri.
TommyB1992
Scoppiettante Seguace
Scoppiettante Seguace
Messaggi: 857
Iscrizione: domenica 7 luglio 2013, 15:55
Desktop: GNU/Linux
Distribuzione: Ubuntu 22.04.2 LTS
Sesso: Maschile

[Qualsiasi Linguaggio]Raggruppare liste per similiarità

Messaggio da TommyB1992 »

Mi servirebbe qualche formula matematica/libreria di machine learning che mi effettui dei raggruppamenti per similiarità.

Gruppo 1)
[0, 0, 0, 0, 27, 0, 0, 0, 0, 7, 0, 8, 1, 5, 5, 0, 10, 0, 11, 4, 12]

Gruppo 2)
[2, 3, 4, 4, 3, 4, 3, 4, 2, 4, 2, 4, 4, 2, 10, 1, 0, 11, 5, 6, 12]

Gruppo 3)
[2, 3, 4, 4, 3, 4, 3, 4, 2, 4, 2, 4, 4, 2, 10, 2, 0, 11, 4, 6, 12])


In questo caso se notate, il gruppo 2 e 3 sono "quasi" identici (differiscono solo per alcuni elementi), vorrei raggruppare il 2 con il 3 e lasciare il primo da solo.

Informazioni
- Questi 3 gruppi sono solo d'esempio visto che ho a che fare con migliaia di gruppi
- Come per il k-mean vorrei poter essere io a decidere il numero di clusters
korda
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1720
Iscrizione: giovedì 24 dicembre 2020, 15:58

Re: [Qualsiasi Linguaggio]Raggruppare liste per similiarità

Messaggio da korda »

TommyB1992 ha scritto:
mercoledì 25 gennaio 2023, 13:43
Mi servirebbe qualche formula matematica/libreria di machine learning che mi effettui dei raggruppamenti per similiarità.

Gruppo 1)
[0, 0, 0, 0, 27, 0, 0, 0, 0, 7, 0, 8, 1, 5, 5, 0, 10, 0, 11, 4, 12]

Gruppo 2)
[2, 3, 4, 4, 3, 4, 3, 4, 2, 4, 2, 4, 4, 2, 10, 1, 0, 11, 5, 6, 12]

Gruppo 3)
[2, 3, 4, 4, 3, 4, 3, 4, 2, 4, 2, 4, 4, 2, 10, 2, 0, 11, 4, 6, 12])


In questo caso se notate, il gruppo 2 e 3 sono "quasi" identici (differiscono solo per alcuni elementi), vorrei raggruppare il 2 con il 3 e lasciare il primo da solo.

Informazioni
- Questi 3 gruppi sono solo d'esempio visto che ho a che fare con migliaia di gruppi
- Come per il k-mean vorrei poter essere io a decidere il numero di clusters
Machine learning mi sembra esagerato per lo scopo, anche una semplice SVM forse sarebbe eccessivo.

Io comincerei buttandomi a fondo su una cluster analysis, e non c'è linguaggio più adatto di R per fare questo.

Se poi nemmeno con il package più spinto la spunti allora tenterei la strada delle reti neurali e del Self Organizing Maps (SOM): anche qui c'è qualcosa in R, ma molto di più con MatLab (che però è a pagamento). Qui c'è qualcosa che avevo seguito da vicino parecchi anni fa in una collaborazione, per darti un'idea.

L'AI del machine learning lo lascerei davvero come ultima spiaggia...
Io non sono Bagheera né Akela, io non frequento la Rupe.
Io sono Kaa: faccio ballare le scimmie alle Tane Fredde.
TommyB1992
Scoppiettante Seguace
Scoppiettante Seguace
Messaggi: 857
Iscrizione: domenica 7 luglio 2013, 15:55
Desktop: GNU/Linux
Distribuzione: Ubuntu 22.04.2 LTS
Sesso: Maschile

Re: [Qualsiasi Linguaggio]Raggruppare liste per similiarità

Messaggio da TommyB1992 »

Perdonami per l'appunto ma le SOM sono comunque Machine Learning.

Comunque grazie per lo spunto, sicuramente può rientrare nel ventaglio delle soluzioni da provare.

Nel frattempo attendo anche altre soluzioni così da poterne provare differenti e poi valutare quella che funziona meglio
korda
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1720
Iscrizione: giovedì 24 dicembre 2020, 15:58

Re: [Qualsiasi Linguaggio]Raggruppare liste per similiarità

Messaggio da korda »

TommyB1992 ha scritto:
giovedì 26 gennaio 2023, 7:24
Perdonami per l'appunto ma le SOM sono comunque Machine Learning.
Vero, per questo lo lasciavo come alternativa nel caso non bastasse la cluster analysis tradizionale
Poi, con machine learning intendevo la consuetudine modaiola odierna di algoritmi di AI attuali, le SOM non sono proprio un metodo inventato ieri.
Io non sono Bagheera né Akela, io non frequento la Rupe.
Io sono Kaa: faccio ballare le scimmie alle Tane Fredde.
Scrivi risposta

Ritorna a “Programmazione”

Chi c’è in linea

Visualizzano questa sezione: dalca, nik1404, TommyB1992 e 6 ospiti