Bucky ha scritto:
se il numero di utenti è sufficientemente alto si può assumere che la distribuzione di utenti dei sistemi operativi sia identica a quella reale. sempre che il campione sia rappresentativo, ovvio.
1) gli utenti linux hanno ragioni per visitare di meno questi siti?
2) quanti contatti hano questi siti?
se le risposte sono NO e MOLTI (

ora non mi ricordo la formula che lega il numero di campioni alla confidenza...) allora siamo proprio lo 0,83%..
Ma ragazzi, io non voglio passare per scassaballe, ma un campione casuale non e' una cosa che uno si inventa la notte per gioco. Ci sono dei metodi per trovarlo, roba che si fa seriamente a livello scientifico, e di sicuro prendere i
CounterStat di ==>UNO<== che li vende negli USA,
non e' rappresentativo proprio di nulla, se non, appunto dei SUOI 40mila clienti, e BASTA!
Per fare inferenza statistica sul popolo della rete mondiale, bisogna usare un campione casuale VERO o comunque, almeno dichiarare i dati in modo da verificarli e contestualizzare i dati. Basterebbe, per esempio, dire
CHI sono esattamente i 40mila siti da cui Netapplications tira fuori i suoi numerini, cosa che ovviamente si guardano bene dal dare, perche' tutti gli riderebbero in faccia.
Perche' il TIPO di sito nel campione, cambia tantissimo i risultati. Gia' se scegli la lingua, cambia tutto, poi dipende dall'argomento del sito, dall'ambito geografico, da come e' realizzato, e via dicendo, le variabili sono infinite, e tutte incidono profondamente sui risultati. Se io prendo 40mila siti, per esempio, in America che trattino di tecnologia, e ne prendo altrettanti in europa che trattino argomenti sociali,
vogliamo vedere che vengono risultati diametralmente opposti?
Un campione casuale e' la base per qualsiasi valutazione seria in ambito statistico. E ripeto:
quello che tira fuori quel sitarello sono numeri in liberta', hanno un valore statistico pari allo ZERO ASSOLUTO, se non dire qualcosa riguardo al loro network di clienti, che e' solo un granello di sabbia particolare nel mare della rete,
non rappresenta assolutamente NIENTE a livello mondiale sul reale uso degli OS tra le persone.
Con questo non voglio dire che Linux sia a chissa' quale percentuale di utilizzo reale, io non lo so questo dato, e nessuno lo sa con precisione (forse appunto lo puo' abbozzare bene solo Google che puo' fare inferenza su un bacino di dati mostruoso, e non su 40mila sitarelli). Semplicemente dico che quelle statistiche non sono attendibili, che sono rappresentative di niente e che
mi fanno sorridere il mare di blog e persone che continuano imperterrito a linkare quella roba senza capo né coda come se fosse la Bibbia della Statistica.