La tua idea di usare dei dati fittizi è veramente ottima.
E' infatti proprio dal confronto tra i dati reali e quelli fittizi, che ci si può rendere conto se ciò che emerge dalla statistica è dovuto all'effetto del caso, oppure se è significativo.
Soltanto che tu non hai inserito dei numeri a caso, ma dei numeri a casaccio.
Si possono fare delle simulazioni, partendo però dai valori delle colonne e delle righe,
dei dati reali, sfruttando la capacità del computer di generare numeri random.
In pratica nel programma che ho fatto per analizzare i dati del censimento, c'è una procedura che permette di far divorziare tutte le donne e tutti gli uomini e di sposarli con dei nuovi partner, lasciando al computer la responsabilità degli accoppiamenti.
(Se uno è proprio sfigato, corre il rischio di rifinire accoppiato con la stessa moglie,
c'è però solo 1 probabilità sul numero totale delle coppie che ciò avvenga
)
Vedi il problema è che io quando si parla di chi-square mi confondo un po',
perchè non sono un vero e proprio matematico, allora preferisco avere un termine di paragone, piuttosto che ragionare in termini di chi-square.
Alla fine vi mostrerò dei grafici, che mettono a confronto i dati reali con quelli random in modo visivo, in modo da rendere intuitiva la significatività della statistica.