Même si la courbe est la même, quelle est la différence entre la distribution de Cauchy et la distribution gaussienne?


Réponse 1:

Un Cauchy ne ressemble pas à une normale. L'aspect exact d'un Cauchy dépend des paramètres que vous utilisez, mais il ne semble pas normal.

par ex.

set.seed (1234) # Définit une valeur de départ aléatoire x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, moyenne (x1), sd (x1)) plot (densité (x1)) plot (densité (x2))

Ne regardez pas du tout la même chose. Et x1 va de -178 à 702 tandis que x2 va de -76 à 71.


Réponse 2:

Comme vous pouvez le voir, les deux courbes se ressemblent en ce qu'elles ont toutes les deux une seule "bosse" et s'étalent de plus en plus loin. Ils sont différents en ce que le Cauchy a un pic plus étroit et s'étale plus lentement - il y a une probabilité beaucoup plus grande d'obtenir des valeurs loin du pic par rapport à la distribution normale. Cette différence a de nombreuses conséquences mathématiques différentes - comme le Cauchy n'ayant pas de valeur moyenne bien définie et ayant une distribution d'échantillonnage particulière où la «loi des grands nombres» ne s'applique pas.


Réponse 3:

Même si la courbe est la même, quelle est la différence entre la distribution de Cauchy et la distribution gaussienne?

Superficiellement, ils se ressemblent. Mais montrez-moi un graphique de la fonction de densité d'une distribution et dites-moi que c'est soit Cauchy soit Gaussien, je saurais lequel (en supposant que c'était vraiment l'un d'entre eux). Le Cauchy a des queues beaucoup plus longues.

Lorsque nous avons une famille de distributions avec des paramètres inconnus, nous voulons estimer ces paramètres.

  • La distribution gaussienne a deux paramètres, la moyenne et l'écart type. Nous pourrions utiliser d'autres paramètres à la place, par exemple la médiane (qui est égale à la moyenne) et la plage semi-interquartile (qui est d'environ
  • 0.67450.6745
  • fois l'écart-type) .La moyenne de la distribution de Cauchy n'existe pas, mais la médiane est le centre de symétrie. L'écart type n'existe pas non plus, mais la moyenne des écarts au carré de la médiane est infinie.

Voilà donc la principale différence. Nous pouvons prendre les paramètres de l'une ou l'autre distribution comme étant la plage médiane et semi-interquartile, mais nous ne pouvons pas utiliser la moyenne et l'écart type pour le Cauchy car ils n'existent pas.

Lorsque nous prenons un échantillon pour nous aider à estimer les paramètres d'une distribution, nous calculons des statistiques telles que la moyenne et l'écart type des valeurs de l'échantillon. Ces statistiques ont des distributions. La distribution d'une statistique d'échantillon est connue comme sa distribution d'échantillonnage.

  • Si la distribution de la population est gaussienne, (la distribution d'échantillonnage de) la moyenne de l'échantillon est également gaussienne et a un écart-type beaucoup plus petit, donc un grand échantillon donne des estimations plus précises que de simplement prendre une observation.Si la distribution est Cauchy, la la moyenne de l'échantillon a également une distribution de Cauchy, mais elle a exactement la même plage médiane et semi-interquartile que la distribution d'origine. Il n'y a aucun avantage à prendre la moyenne d'un échantillon.

Voilà donc une autre différence. La moyenne d'un échantillon de la gaussienne est utile pour estimer la moyenne (ou la médiane); la moyenne d'un échantillon pour le Cauchy est inutile pour estimer la médiane. Il est préférable d'utiliser la médiane de l'échantillon, qui donne des estimations plus précises.

Des arguments similaires s'appliquent à l'estimation de l'écart (quelle que soit la manière dont vous le définissez) de l'une ou l'autre distribution. Les estimations habituelles pour une distribution gaussienne ne fonctionnent pas pour une distribution de Cauchy.

La vraie différence réside dans la formule mathématique de la densité. Sous forme standard, la gaussienne a une densité

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

et le Cauchy a une densité

1π(1+z2)\frac1{\pi(1+z^2)}

.

Notez que les deux

zz

s sont différents. Dans le premier cas, l'écart type est

11

, dans le second cas, le quartile supérieur est

11

.

La fonction de distribution (la probabilité que

ZzZ\le z

) n'a pas de forme fermée nette pour la distribution gaussienne, mais il en a pour le Cauchy, c'est

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Si vous voulez représenter graphiquement les distributions sur les mêmes axes pour voir la différence, vous devez faire correspondre les paramètres. Je standardiserais donc la gaussienne pour que les quartiles inférieur et supérieur soient

0.6745-0.6745

et

0.67450.6745

, c'est-à-dire que l'écart-type est égal à

1.48261.4826

et utiliser le formulaire standard pour le Cauchy. Les zones sous les graphiques doivent être égales, de sorte que les hauteurs au centre doivent être mises à l'échelle de manière appropriée (

0.2690.269

pour le gaussien et

0.3180.318

pour le Cauchy - le Cauchy est plus grand au milieu et plus haut dans la queue).