Dans R, quelle est la différence entre dt (), pt () et qt (), par rapport à la distribution t de l'élève?


Réponse 1:

C'est parfois déroutant, j'ai décidé de peindre un petit tableau pour mieux illustrer ma réponse. Les fonctions similaires concernent les principales distributions de probabilités implémentées dans R, et fonctionnent toutes de la même manière, selon le préfixe:

d - densité, donne la valeur de la fonction de densité en un point donné

p - probabilité, donne CDF, c'est-à-dire probabilité de renvoyer un nombre plus petit qu'un argument à cette fonction

q - quantile, CDF inverse, c'est-à-dire quelle valeur est au quantile donné.

Permettez-moi de l'expliquer plus en détail. Considérons la distribution t avec 30 degrés de liberté, qui sera proche de la distribution normale.

qt (.95,30) renverra 1,69 qui est la valeur du 95e centile de cette distribution. Cela signifie que 95% de tous les nombres de notre distribution sont inférieurs à 1,69 et seulement 5% sont supérieurs. Il s'agit de CDF inversé.

De même, si vous utilisez pt (1,69,30), vous obtiendrez un résultat proche de 95%. Cette fonction renvoie le CDF, qui est la probabilité d'obtenir un nombre inférieur ou égal à l'argument. Puisque 1,69 est notre 95e centile, la valeur CDF est en effet de 95%.

dt (x, 30) donnera la valeur de la fonction de densité de probabilité en x. Pour 1,69, il est de 0,096, ce qui est plutôt faible, tandis que pour 0, il est de 50%.

Gardez à l'esprit que ce n'est pas une probabilité d'obtenir ce nombre. Pour obtenir la probabilité, vous devez intégrer la fonction de densité sur une plage de valeurs. C’est pourquoi la fonction CDF est utile, car en calculant une différence pour deux valeurs, vous pouvez obtenir une probabilité d’obtenir un nombre qui se situe entre ces deux nombres.


Réponse 2:

Je suppose que ce sont des fonctions de la distribution t de Student et je répondrai sur cette base.

dt () renvoie la densité de probabilité de la distribution t pour un degré de liberté donné. Je peux dessiner la distribution t avec 9 degrés de liberté et l'afficher comme suit:

Cela donne:

pt () donne les probabilités de queue. Supposons que vous effectuez un test de queue inférieur et que votre statistique de test soit égale à -2,75 avec les mêmes degrés de liberté. Ensuite, vous pouvez calculer la probabilité de queue inférieure comme suit:

pt (-2,75, df = 9, lower.tail = TRUE)

Et votre réponse est:

0,0112

Vous rejetez donc votre null à 5% mais pas à 1% mais vous êtes proche.

qt () est la fonction inverse de t vous donnez une probabilité et récupérez un quantile de la distribution t. Supposons que vous vouliez un intervalle de confiance de 99%. Cela laisserait 0,005 dans les deux queues (1 - 0,99) / 2. Puisque j'avais utilisé des tables qui allaient de moins l'infini à t, je calculerais ce quantile comme:

qt (0,995, df = 9, lower.tail = TRUE)

[1] 3.249836

>