Y a-t-il une différence entre les modèles additifs et les modèles additifs généralisés? http://artsandsciences.sc.edu/geog/hvri/sites/sc.edu.geog.hvri/files/attachments/SoVI%20recipe_2016.pdf


Réponse 1:

Oui.

Un modèle additif ajuste les données comme la somme de prédicteurs univariés. Un modèle additif généralisé s'adapte à une transformation des données, comme le logarithme ou l'inverse. Pour un statisticien, il s'agit simplement d'une transformation de la variable dépendante, qui est une technique standard utilisée dans toutes sortes d'ajustements, mais elle a son propre nom pour des raisons historiques.

Votre référence dit de les ajouter. Je ne sais pas comment vous pourriez les mettre dans un modèle de régression, car vous n'avez pas de variable dépendante. Vous semblez construire un index plutôt que de prédire quelque chose.

Je ne fais que deviner ici, mais le but de la procédure semble être de réduire la dimensionnalité. Vous avez beaucoup de données de recensement et souhaitez dériver un indice de vulnérabilité sociale que vous utiliseriez ensuite pour de futures recherches.

La seule raison de transformer le score de vulnérabilité sociale serait de lui donner des propriétés statistiques standardisées, telles qu'une distribution normale ou uniforme, ou peut-être de rendre sa valeur attendue égale à une autre mesure de vulnérabilité sociale pour faciliter les comparaisons. Cela pourrait le rendre plus pratique à utiliser dans les recherches futures. Mais cela ne changerait pas le contenu informatif de la mesure. N'importe qui pouvait toujours transformer la mesure dans les recherches futures.

Vous pouvez ajouter une étape où vous mettez des poids sur les composants individuels avant de les ajouter. Mais cela semblerait vaincre le point. Je pense que ce qui se passe ici, c'est que vous avez trop de variables pour utiliser chacune individuellement comme variable indépendante. Si vous aviez les informations nécessaires pour attribuer des poids à chacun pour l'indice, pourquoi ne pas simplement utiliser les composants individuellement dans une régression? Il peut y avoir une raison à cela, par exemple, vous pouvez avoir les informations dans un ensemble de données pour estimer les poids, mais vous souhaitez utiliser la mesure dans un autre ensemble de données où vous ne le faites pas. Mais je suppose que vous venez d'ajouter ici.