grands, mais ce n'est peut-être pas si grave (moins que dans l'autre sens du moins), et en pratique à l'heure peu de gens connaissent et sont sensibles à cette question donc la probabilité d'être rejeté sur cette base me paraît faible
J'ignore si un travail semblable a été mené pour le cas du logit. En pratique si je devais conseiller quelqu'un, je crois que je conseillerais, sauf si une référence existe avec du code facile à implémenter, de rester sur l'inférence classique : elle va donner des écarts-types vraisemblablement trop
Pour ce cas-là, il peut sembler plus approprié de faire appel à une inférence fondée sur le caractère probabiliste de l'assignation au traitement : c'est l'argument développé dans ce papier récent, qui fait en particulier le travail pour la régression linéaire onlinelibrary.wiley.com/doi/abs/10.3...
La Q3 est subtile ! Effectivement l'inférence dans le cadre usuel se fonde sur l'hypothèse d'un échantillonnage probabiliste dans une population infinie, ce qui n'est pas adapté au cas du travail sur une population exhaustive
Comme c'est par nature une hypothèse sur des inobservables (comme tout ce qui a trait à l'inférence causale !), il n'est pas possible de la tester directement mais en connaissant bien le contexte on peut se donner de plus ou moins bonnes raisons d'y croire
pour deux années différentes, il n'y a pas de différences systématiques dans les caractéristiques inobservables qui produisent la réussite de deux étudiants ayant les mêmes caractéristiques observables
Pour Q1 et Q2 c'est un peu la même question je crois ! Ma réponse serait plutôt oui, mais rn ayant conscience que c'est déjà un peu l'hypothèse implicite de ce que tu fais. L'interprétation de ton coefficient/odd-ratio comme effet causal du contexte d'enseignement tient si tu peux supposer que