Le test de McNemar

Mise en œuvre avec DS3Win

 

Mise en œuvre avec Statistica

 

Références

Rouanet, Bernard, Le Roux (1990), p.124, p.152-154.

Siegel, Castellan (1988, 2ème édition), p.75-80, 100-101.

Les données

On a une variable dichotomique (réussite / échec, favorable/défavorable…) mesurée sur les mêmes sujets, à deux moments (avant / après apprentissage, condition 1/ condition 2) notés t1 et t2.

Les données peuvent se représenter sous la forme d'un tableau de contingence.

 

Soit l'exemple fictif suivant : 34 sujets ont passé une épreuve, à deux moments, t1 et t2. On a noté l'échec (E) ou la réussite (R) à l'épreuve, aux deux moments t1 et t2. Ainsi, d'après le tableau suivant, 8 sujets ont échoué en t1 et réussi en t2.

 

 

 

t2

 

 

 

 

R

E

 

t1

R

10

4

14

 

E

8

12

20

 

 

18

16

34

Question initiale

La fréquence des réussites est-elle meilleure en t2 qu'en t1?

Analyse descriptive

Sur cet échantillon de 34 sujets, la fréquence des réussites à l'épreuve est plus élevée en t2 (18/34 soit 53%) qu'en t1 (14/34 soit 41%). Cette différence (12 points de %) peut être considérée comme importante (> 10 points).

Analyse inférentielle

On se demande s'il existe également une différence dans la population parente d'où est extrait cet échantillon. Les procédures qui suivent supposent l'échantillonnage au hasard de ces 34 sujets parmi la population parente.

Khi² de McNemar

Khi² non corrigé

Khi² = (8-4)² / (8+4) = 16 / 12 = 1.33

Khi² corrigé

Khi² = (|8-4|-1)² / (8+4) = 9 / 12 = 0.75

 

C'est le Khi² corrigé qui est calculé par les logiciels (en particulier par DS3Win et Statistica dont il est question ci-dessous).

Sachant que le test a 1 ddl, le seuil observé (p) du Khi² corrigé est égal à .39 (> .025). Le test est non significatif.

Conclusion :

Il n'est pas possible de conclure à une fréquence de réussite plus grande en t2 par rapport à t1, chez l'ensemble des sujets concernés, malgré la différence importante observée sur l'échantillon.

Remarque

Sachant que l'on a observé une différence importante dans l'échantillon, on pourrait poursuivre par la mise en œuvre de procédures bayésiennes permettant d'évaluer l'importance de la différence dans la population parente.

On calculerait la probabilité que la différence parente soit supérieure à 10 points de pourcentage par exemple.

Cette probabilité serait notée P(Delta > .10)

 

Toutefois, sur cet exemple, le fait que le test soit non significatif peut s'interpréter ainsi d'un point de vue bayésien :

On ne peut pas inférer, avec une garantie suffisante, que la différence parente est positive (en faveur de t2). A fortiori, on ne peut pas inférer, avec une garantie suffisante, que la différence parente est supérieure à .10.

Le test de McNemar et DS3Win

1. Créer un tableau 2x2 (Menu Fichier –Nouveau, ou F8)

 

2. Déclarer le tableau comme tableau de contingence. (Menu Etape – Structure, ou F9)

 

3. Donner les mêmes noms aux 2 lignes et aux deux colonnes, et dans le même ordre comme dans l'exemple ci-dessous (Menu Etape, Data, ou F4)

 

 

R

E

 

 

E

R

R

10

4

ou :

E

12

8

E

8

12

 

R

4

10

 

4. Sélectionner l'étape inférentielle (Menu Etape – Inférence, ou F6) et taper MACN pour obtenir le Khi² corrigé de McNemar.

INFE> MACN

 

5. Utiliser le Menu Outils- Tables pour calculer le seuil (ddl = 1)

Le test de McNemar et Statistica (version 97)

1. Sélectionner le Module "Non Paramétrique / Distributions"

 

2. Sélectionner "X²/V2… McNemar, Fisher exact…"

 

3. Entrer les effectifs (et non pas les fréquences, comme nous y invite une mauvaise traduction du terme anglais "fréquency") dans un des ordres ci-dessous. Attention, l'ordre des modalités n'est pas le même en ligne et en colonne!

 

 

E

R

 

 

R

E

R

8

12

ou :

E

4

10

E

10

4

 

R

12

8

 

4. Les valeurs du Khi² corrigé de McNemar (0.75) et du seuil (.3865) se trouvent dans la ligne "Chi2 de McNemar A/D)" du tableau de résultats.

 

Retour en début de page