Statistique descriptive bivariée¶
Pour la statistique descriptive à deux variables, on peut déterminer les caractéristiques suivantes.
la covariance
le coefficient de corrélation linéaire
le coefficient de détermination
la distance du khi-deux
Phi-carré de Cramer
T de Tschuprow
la droite de régression de Y en X
La saisie des données est très simple comme le montrent les exemples ci-dessous.
Tableau de contingence¶
Exemple 1 : Tableau de contingence avec X et Y quantitatifs
Une société d’assurance a réalisé à partir de son fichier de clients une enquête par sondage pour connaitre la répartition du nombre d’accidents de la route (X) selon l’âge des assurés (Y). Le résultat de cette enquête est donné par le tableau suivant.
Âge (en années) |
|||
---|---|---|---|
Nombre d’accidents |
[18 ; 25[ |
[25 ; 50[ |
[50 ; 80[ |
de 0 à 2 |
23 |
54 |
16 |
de 3 à 6 ans |
22 |
21 |
14 |
Calculer le khi-Deux de contingence.
En déduire les valeurs de \(\Phi^2\) de Cramer et le T de Tschuprow.
** Exemple 2** : Tableau de contingence avec X et Y qualitatifs
Sur un échantillon de 200 ménages choisis au hasard, on a étudié la propension moyenne à épargner (variable Y) en fonction de revenu disponible (variable X). Pour la variable X, on a distingué 3classes (faibles revenus, intermédiaires, revenus élevés). De même les taux d’épargne ont été classés en 3 niveaux (faibles taux, taux intermédiaires, taux élevés). Les résultats sont présentés dans la table de contingence :
\(Y_1=\) taux faibles |
\(Y_2=\) taux intermédiaires |
\(Y_3=\) taux élevés |
|
---|---|---|---|
\(X_1=\) revenus faibles |
53 |
14 |
6 |
\(X_3=\) revenus intermédiaires |
15 |
58 |
8 |
\(X_3=\) revenus élevés |
7 |
10 |
29 |
Calculer le khi-deux de contingence.
En déduire les valeurs du \(\Phi^2\) de Cramer et du \(T\) de Tschuprow.
Tableau simple¶
La société anonyme par action R augmente son capital. On a relevé pendant 6 jours le cours en bourse de l’action (X) et celui du droit de souscription (Y).
X |
98 |
94 |
97 |
98 |
100 |
102 |
---|---|---|---|---|---|---|
Y |
6.50 |
5.40 |
6.10 |
6.40 |
6.90 |
8.00 |
Calculer la covariance Cov(X, Y).
Établir les équations de la droite de régression de Y en X.
Calculer le coefficient de corrélation linéaire entre les variables X et Y.