Statistiques - 1e L
Classe:
Première
1. Concepts de bases
Notes Xi47891112141518Effectifs ni122234231Fréquences fi0.050.10.10.10.150.20.10.150.05FCC0.050.150.250.350.500.70.80.951
2. Les Caractéristiques
Mode : le mode est la modalité qui a le plus grand effectif 12 est le mode de cette série
Médiane : la médiane est la modalité dont sa fréquence cumulée croissante dépasse pour la première fois 0.5 11 est la médiane de cette série
Fréquence : La fréquence de la modalité Xi est le nombre fi=niN ou ni est l'effectif de la modalité Xi et N l'effectif total N=n1+n2+…+np=p∑i−1ni
Remarque :
p∑i−1fi=n1+n2+…npN=1
Moyenne : la moyenne de cette série est réel noté ¯x définie par :
¯x=n1x1+n2x2+…+npxpN=p∑i−1nixiN et ¯x=f1X1+f2X2+…fpXp=p∑i−1fixi.
Variance : La variance de cette série est réel positif V(X) définie par :
V(X)=n1(x1−¯x)2+n2(x2−¯x)2+…+np(xp−¯x)2N=1N∑ni(xi−¯x)2(1)
ou
V(X)=f1(x1−¯x)2+f2(x2−¯x)2=p∑i−1fi(x1−¯x)2(2)
ou
V(x)=1N(n1X21+n2X22+…npX2p)−¯x2(3) moyenne des carrés-le carré de la moyenne
Remarque :
Pour effectuer un calcul de la variance, la formule (3) qui porte le nom de formule de Kônig est en général plus simple à utiliser.
Écart type l'écart type d'une série statistique est la racine carrée de la variance on le note θx=√V(x)
Exercice d'application
On donne les notes de 20 élèves à un devoir de mathématiques: 12 ; 9 ; 11 ; 14 ; 9 ; 8 ; 15 ; 7 ; 4 ; 18 ; 12 ; 7 ; 14 ; 12 ; 15 ; 8 ; 15 ; 11 ; 12 ; 11
1. Dresser e tableau des effectifs et des fréquences de cette série notée X.
2. Calculer la moyenne, la variance et l'écart type de cette série.
3. regrouper les notes par classe d'amplitude 4 puis calculer la moyenne, la variance et l'écart type correspondant.
Solution :
1. Tableau des effectifs et des fréquences
Notes ni47891112141518Efectifs ni122234231Fréquencefi0.050.10.10.10.150.20.10.150.05
2. la moyenne de cette série est
Soit ¯x=22420=11.2
Calcule de la variance
V(X)=120(42×1+72×2+82×2+92×2+112×3+122×4+142×2+152×3+182×1)−11.22
Soit V(x)=273420−11.22=11.26
L'écart type est σ(X)=√11.26 soit σ(X)=3.33.
Classe [4, 8[[8, 12[[12, 16[[16, 20[effectif 3791centre 6101418
Rappel :
Le centre de l'intervalle [a, b[ est le nombre a+b2
Les centres des intervalles seront considérés comme les modalités
On trouve ¯x=23220=11.6
V(x)=289620−(11.6)2
Soit V(X)=10.24 et σ(x)=3.2
II. Série Statistique à deux variables
1. Définition
On appelle série statistique double d'une population pour les caractères X et Y l'application qui à chaque élément de p associe le couple (Xi, Yi) ou Xi et Yi sont des valeurs des caractères X et Y
Le résultat de cette observation peut être présenté sous deux formes
∙ Données non groupés
individu12nValeur deXX1X2XnValeur deYY1Y2Yn
2. Nuage des points
Un nuage de points est un type de graphique utilisé pour représenter des données bivariées (deux variables). Chaque point du nuage correspond à une paire de valeurs (x, y), où :
- x est la valeur de la première variable (généralement représentée sur l'axe horizontal, l'axe des abscisses),
- y est la valeur de la deuxième variable (généralement représentée sur l'axe vertical, l'axe des ordonnées).
Ce type de représentation permet d'observer la relation ou la corrélation éventuelle entre les deux variables.
Étapes pour construire un nuage de points
Collecter les données : Les données doivent être organisées sous forme de paires (xi,yi)(xi,yi) correspondant aux observations des deux variables.
Tracer les axes :
L'axe horizontal représente les valeurs de x (variable explicative ou indépendante),
L'axe vertical représente les valeurs de y (variable dépendante).
Placer les points : Chaque paire (xi,yi) est représentée par un point dans le plan.
Étapes pour construire un nuage de points
- Collecter les données : Les données doivent être organisées sous forme de paires (xi,yi)(xi,yi) correspondant aux observations des deux variables.
2. Tracer les axes :
- L'axe horizontal représente les valeurs de xx (variable explicative ou indépendante),
- L'axe vertical représente les valeurs de yy (variable dépendante).
3. Placer les points : Chaque paire (xi,yi) est représentée par un point dans le plan.
3. Point moyen
¯x=1nn∑i−1xi
¯y=1nn∑i−1yi
4. Covariance
La covariance d'une série double (X,Y) est réel noté cov (X,Y) ou σxy défini par :
σxy=1N(x1−¯x)(y1−¯y)+...+(xn−¯x)(yn−¯y)
5. Droite de régression y en x et de x en y
a. La droite de régression de y en x
Il existe une droite qui minimise la somme des carrés des distance verticales des points du nuage à la courbe:
c'est la dernière droites des moindres carrés ou droite de régression de y en x.
Elle a pour équation
Dy/x:y−¯y=a(x−¯x)
a=cov (x, y)V(x)
b. La droite de régression de x en y
Il existe une autre droite qui minimise la somme des carrés des distances horizontales des points du nuage à la courbe.
C'est la deuxième droite des moindres carrés ou droite de régression de x en y
DX/y:x−¯x=a(y−¯Y)
α=V(x)cov (x, y)
Remarque :
i. Dx/y: pour coefficient directeur 1α
ii. Dy/x: pour coefficient directeur α
Le point G(¯x, ¯Y) appartient aux deux droites de régression est le point moyen du nuage ou barycentre du nuage
III. Corrélation Linéaire
Il existe un nombre qui permet de mesurer de mesurer la proximité entre les droites de régression : c'est le coefficient de corrélation linéaire qui permet donc de mesurer la liaison entre les deux variable x et y il est noté rxy et on α
rxy=(cov x, y)σ(x)σ(y)
Propriétés
i. r2=α×α′
ii. 2≤1↔|r|<1↔−1≤r≤1
Interprétation
∙ Si |r|<1 on a une liaison fonctionnelle entre x et y ceci est un idéal
∙ Si r=0 on a une indépendance totale (exceptionnelle)
∙ Si 0.87<|r|<1 on a une forte corrélation
Ajouter un commentaire