Échantillonnage
Un échantillon de taille n est un ensemble de n individus prélevés au hasard dans une population.
La fréquence (ou proportion) d'un caractère dans un échantillon :
100 personnes prélevées, 38 favorables à une proposition :
Si une population a une proportion p d'un caractère et qu'on prélève n individus (avec remise), alors X = nombre d'individus ayant le caractère suit X ~ B(n, p).
La fréquence F = X/n vérifie :
La fréquence est centrée sur p
Diminue quand n augmente
Intervalle de fluctuation
Un intervalle de fluctuation au seuil de 95% est un intervalle I tel que pour environ 95% des échantillons de taille n, la fréquence observée appartient à I.
• Dans ~5% des cas, la fréquence sera hors de l'intervalle • C'est un outil pour juger si un résultat est « normal » ou « surprenant »
Conditions : n ≥ 25, np ≥ 5, n(1−p) ≥ 5
Conditions : n ≥ 30, np ≥ 5, n(1−p) ≥ 5
1,96 provient de la loi normale : P(−1,96 < Z < 1,96) ≈ 0,95 pour Z ~ N(0;1).
En pratique, on peut approcher 1,96 ≈ 2 pour des calculs rapides.
✏️ Exemple — Pièce équilibrée, 100 lancers
✏️ Exemple — Industriel : 20% de défauts, échantillon de 100
Intervalle de confiance
Conditions : n ≥ 30, nf ≥ 5, n(1−f) ≥ 5
On utilise la fréquence observée f (p est inconnu). L'intervalle est plus précis quand n est grand.
✏️ Exemple — Sondage électoral : 520/1000 pour le candidat A
Au niveau 95%, la proportion de votants pour A est entre 48,8% et 55,2%.
La marge d'erreur d'un sondage est la demi-largeur de l'intervalle :
| Taille n | 100 | 400 | 1 000 | 2 500 | 10 000 |
|---|---|---|---|---|---|
| Marge e | ±10% | ±5% | ±3,2% | ±2% | ±1% |
Pour une marge de 3% : n = (1/0,03)² ≈ 1111 personnes à interroger.
Tests d'hypothèse
Un test d'hypothèse permet de décider si une hypothèse sur une population est vraisemblable, à partir d'un échantillon.
Ce qu'on teste : p = p₀ (« pas de changement »)
Ce qu'on suspecte si H₀ est fausse : p ≠ p₀
Le seuil de risque α (souvent 5%) = probabilité de rejeter H₀ alors qu'elle est vraie.
✏️ Test bilatéral — Pièce truquée ? 200 lancers, 120 Pile
I = [0,5 − 1,96×0,0354 ; 0,5 + 1,96×0,0354] ≈ [0,431 ; 0,569]
H₀ : p ≤ p₀ | H₁ : p > p₀
Rejeter si f > p₀ + 1,64·σ
H₀ : p ≥ p₀ | H₁ : p < p₀
Rejeter si f < p₀ − 1,64·σ
✏️ Test unilatéral — Médicament plus efficace ? 100 patients, 72 guéris
Seuil critique : 0,6 + 1,64 × 0,049 ≈ 0,68
| Décision / Réalité | H₀ vraie | H₀ fausse |
|---|---|---|
| Accepter H₀ | ✓ Bonne décision | ✗ Erreur type II (β) |
| Rejeter H₀ | ✗ Erreur type I (α) | ✓ Bonne décision |
• En fixant α = 5%, on accepte 5% de risque d'erreur de type I • Pour diminuer les deux risques simultanément : augmenter n
Simulateur & Applications
🎮 Calculateur d'intervalles et tests
I ≈ [0,0077 ; 0,0323]
| Coefficient | Utilisation |
|---|---|
| 1,96 | Test bilatéral, seuil 5% |
| 1,64 | Test unilatéral, seuil 5% |
| 1/√n | Marge d'erreur simplifiée (intervalle de confiance) |
| √(p(1−p)/n) | Écart-type de la fréquence (intervalle de fluctuation) |
| n ≥ (1/e)² | Taille minimale pour marge e |