Dans le domaine de l'ingénierie électrique et du traitement du signal, nous rencontrons souvent des situations où nous devons prendre des décisions basées sur des données bruitées ou incertaines. Un outil fondamental pour aborder ces scénarios est le **test d'hypothèse binaire**. Ce cadre nous aide à choisir entre deux hypothèses concurrentes, notées **H1** et **H2**, en analysant les observations disponibles.
Le problème :
Imaginez que vous essayez de détecter un signal faible au milieu du bruit de fond. Vous avez deux hypothèses possibles :
Vous recevez des observations, notées **y**, qui sont influencées par la présence ou l'absence du signal. Votre tâche est de déterminer quelle hypothèse est la plus probable compte tenu des données observées.
Éléments clés :
Pour prendre une décision éclairée, nous avons besoin des informations suivantes :
Règles de décision :
En fonction des données observées **y**, nous devons décider quelle hypothèse accepter. Cela se fait grâce à une règle de décision, qui implique généralement la comparaison d'une "statistique de décision" dérivée des données à un seuil. Le choix du seuil influence le compromis entre les faux positifs (accepter H1 lorsque H2 est vraie) et les faux négatifs (accepter H2 lorsque H1 est vraie).
Courbe de réception du récepteur (ROC) :
La **courbe ROC** est un outil puissant pour visualiser les performances de différentes règles de décision. Elle trace le taux de vrais positifs (sensibilité) contre le taux de faux positifs (1 - spécificité) pour différentes valeurs de seuil. La courbe ROC idéale se trouve près du coin supérieur gauche, indiquant une sensibilité et une spécificité élevées.
Test d'hypothèse M-aire :
Le test d'hypothèse binaire est un cas particulier du **test d'hypothèse M-aire**, où nous avons **M** hypothèses possibles (M > 2). Ce cadre est utile pour les situations impliquant plusieurs possibilités, telles que la classification de différents types de signaux ou l'identification de plusieurs cibles dans les systèmes radar.
Applications :
Le test d'hypothèse binaire trouve une application répandue dans divers domaines de l'ingénierie, notamment :
Résumé :
Le test d'hypothèse binaire est un outil fondamental pour prendre des décisions basées sur des données incertaines. Il fournit un cadre pour évaluer les probabilités relatives de deux hypothèses et pour sélectionner la plus probable. La courbe ROC est une aide visuelle essentielle pour comprendre les performances de différentes règles de décision. Ce cadre s'étend au cas plus général du test d'hypothèse M-aire, ce qui nous permet de prendre des décisions parmi plusieurs possibilités.
Instructions: Choose the best answer for each question.
1. What is the primary goal of binary hypothesis testing? (a) To calculate the probability of each hypothesis being true. (b) To determine which of two hypotheses is more likely given the observed data. (c) To predict the future outcome based on the observed data. (d) To estimate the parameters of a statistical model.
(b) To determine which of two hypotheses is more likely given the observed data.
2. Which of the following is NOT a key element in binary hypothesis testing? (a) Prior probabilities of each hypothesis. (b) Likelihood functions for each hypothesis. (c) Decision rule based on observed data. (d) The probability distribution of the noise affecting the data.
(d) The probability distribution of the noise affecting the data.
3. What does the Receiver Operating Characteristic (ROC) curve visualize? (a) The relationship between the true positive rate and the false positive rate for different decision thresholds. (b) The distribution of the observed data under each hypothesis. (c) The accuracy of a specific decision rule. (d) The likelihood of each hypothesis being true.
(a) The relationship between the true positive rate and the false positive rate for different decision thresholds.
4. In M-ary hypothesis testing, how many hypotheses are considered? (a) 1 (b) 2 (c) More than 2 (d) It depends on the specific problem.
(c) More than 2
5. Which of the following is NOT a typical application of binary hypothesis testing? (a) Detecting a specific word in a speech signal. (b) Identifying a defective component in a machine. (c) Predicting the stock market price. (d) Distinguishing between different types of cancer cells.
(c) Predicting the stock market price.
Problem:
A medical device is designed to detect the presence of a specific disease in patients. The device measures a certain biological marker in the blood. Two hypotheses are considered:
The measured marker value, y, can be modeled as a Gaussian random variable:
where N(μ, σ²) denotes a normal distribution with mean μ and variance σ².
Task:
**1. Likelihood functions:** * **p(y|H1) = (1/√(2π)) * exp(-(y-10)²/2) ** * **p(y|H2) = (1/√(2π)) * exp(-(y-5)²/2) ** **2. Decision rule:** The decision rule is based on comparing the likelihood ratio to a threshold, *T*: * **If p(y|H1) / p(y|H2) > T, then decide H1 (disease present)** * **If p(y|H1) / p(y|H2) ≤ T, then decide H2 (disease absent)** To minimize the probability of error, we can choose *T* to be the point where the two likelihood functions intersect. This point is found by setting p(y|H1) / p(y|H2) = 1 and solving for *y*. This yields *y* = 7.5. Therefore, the decision rule is: * **If y > 7.5, then decide H1 (disease present)** * **If y ≤ 7.5, then decide H2 (disease absent)** **3. Probability of false positive and false negative for T = 7.5:** * **False Positive:** Probability of deciding H1 (disease present) when H2 (disease absent) is true. This is the area under the curve of p(y|H2) for y > 7.5. * P(False Positive) = 1 - Φ((7.5 - 5)/1) = 1 - Φ(2.5) ≈ 0.0062 * **False Negative:** Probability of deciding H2 (disease absent) when H1 (disease present) is true. This is the area under the curve of p(y|H1) for y ≤ 7.5. * P(False Negative) = Φ((7.5 - 10)/1) = Φ(-2.5) ≈ 0.0062 **Note:** Φ(z) denotes the cumulative distribution function of the standard normal distribution.
None
Comments