في مجال هندسة الكهرباء ومعالجة الإشارات، غالبًا ما نصادف مواقف نحتاج فيها إلى اتخاذ قرارات بناءً على بيانات ضبابية أو غير مؤكدة. تُعد اختبار الفرضيات الثنائية أداة أساسية لمعالجة مثل هذه السيناريوهات. يساعدنا هذا الإطار في الاختيار بين فرضيةين متنافستين، يشار إليهما بـ H1 و H2، من خلال تحليل الملاحظات المتاحة.
المشكلة:
تخيل أنك تحاول اكتشاف إشارة خافتة وسط ضوضاء الخلفية. لديك فرhypothesestanيتان محتملتان:
تتلقى بعض الملاحظات، يشار إليها بـ y، والتي تتأثر بوجود الإشارة أو غيابها. مهمتك هي تحديد أي فرضية أكثر احتمالًا بالنظر إلى البيانات الملاحظة.
العناصر الرئيسية:
للاتخاذ قرار مستنير، نحتاج إلى المعلومات التالية:
قواعد القرار:
بناءً على البيانات الملاحظة y، نحتاج إلى تحديد أي فرضية سيتم قبولها. يتم تحقيق ذلك من خلال قاعدة قرار، والتي تشمل عادةً مقارنة "إحصائية القرار" المشتقة من البيانات بعُتبة. يؤثر اختيار العتبة على التوازن بين الإيجابيات الخاطئة (قبول H1 عندما تكون H2 صحيحة) والسلبيات الخاطئة (قبول H2 عندما تكون H1 صحيحة).
منحنى التشغيل المميز (ROC):
يُعد منحنى ROC أداة قوية لتصور أداء قواعد القرار المختلفة. يمثل معدل الإيجابيات الحقيقية (الحساسية) مقابل معدل الإيجابيات الخاطئة (1 - التحديدية) لقيم عتبة مختلفة. يقع منحنى ROC المثالي بالقرب من الزاوية العلوية اليسرى، مما يشير إلى حساسية عالية وتحديدية عالية.
اختبار الفرضيات M-ary:
يُعد اختبار الفرضيات الثنائية حالة خاصة من اختبار الفرضيات M-ary، حيث لدينا M فرضيات محتملة (M> 2). هذا الإطار مفيد للمواقف التي تنطوي على احتمالات متعددة، مثل تصنيف أنواع مختلفة من الإشارات أو تحديد أهداف متعددة في أنظمة الرادار.
التطبيقات:
يجد اختبار الفرضيات الثنائية تطبيقًا واسع النطاق في مختلف المجالات الهندسية، بما في ذلك:
ملخص:
يُعد اختبار الفرضيات الثنائية أداة أساسية لاتخاذ قرارات بناءً على بيانات غير مؤكدة. يوفر إطارًا لتقييم احتمالات فرضيةين نسبياً وتحديد الأكثر احتمالًا. يُعد منحنى ROC أداة بصرية أساسية لفهم أداء قواعد القرار المختلفة. يمتد هذا الإطار إلى الحالة الأكثر عمومية لاختبار الفرضيات M-ary، مما يسمح لنا باتخاذ قرارات بين احتمالات متعددة.
Instructions: Choose the best answer for each question.
1. What is the primary goal of binary hypothesis testing? (a) To calculate the probability of each hypothesis being true. (b) To determine which of two hypotheses is more likely given the observed data. (c) To predict the future outcome based on the observed data. (d) To estimate the parameters of a statistical model.
(b) To determine which of two hypotheses is more likely given the observed data.
2. Which of the following is NOT a key element in binary hypothesis testing? (a) Prior probabilities of each hypothesis. (b) Likelihood functions for each hypothesis. (c) Decision rule based on observed data. (d) The probability distribution of the noise affecting the data.
(d) The probability distribution of the noise affecting the data.
3. What does the Receiver Operating Characteristic (ROC) curve visualize? (a) The relationship between the true positive rate and the false positive rate for different decision thresholds. (b) The distribution of the observed data under each hypothesis. (c) The accuracy of a specific decision rule. (d) The likelihood of each hypothesis being true.
(a) The relationship between the true positive rate and the false positive rate for different decision thresholds.
4. In M-ary hypothesis testing, how many hypotheses are considered? (a) 1 (b) 2 (c) More than 2 (d) It depends on the specific problem.
(c) More than 2
5. Which of the following is NOT a typical application of binary hypothesis testing? (a) Detecting a specific word in a speech signal. (b) Identifying a defective component in a machine. (c) Predicting the stock market price. (d) Distinguishing between different types of cancer cells.
(c) Predicting the stock market price.
Problem:
A medical device is designed to detect the presence of a specific disease in patients. The device measures a certain biological marker in the blood. Two hypotheses are considered:
The measured marker value, y, can be modeled as a Gaussian random variable:
where N(μ, σ²) denotes a normal distribution with mean μ and variance σ².
Task:
**1. Likelihood functions:** * **p(y|H1) = (1/√(2π)) * exp(-(y-10)²/2) ** * **p(y|H2) = (1/√(2π)) * exp(-(y-5)²/2) ** **2. Decision rule:** The decision rule is based on comparing the likelihood ratio to a threshold, *T*: * **If p(y|H1) / p(y|H2) > T, then decide H1 (disease present)** * **If p(y|H1) / p(y|H2) ≤ T, then decide H2 (disease absent)** To minimize the probability of error, we can choose *T* to be the point where the two likelihood functions intersect. This point is found by setting p(y|H1) / p(y|H2) = 1 and solving for *y*. This yields *y* = 7.5. Therefore, the decision rule is: * **If y > 7.5, then decide H1 (disease present)** * **If y ≤ 7.5, then decide H2 (disease absent)** **3. Probability of false positive and false negative for T = 7.5:** * **False Positive:** Probability of deciding H1 (disease present) when H2 (disease absent) is true. This is the area under the curve of p(y|H2) for y > 7.5. * P(False Positive) = 1 - Φ((7.5 - 5)/1) = 1 - Φ(2.5) ≈ 0.0062 * **False Negative:** Probability of deciding H2 (disease absent) when H1 (disease present) is true. This is the area under the curve of p(y|H1) for y ≤ 7.5. * P(False Negative) = Φ((7.5 - 10)/1) = Φ(-2.5) ≈ 0.0062 **Note:** Φ(z) denotes the cumulative distribution function of the standard normal distribution.
None
Comments