مدتی پیش نوشتهای از آقای کاوه لاجوردی خواندم که به موضوعی با نام مغالطه نرخ پایه(Base rate fallacy) ارجاع داده بودند، نگاهی به موضوع انداختم، خوشم آمد آن را ذخیره کردم تا بعدا سر فرصت بخوانم. اینکه میگویم مدتی پیش واقعا خیلی پیش است، خود نوشته سال گذشته در همین روزها منتشر شده، امیدوارم من هم همان مواقع نخوانده باشمَش که در این صورت خیلی تنبلی کردهام.
Base rate fallacy که من ترجمهاش را جایی ندیدم و بنابراین خودم مغالطه نرخ پایه ترجمهاش میکنم، در مورد خطای حس شهودی(شاید بتوان گفت شهودی) نسبت به برخی مسائل آماری است. مسأله به طور کامل در ویکیپدیا، این صفحه شرح داده شده، من هم میخواهم کمی در مورد آن بنویسم.
با یک مثال شروع میکنم: فرض کنید یک دستگاه تست اعتیاد داریم که تنها خطای آن خطای ۳ درصد مثبت است؛ یعنی در ۳ درصد موارد فردی که دارای اعتیاد نیست را معتاد تشخیص میدهد. میدانیم که ۶ درصد جمعیت شهر معتادند. حال اگر به صورت تصادفی از فردی در این شهر، تست اعتیاد گرفتیم و مثبت بود(دستگاه تشخیص اعتیاد داد)، به احتمال چند درصد واقعا معتاد است؟
اگر پاسختان ۹۷٪ است، شما هم دچار این خطا شدهاید. بیایید دوباره حساب کنیم. اگر شهر ۵۰۰ نفر جمعیت داشت(فرض مقدار جمعیت محاسباتمان را ملموستر میکند و تأثیری بر نتیجه نهایی ندارد)، چند نفر آن واقعا معتاد بودند؟
500 * 0.06 = 30
۳۰ نفر در شهر معتاد هستند. اما اگر با دستگاه از جمعیت تست بگیریم، چند نفر را معتاد تشخیص میدهد؟ معتادها را که درست تشخیص میدهد. ۳ درصد افرادی را که معتاد نیستند هم معتاد تشخیص میدهد.
30 + 470 * 0.03 = 44.1
۴۴.۱ نفر را معتاد تشخیص میدهد در حالی که ۳۰ نفر واقعا معتادند. پس احتمال درستی بودن نتیجه مثبت دستگاه چند درصد میشود؟
100 * 30/44.1 = 68.03
بنابراین احتمال واقعا معتاد بودن یک نفر که نتیجه آزمایش دستگاه مثبت بوده ۶۸ درصد است. حالا باز شاید احتمال ۶۸ درصد قابل قبول باشد. اگر در همین مسأله درصد معتادان واقعی شهر ۱ درصد بودند، احتمال اینکه فردی با آزمایش مثبت دستگاه، واقعا معتاد باشد، میشود ۲۵ درصد. نمیدانم متوجه شدهاید یا نه اما هرچه درصد واقعی پایینتر میآید(در مثال ما درصد معتادان واقعی) برای اینکه نتیجه دستگاه قابل اعتماد باشد باید خطای آن بسیار کمتر شود، میتوان گفت درصد خطا هرجه تسبت به درصد واقعی کوچکتر باشد نتیجه دستگاه قابل اعتمادتر است.
میتوانید دو مثال دیگر هم در صفحه ویکیپدیا پیدا کنید(بخصوص مثال دومش جالب است). خودتان آنها را حل کنید تا بفهمید کامل متوجه موضوع شدهاید یا نه.