مغالطه نرخ پایه یا ‌Base rate fallacy

مدتی پیش نوشته‌‌ای از آقای کاوه لاجوردی خواندم که به موضوعی با نام مغالطه نرخ پایه(Base rate fallacy) ارجاع داده بودند، نگاهی به موضوع انداختم، خوشم آمد آن را ذخیره کردم تا بعدا سر فرصت بخوانم. اینکه می‌گویم مدتی پیش واقعا خیلی پیش است، خود نوشته سال گذشته در همین روزها منتشر شده، امیدوارم من هم همان مواقع نخوانده باشمَش که در این صورت خیلی تنبلی کرده‌ام.

Base rate fallacy که من ترجمه‌اش را جایی ندیدم و بنابراین خودم مغالطه نرخ پایه ترجمه‌اش می‌کنم، در مورد خطای حس شهودی(شاید بتوان گفت شهودی) نسبت به برخی مسائل آماری است. مسأله به طور کامل در ویکی‌پدیا، این صفحه شرح داده شده، من هم می‌خواهم کمی در مورد آن بنویسم.

با یک مثال شروع می‌کنم: فرض کنید یک دستگاه تست اعتیاد داریم که تنها خطای آن خطای ۳ درصد مثبت است؛ یعنی در ۳ درصد موارد فردی که دارای اعتیاد نیست را معتاد تشخیص می‌دهد. می‌دانیم که ۶ درصد جمعیت شهر معتادند. حال اگر به صورت تصادفی از فردی در این شهر، تست اعتیاد گرفتیم و مثبت بود(دستگاه تشخیص اعتیاد داد)، به احتمال چند درصد واقعا معتاد است؟

اگر پاسختان ۹۷٪ است، شما هم دچار این خطا شده‌اید. بیایید دوباره حساب کنیم. اگر شهر ۵۰۰ نفر جمعیت داشت(فرض مقدار جمعیت محاسباتمان را ملموس‌تر می‌کند و تأثیری بر نتیجه نهایی ندارد)، چند نفر آن واقعا معتاد بودند؟

۵۰۰ * ۰٫۰۶ = ۳۰

۳۰ نفر در شهر معتاد هستند. اما اگر با دستگاه از جمعیت تست بگیریم، چند نفر را معتاد تشخیص می‌دهد؟ معتادها را که درست تشخیص می‌دهد. ۳ درصد افرادی را که معتاد نیستند هم معتاد تشخیص می‌دهد.

۳۰ + ۴۷۰ * ۰٫۰۳ = ۴۴٫۱

۴۴.۱ نفر را معتاد تشخیص می‌دهد در حالی که ۳۰ نفر واقعا معتادند. پس احتمال درستی بودن نتیجه مثبت دستگاه چند درصد می‌شود؟

۱۰۰ * ۳۰/۴۴٫۱ = ۶۸٫۰۳

بنابراین احتمال واقعا معتاد بودن یک نفر که نتیجه آزمایش دستگاه مثبت بوده ۶۸ درصد است. حالا باز شاید احتمال ۶۸ درصد قابل قبول باشد. اگر در همین مسأله درصد معتادان واقعی شهر ۱ درصد بودند، احتمال اینکه فردی با آزمایش مثبت دستگاه، واقعا معتاد باشد، می‌شود ۲۵ درصد. نمی‌دانم متوجه شده‌اید یا نه اما هرچه درصد واقعی پایین‌تر می‌آید(در مثال ما درصد معتادان واقعی) برای اینکه نتیجه دستگاه قابل اعتماد باشد باید خطای آن بسیار کمتر شود، می‌توان گفت درصد خطا هرجه تسبت به درصد واقعی کوچک‌تر باشد نتیجه دستگاه قابل اعتمادتر است.

می‌توانید دو مثال دیگر هم در صفحه ویکی‌پدیا پیدا کنید(بخصوص مثال دومش جالب است). خودتان آن‌ها را حل کنید تا بفهمید کامل متوجه موضوع شده‌اید یا نه.