آمار – نوشته‌های محمد ذوالفقاری

من سر انواع بازی‌های رومیزی (Board Game)

بازی اولون (Avalon): طرف ۲ دست پشت سر هم مرلین شده دست سوم رسما امکان نداره دیگه مرلین باشه پس فرض می‌کنم مرلین نیست و کلا از گزینه‌ها می‌زارمش کنار.

بازی منچ: ۴ دست هست که تاس ۶ نیاوردم. این دفعه احتمال اینکه ۶ بیاید خیلی بیشتر است.

من سر سؤال‌های ریاضی

یک سکه رو ده بار انداختیم و همه‌اش خط اومده، احتمال اینکه بار یازدهم هم خط بیاد چقدر هست؟ من: ۵۰ درصد.

از یک جایی به بعد متوجه بودم که رویکردم سر بازی‌های رومیزی و سؤال‌های ریاضی قابل جمع به نظر نیستند. اما همچنان تا حدی توجیهی می‌کردم و بین آن‌ها تفاوت قائل می‌شدم.

ادامه ی مطلب

در دسته‌بندی نشده

قضیه بیض، چرا شواهد جدید با باورهای قدیمی جمع نمی‌شوند

محمد ذوالفقاریاسفند ۱۰, ۱۳۹۸اسفند ۱۰, ۱۳۹۸نظر دهید

علی خجالتی و گوشه‌گیر است، همیشه مایل به کمک است ولی به انسان‌ها و دنیای واقعی علاقه‌ای ندارد. به ترتیب و ساختار دادن نیاز داشته و اشتیاق زیاده به جزییات دارد.

کدام گزینه را محتمل‌تر می‌دانید:

علی یک کتابدار است.
علی کشاورز است.

اگر گزینه ۱ را انتخاب کردید، احتمالا پاسختان درست نیست. چرا؟

کتابداری شغل رایجی نیست و اگر قبل از این سوال از ما می‌پرسیدند به ازای هر کتابدار چند کشاورز وجود دارند شاید می‌گفتیم: ۲۰، یعنی به ازای هر ۲۰ کشاورز ۱ کتابدار وجود دارد.

خب حالا اگر قبل توصیف خصوصیات علی از ما می‌پرسیدند علی کتابدار است یا کشاورز چه می‌گفتیم؟ با فرض اینکه باور داریم به ازای هر ۲۰ کشاورز ۱ کتابدار وجود دارد می‌گفتیم احتمال کتابدار بودن علی ۴.۸ درصد است و بنابراین علی احتمالا کشاورز است.

اگر توصیفات ابتدایی از علی را این طور بگیریم که احتمال کتابدار بودن را ۴ برابر کشاورز بودن می‌کند. با در نظر گرفتن نسبت ۱ به ۲۱ در کتابدار بودن تازه احتمال کتابدار بودن را به چیزی حدود ۱۷ درصد می‌رساند.

این یک نوع دام جالبی است که بنا بر ادعای برخی از روان‌شناسان از جمله دنیل کانمن عموم انسان‌ها در آن می‌افتند. گویی بسته به نحوه‌ای که اطلاعات به ما داده می‌شود ما برخی مواقع فرضیات و شواهد جدید را به باور‌های قبلی اضافه نمی‌کنیم و تنها بر مبنای همین شواهد جدید تصمیم می‌گیریم. انگار گاهی باورهای ما تجمیع نمی‌شود.

به این قضیه در احتمال، قضیه بیض می‌گویند من قبلا در مغالطه نرخ پایه تا حدی به آن اشاره کردم. اخیرا با دیدن این ویدئو که قضیه بیض را به خوبی توضیح می‌دهد گفتم به بهانه معرفی این ویدئو باز هم در این باره بنویسم. ویدئو به خوبی قضیه را توضیح می‌دهد. مثال اولیه من هم مثال همین ویدئو بود.

در دسته‌بندی نشده

مغالطه نرخ پایه یا ‌Base rate fallacy

محمد ذوالفقاریبهمن ۲۳, ۱۳۹۶نظر دهید

مدتی پیش نوشته‌‌ای از آقای کاوه لاجوردی خواندم که به موضوعی با نام مغالطه نرخ پایه(Base rate fallacy) ارجاع داده بودند، نگاهی به موضوع انداختم، خوشم آمد آن را ذخیره کردم تا بعدا سر فرصت بخوانم. اینکه می‌گویم مدتی پیش واقعا خیلی پیش است، خود نوشته سال گذشته در همین روزها منتشر شده، امیدوارم من هم همان مواقع نخوانده باشمَش که در این صورت خیلی تنبلی کرده‌ام.
Base rate fallacy که من ترجمه‌اش را جایی ندیدم و بنابراین خودم مغالطه نرخ پایه ترجمه‌اش می‌کنم، در مورد خطای حس شهودی(شاید بتوان گفت شهودی) نسبت به برخی مسائل آماری است. مسأله به طور کامل در ویکی‌پدیا، این صفحه شرح داده شده، من هم می‌خواهم کمی در مورد آن بنویسم.
با یک مثال شروع می‌کنم: فرض کنید یک دستگاه تست اعتیاد داریم که تنها خطای آن خطای ۳ درصد مثبت است؛ یعنی در ۳ درصد موارد فردی که دارای اعتیاد نیست را معتاد تشخیص می‌دهد. می‌دانیم که ۶ درصد جمعیت شهر معتادند. حال اگر به صورت تصادفی از فردی در این شهر، تست اعتیاد گرفتیم و مثبت بود(دستگاه تشخیص اعتیاد داد)، به احتمال چند درصد واقعا معتاد است؟
اگر پاسختان ۹۷٪ است، شما هم دچار این خطا شده‌اید. بیایید دوباره حساب کنیم. اگر شهر ۵۰۰ نفر جمعیت داشت(فرض مقدار جمعیت محاسباتمان را ملموس‌تر می‌کند و تأثیری بر نتیجه نهایی ندارد)، چند نفر آن واقعا معتاد بودند؟

500 * 0.06 = 30

۳۰ نفر در شهر معتاد هستند. اما اگر با دستگاه از جمعیت تست بگیریم، چند نفر را معتاد تشخیص می‌دهد؟ معتادها را که درست تشخیص می‌دهد. ۳ درصد افرادی را که معتاد نیستند هم معتاد تشخیص می‌دهد.

30 + 470 * 0.03 = 44.1

۴۴.۱ نفر را معتاد تشخیص می‌دهد در حالی که ۳۰ نفر واقعا معتادند. پس احتمال درستی بودن نتیجه مثبت دستگاه چند درصد می‌شود؟

100 * 30/44.1 = 68.03

بنابراین احتمال واقعا معتاد بودن یک نفر که نتیجه آزمایش دستگاه مثبت بوده ۶۸ درصد است. حالا باز شاید احتمال ۶۸ درصد قابل قبول باشد. اگر در همین مسأله درصد معتادان واقعی شهر ۱ درصد بودند، احتمال اینکه فردی با آزمایش مثبت دستگاه، واقعا معتاد باشد، می‌شود ۲۵ درصد. نمی‌دانم متوجه شده‌اید یا نه اما هرچه درصد واقعی پایین‌تر می‌آید(در مثال ما درصد معتادان واقعی) برای اینکه نتیجه دستگاه قابل اعتماد باشد باید خطای آن بسیار کمتر شود، می‌توان گفت درصد خطا هرجه تسبت به درصد واقعی کوچک‌تر باشد نتیجه دستگاه قابل اعتمادتر است.
می‌توانید دو مثال دیگر هم در صفحه ویکی‌پدیا پیدا کنید(بخصوص مثال دومش جالب است). خودتان آن‌ها را حل کنید تا بفهمید کامل متوجه موضوع شده‌اید یا نه.

Showing all posts tagged آمار

مغالطه قمارباز

من سر انواع بازی‌های رومیزی (Board Game)

من سر سؤال‌های ریاضی

قضیه بیض، چرا شواهد جدید با باورهای قدیمی جمع نمی‌شوند

مغالطه نرخ پایه یا ‌Base rate fallacy