صفحه اصلی    تماس ها    نفت    گاز    پتروشیمی    پالایش و پخش    بهینه سازی مصرف    بهداشت ودرمان    تاریخ و سیاست    منابع انسانی    عمومی  
جمعه، 30 آبان 1393 - 07:35   
  تکرار سناریو منتخبان استخدامی نفت این بار در شرکت نفت ستاره خلیج فارس       
 
- اندازه متن: + -  کد خبر: 5817سه شنبه، 2 تیر 1388 - 18:36
سازگاری نتایج انتخابات با آزمون‌های بنفورد؛
تحلیل علمی انتخابات ریاست جمهوری 1388
سیدمهدی سیدنصرالله * / طی چند روز گذشته بحثهای فراوانی در خصوص امکان و احتمال تقلب در انتخابات ایران بعمل آمده است. با توجه به اینکه بازشماری آراء کاری پرزحمت برای دستگاه اجرایی و نظارتی انتخابات خواهد بود باید، کاندیداهای معترض شواهد و مستندات قابل قبولی را به این مراجعه اعلام نمایند تا دستکاری در نتایج انتخابات را آشکارا نشان دهد. راههای علمی زیادی وجود دارد که با استفاده از آمارهای اعلام شده توسط وزارت کشور این دستکاری ها در صورت وجود به نمایش گذاشته شود و یا صحت انتخابات از لحاظ شاخصهای علمی آمار بررسی شود.....
  

مقدمه: با توجه با داغ بودن موضوع صحت انتخابات در روزهای اخیر، مقاله ای با عنوان "مستندات علمی دستکاری در آراء انتخابات دهمین دوره انتخابات" در پایگاههای متعدد اینترنتی مرا بر آن داشت تا محاسبات ادعایی در آن مقاله را بررسی کنم که نتیجه این امر چیزی جز رد آن مقاله و اطمینان از نتایج انتخابات نبود. در مقاله ادعایی هیچ نموداری رسم نشده بود تا اصل ماجرا مشخص گردد و البته قسمتهای اصلی مقاله یعنی محاسبه میزان خطا و انحراف، کاملا اشتباه بود و تعمداً از مقادیر نرمال نشده استفاده شده بود و نتیجه دیگری را به خواننده القا می‌کرد. اما در مقاله پیش رو سه آزمون متعارف آماری برای بررسی علمی نتایج انجام شده است تا به طور کامل صحت داده ها تحلیل گردد. امید است تا خوانندگان گرامی، نگارنده را از نظرات خود بهره‌مند سازند.
×××
طی چند روز گذشته بحثهای فراوانی در خصوص امکان و احتمال تقلب در انتخابات ایران بعمل آمده است. با توجه به اینکه بازشماری آراء کاری پرزحمت برای دستگاه اجرایی و نظارتی انتخابات خواهد بود باید، کاندیداهای معترض شواهد و مستندات قابل قبولی را به این مراجعه اعلام نمایند تا دستکاری در نتایج انتخابات را آشکارا نشان دهد. راههای علمی زیادی وجود دارد که با استفاده از آمارهای اعلام شده توسط وزارت کشور این دستکاری ها در صورت وجود به نمایش گذاشته شود و یا صحت انتخابات از لحاظ شاخصهای علمی آمار بررسی شود.
صحبت از تقلب در انتخابات تنها یک موضوع مختص به ایران و حتی کشورهای در حال توسعه نظیر ونزوئلا، مکزیک، و زیمباوه نیست و در سال 2000 شاهد بودیم که بحث تقلب در انتخابات ریاست جمهوری در ایالت فلوریدا به موضوع داغ آنروزها بدل شده بود. به هر حال آنچه مسلم است آنکه اهمیت سیاست و موضوع تقلب در انتخابات سبب شده که دانشمندان علم آمار با استفاده از کمترین داده های موجود از انتخابات روشهای آماری را طراحی کنند که با کمک آن بتوان با صراحت در مورد سلامت انتخابات اظهار نظر نمایند. یکی از معمول ترین این روشها روشی است که از قانون بن فورد (Benford’s Law) پیروی می‌کند. بطور خیلی مختصر و قابل درک برای خوانندگان این قانون به آن اشاره دارد که رقمهای مربوط به یک عدد (خواه یک رقمی یا بیش از یک رقمی) حاصل از شمارش یک پدیده در جهان خارج (جهان واقعی) از توزیع نرمال (Normal distribution) یا توزیع یک فرم (Uniform distribution) پیروی نمی‌کند بلکه از توزیعی شبیه توزیع Chi Square پیروی می‌کند. آقای بن‌فورد احتمال این اعداد را برای حوادثی چون انتخابات محاسبه کرده است. قابل ذکر است که اعداد ذکر شده در قانون بن‌فورد همانند قوانین نیوتن یک واقعیت علمی است و در حال حاضر علاوه بر مسئله انتخابات، برای رسیدگی به احتمال تقلب در سود سهام شرکتها و مسائل مالیاتی نیز از همین روش استفاده می‌شود.
اجازه بدهید چند خط از این مقاله را به توضیح ساده این قانون بپردازیم. در این قانون احتمال اینکه آخرین عدد سمت چپ یک عدد (فرض کنید تعداد آراء اخذ شده به نفع یک کاندیدا) که می‌تواند یکی از اعداد 1 تا 9 باشد با هم برابر نیست. بلکه احتمال آنکه رقم سمت چپ یک عدد، 1 باشد حدود 30% است در حالی که این احتمال برای عدد 9 در حدود 4.5%. همچنین است احتمال وجود عدد 0 تا 9 برای دومین رقم سمت چپ تعداد آراء اخذ شده به نفع یک کاندیدا که آن نیز از قانون دیگری پیروی می‌کند.
طبق این قانون احتمال ظهور اعداد در رقم اول از رابطه 1 تبعیت می‌کند:

تحلیل علمی انتخابات ریاست جمهوری 1388 (1)
 

 تحلیل علمی انتخابات ریاست جمهوری 1388     
شکل 1- توزیع ستونی احتمال توزیع اعداد در رقم اول، دوم و سوم طبق قانون بن فورد
   
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 1- توزیع اعداد در رقم اول طبق قانون بن فورد

برای توضیح بیشتر به توزیع رقمهای اول، دوم و سوم یک دسته تصادفی می‌پردازیم، برای نمونه یک دسته 20000تایی اعداد تصادفی که به پیوست خواهد آمد را در نظر می‌گیریم و توزیع اعداد 1 تا 9 را در ارقام اول تا سوم آن در جدول 2 بررسی می‌کنیم.
 
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 2 - توزیع یکنواخت اعداد در رقم اول،دوم و سوم در یک دسته تصادفی

همان گونه که در جدول 2 دیده می‌شود، توزیع اعداد در رقمهای اول، دوم و سوم یک دسته تصادفی کاملا یکنواخت بوده و این تفاوت، اصلی ترین تفاوت بین داده‌های به دست آمده از طبیعت و داده های دستکاری شده می باشد. چرا که همان گونه که ذکر شد، طبق قانون بن‌فورد برای داده‌های طبیعی این نسبتها یکسان نیستند و مطابق جدول 1 می‌باشند.

برای اینکه اهمیت قانون بن‌فورد بهتر دیده شود، جدول 3 که شامل مثالهایی از طبیعت و تطابق آن با قانون بن فورد است، نشان داده شده است.
 
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 3- توزیع اعداد در رقم اول در کمیتهای طبیعی و مقایسه با قانون بن‌فورد

همان گونه که در جدول 3 دیده می‌شود اعداد به دست آمده از طبیعت به طرز شگفت انگیزی در انواع کمیتها از توزیع پیش‌بینی شده بن‌فورد تبعیت می‌کند و البته جمعیت افراد و نتایج به دست آمده بر مبنای جمعیت نیز جزء این کمیت هاست.
 
آزمون رقم اول
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 4- تعداد تکرار اعداد  1،2،3...،9 در اولین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

نمودار 1 گویای نتایج جدول 4 است که مقایسه این اعداد با حالت ایده آل که در واقع معیار بن‌فورد می‌باشد، نشان دهنده تطابق این اعداد با مدل بن‌فورد است.
 
تحلیل علمی انتخابات ریاست جمهوری 1388  
نمودار 1- مقایسه توزیع رقم اول نتایج آرای نامزدها با توزیع پیش بینی شده بن فورد

اگر بخواهیم این اعداد را به صورت درصد نسبی نشان دهیم جدول 5 ارائه دهنده این اعداد است.
 
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 5- نسبت تکرار اعداد 1،2،3...،9 در اولین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

اگر بخواهیم میزان این اختلاف را به صورت علمی حساب کنیم، باید از روشهای معتبر محاسبه خطا مانند Chi-Squared استفاده کنیم، بر مبنای این رابطه داریم :
(2)     
تحلیل علمی انتخابات ریاست جمهوری 1388

در این رابطه m نشان دهنده میزان واقعی کمیت و p احتمال وقوع آن است که با ضرب تعداد کمیتها(N) در آن به تعداد پیش‌بینی شده در توزیع ایده آل می‌رسیم. جدول 6 بر مبنای این محاسبات تنظیم شده است:
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 6- محاسبه میزان خطای Chi-Squared برای رقم اول داده‌ها

همان گونه که دیده می‌شود، بیشترین خطای نسبی 0.07 می باشد، که با توجه به تعداد نه چندان زیاد داده‌ها (366 شهرستان) نتیجه بسیار خوبی برای اعتبار نتایج است.

آزمون رقم دوم

برای بررسی دقیق تر صحت اعداد اعلام شده، گاهی اوقات رقم دوم اعداد را نیز بررسی می‌کنند و برای صحت نتایج آن را با پیش‌بینی بنفورد می‌سنجند. اگر آمار ارائه شده وزارت کشور را برای نتایج آرای نامزدها در شهرستانها بررسی کنیم برای توزیع اعداد در رقم دوم، نتایج زیر به دست می‌آید.
 
تحلیل علمی انتخابات ریاست جمهوری 1388
 
جدول 7- تعداد تکرار اعداد 0،1،2،3،...،9در دومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

همان گونه که در جدول 7 و نمودار 2 نشان داده شده است نتایج آرای تمامی نامزدها با مدل پیش‌بینی بن‌فورد تطابق بسیار خوبی دارد.
 
تحلیل علمی انتخابات ریاست جمهوری 1388  
نمودار 2- مقایسه توزیع رقم دوم نتایج آرای نامزدها با توزیع پیش بینی شده بن فورد

اگر نتایج جدول 7 را به صورت نسبی نشان دهیم به جدول 8 می‌رسیم.
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 8 - نسبت تکرار اعداد0،1،2،3،...،9 در دومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

برای محاسبه خطا، این بار نیز با استفاده از محاسبه Chi-Squared به تحلیل نتایج می‌پردازیم، که جدول 9 به همین منظور تهیه شده است.
تحلیل علمی انتخابات ریاست جمهوری 1388
 
جدول 9 - محاسبه میزان خطای Chi-Squared برای رقم دوم داده‌ها

همانگونه که دیده می‌شود، بیشترین خطای نسبی برای این آزمون 04/0 می باشد، که این میزان نیز با توجه به تعداد نه چندان زیاد داده‌ها (366 شهرستان) نتیجه بسیار خوبی برای اعتبار نتایج است.

آزمون رقم سوم

اگر بخواهیم حد  اطمینان را افزایش دهیم، می‌توان تمامی این محاسبات را برای رقم سوم نیز تکرار کرد، البته برای این منظور باید از معیار رقم سوم بن‌فورد استفاده کرد. با ادامه محاسبات برای بررسی نهایی، جداول و نمودارهای ذیل خواهند آمد. شایان ذکر است در این آزمون از اطلاعات مربوط به یکی از نامزدها به علت اینکه بسیاری از آرا ایشان در شهرستانها دو رقمی و فاقد رقم سوم بود، حذف گردیده است.
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 10 - تعداد تکرار اعداد 0،1،2،3...،9 در سومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان
نمودار 3 گویای نتایج آزمون رقم سوم است:
تحلیل علمی انتخابات ریاست جمهوری 1388
نمودار 3- مقایسه توزیع رقم سوم نتایج آرای نامزدها با توزیع پیش بینی شده بن فورد

بر همین اساس جدول 11 نسبت تکرار اعداد 0،1،2،3...،9 در سومین رقم سمت چپ تعداد آرای هر نامزد را نشان می دهد.
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 11- نسبت تکرار اعداد 0،1،2،3...،9 در سومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان
تحلیل علمی انتخابات ریاست جمهوری 1388
جدول 12 - محاسبه میزان خطای Chi-Squared برای رقم سوم داده‌ها

همانگونه که دیده می‌شود، بیشترین خطای نسبی برای این آزمون 0.03 می باشد، که این میزان نیز با توجه به تعداد نه چندان زیاد داده‌ها (366 شهرستان) نتیجه بسیار خوبی برای اعتبار نتایج است.

نتیجه گیری نهایی

همان گونه که بیان شد، امروزه برای اعتبار سنجی علمی نتایج انتخاباتها در سراسر دنیا روشهای خوبی وجود دارد، که یکی از اصلی ترین این روشها روش توزیع Benford بر مبنای تعداد ظاهر شدن اعداد 1 تا 9 در رقمهای اول تا سوم نتایج تفکیکی است. در این مقاله سه روش قدرتمند بر داده های استخراج شده مربوط به آرای تفکیکی شهرستانها از پایگاه اینترنتی وزارت کشور www.moi.ir اعمال گردید که همگی حاکی از صحت علمی نتایج انتخابات است و بنابراین فرض دستکاری گسترده در آرا و عددسازی مردود است.


منابع و مراجع

1.    پایگاه اینترنتی وزارت کشور www.moi.ir
2.    “Detecting Problems in Survey Data using Benford’s Law”, George Judge, University of California at Berkeley, Laura Schechter, University of Wisconsin at Madison, November 1, 2007
3.    “The Effective Use of Benford’s Law to Assist in Detecting Fraud in Accounting Data”, Cindy Durtschi,William Hillison, Carl Pacini, Journal of Forensic Accounting, Vol. V 2004, pp 17-34
4.    “Election Forensics: Vote Counts and Benford's Law”, Walter R. Mebane, Jr., July 17, 2006
5.    http://mathworld.wolfram.com/Chi-SquaredTest.html
6.    http://mathworld.wolfram.com/BenfordsLaw.html
7.    http://en.wikipedia.org/wiki/Benford's_law
8.    http://en.wikipedia.org/wiki/Chi-square_distribution
9.    http://en.wikipedia.org/wiki/P-value

* پژوهشگر – کارشناس ارشد دانشگاه شریف

  دانلود فایل PDF

مرتبط:
یک منحنی گمراه‌کننده

انحراف معیار آرای اعلام شده مشکل دار بود؟
  یک رگرسیون گمراه‌کننده
یک بحث آماری درباره فراگیری موج سبز

منبع: الف
   
  

اضافه نمودن به:  

نظر شما:
نام:
پست الکترونیکی:
نظر
  * قبل از ارسال نظر آنرا ویرایش کرده و قواعد نگارش را در آن رعایت کنید.
* لطفاً در مطالب خود اخلاق اسلامی و قوانین کشور را مد نظر داشته باشید.
* نمایش نظرات کاربران در خبرها به معنای تایید آنها توسط سایت نیست.

 کد امنیتی:
 
   آخرین مطالب سایت  
  تکرار سناریو منتخبان استخدامی نفت این بار در شرکت نفت ستاره خلیج فارس
  توافق جدید گازی زنگنه و ترکمنستان/ ترکمن‌ها گاز ایران را زمستان قطع نمی‌کنند
  واحد حادثه‌دیده پالایشگاه شازند هنوز به مدار تولید بازنگشته است
  آغاز ثبت‌نام از مشترکان خانگی برای نیروگاه‌های خورشیدی در بام منازل
  واحد حادثه دیده پالایشگاه شازند از ۵ روز پیش با ظرفیت کامل وارد مدار شد
  بنزین وارداتی حاوی ام.ام.تی. عامل بازگشت روزهای ناسالم پایتخت + سند
  استراتژی دانشگاه صنعت نفت در دولت یازدهم/ هاشمی: یک پنجم ورودی های امسال خانم هستند
  نخستین قرارداد فروش گاز اتان پارس جنوبی منعقد شد
  سهم برداشت نفتی ایران از مخازن مشترک به میزان برداشت کشورهای دارای مخازن مشترک می رسد
  واحد چهارم پالایشگاه فازهای ١٥و ١٦پارس جنوبی آماده راه اندازی شد
  ١٧هزار اتوبوس تمام گاز سوز جایگزین اتوبوسهای فرسوده دیزلی می شود(اصلاح)
  سومین واحد شیرین سازی فاز 12 راه اندازی شد
  بازپس‌‌گیری شرکت‌های پتروشیمی که به غلط واگذار شدند ممکن نیست/ پتروشیمی ها به سوی کاهش خام فروشی گام بردارند
  پیشنهاد مرکز پژوهش‌ها برای حذف فرمول قیمت‌گذاری خوراک پتروشیمی‌‌ها/ فرمول طراحی‌شده ناکارآمد است
  صنعت نفت کشور موتور محرکه توسعه و اقتصاد ملی است
  رشد مصرف بنزین در سال ۹۳ منفی شد
  آتش سوزی در پالایشگاه شازند اراک
  ساخت دستگاه هوشمند شارژرهای صنعتی در شرکت نفت و گاز آغاجاری
  راه اندازی 2 واحد گازی نیروگاه پتروشیمی دماوند
  بازدید وزیر صنعت، معدن و تجارت از پتروشیمی کردستان / پتروشیمی کردستان اشتغال منطقه را متحول می کند
ادامه آخرین مطالب سایت
 
 
 
::  پیوندها ::  نسخه موبایل ::  RSS ::  جستجوی پیشرفته ::  نسخه تلکس
استفاده از مطالب نفت نیوز با ذکر منبع بلامانع است.
پشتیبانی توسط: گروه نرم افزاری فکا