WHEN YOU NEED STATISTICS YOU NEED A MATTER OF FACT
چند وقتیه یه جور علاقه عجیبی به یاد گرفتن (و یاد دادن) نرم افزار R پیدا کردم به همین جهت از این به بعد مطالب بیشتری در مورد R تو وبلاگم خواهید دید.
شاید کسانی که با R سر و کار داشتند از خودشون این سؤال رو پرسیده باشند که چرا اسم
نرم افزار R رو گذاشتن R ؟
قبل از پیدایش R زبان آماری S وجود داشت که بعد نسخه تجاری آن یعنی S-PLUS منتشر شد اما
به دلیل گران بودن این نرم افزار (البته تو ایران عزیز این مشکل اصلا وجود نداره!!!) دو آمار دان
نیوزلندی به نامهای Ross Ihaka و Robert Gentleman از دانشگاه Auckland تصمیم گرفتند
زبانی بر اساس S برای اهداف آموزشی بنویسند.(به همین دلیل دستورات R نه بطور کامل ولی
تا حد خیلی زیادی شبیه S-PLUS است.) و از آنجا که حرف اول اسم هر دو نفر R می باشد
نام نرم افزار خود را R گذاشتند.
R به دلایل زیر امروزه یکی از پرکاربرد ترین نرم افزارهای آماری به شمار می رود:
*رایگان است.
*در اکثر سیستم های عامل(ویندوز، لینوکس و مکینتاش) قابل اجراست.
*زمینه بی نظیری برای نوشتن متد های جدید آماری فراهم میکند.
*قابلیت توسعه بی نظیر همچون دیگر نرم افزار های متن باز را دارد.
*ویژگیهای جدید و قدرتمند گرافیکی را داراست.
فرض کنید نمونه ای شامل 5 عدد داریم که میانگین آنها 4 است. مجموع این اعداد چند باید باشد؟ بله، مجموع باید 20 باشد وگرنه میانگین 4 نخواهد شد. حال بیایید در مورد هر یک از 5 عدد مذکور بحث کنیم.
میخواهیم در هر یک از خانه های جدول فوق یکی از 5 عدد را قرار دهیم. اگر فرض کنیم که اعداد می توانند حقیقی (مثبت و منفی) باشند، اولین خانه جدول چند مقدار می تواند بگیرد؟ واضح است که هر مقداری می تواند در اولین خانه جای بگیرد، فرض کنیم 2 باشد. 2
خانه بعدی چند مقدار می تواند بگیرد؟ در این خانه هم هر مقداری می تواند باشد، فرض کنیم 7
4 2
به همین ترتیب خانه سوم هر مقداری می تواند باشد، مثلاً 4 7 4 2
و نیز خانه چهارم هر مقداری را می گیرد، مثلاً 0 0 7 4 2
و اما خانه آخر چند مقدار می تواند بگیرد؟ فقط یک مقدار – ابن مقدار باید 7 باشد تا مجموع اغداد 20 و در نتیجه میانگین 4 شود-
دیدیم که در انتخاب اعداد اول، دوم، سوم و چهارم آزادی کامل داریم، اما حق هیچ انتخابی برای عد پنجم نداریم . پس در اینجا 4 درجه آزادی داریم. به طور کلی وقتی می خواهیم میانگین را از نمونه ای به حجم n برآورد کنیم (n-1) درجه آزادی داریم .
حال می توانیم تعریف جامع تری از درجه آزادی ارائه دهیم:
درجه آزادی عبارت است از حجم نمونه (n) منهای تعداد پارامترهایی که از داده ها برآورد میشود.(پارامترهای مجهول)
the probability that the number of heads approximately equals the number of tails tends to 1, whereas the probability that the number of heads is exactly equal to the number of tails tends to 0
نرم افزار R یک زبان برنامه نویسی آماری است که به صورت رایگان و متن باز ارائه می شود. این نرم افزار همچون دیگر نرم افزارهای متن باز هر لحظه در حال بهبود و کامل تر شدن است. جالب است که این نرم افزار حتی ساده ترین منوهای آماری را ندارد و تمامی امکانات آن از طریق دستورات و کد نویسی قابل استفاده است.
این نرم افزار تقریباً کامل است و اکثر زمینه های آمار کاربردی(تحلیل سری های زمانی، رگرسیون خطی و غیر خطی، آزمون فرض های کلاسیک ، کدگذاری، خوشه بندی و ...) را پوشش می دهد.
از سال 2004 هر ساله همایشی با عنوان "use R" در کشور های مختلف و با حضور آماردانان و متخصصان برجسته برای توسعه هر چه بیشتر این زبان آماری انجام می شود.
بی شک این نرم افزار به دلیل توسعه نرم افزارهای متن باز در آینده بیشتر مورد توجه قرار خواهد گرفت و به دلیل انعطاف پذیری بالای آن پژوهشگران بیشتری مجبور به استفاده از آن خواهند شد .
آخرین نسخه نرم افزار R را از اینجا دانلود کنید.
متن زیر از یک کتاب تقریبا قدیمی انتخاب شده ... از این خلاصه تر نمی شد:
در نهار خوری خانه سر میز نهار صحبت از این به میان آمد که چگونه میتوان احتمال حوادث را محاسبه نمود. یکی از استراحت کنندگان پرسید:
- آیا واقعا در تمام حالات می توان احتمال حوادث را محاسبه نمود؟ این مثال را در نظر بگیرید. من آرزو کردم که اولین عابری را که ما از پنجره اطاق نهار می بینیم مرد باشد. احتمال آنکه آرزوی من برآورده شود چقدر است؟
- البته این احتمال مساوی با ½ است هرگاه قرار باشد پسر یک ساله را مرد بشماریم. تعداد مردان در جهان با تعداد زنان مساویست.
یکی دیگر از استراحت کنندگان پرسید:
- و احتمال آنکه دو تن از عابرین اول مرد باشند چقدر است؟
- این محاسبه یک اندازه پیچیده تر است. حالاتی را که در این مورد ممکن است بر می شماریم. اولا ممکن است که هر دو عابر مرد باشند. ثانیا اینکه شاید شخص اول مرد و شخص دون زن باشد. سوماٌ ، برعکس، شاید شخص اول زن و شخص دوم مرد باشد. و بالاخره حالت چهارم که هر دو عابر زن باشند. بدین ترتیب تعداد تمام حالات ممکنه چهار است. واضح است که از این تعداد فقط یک حالت یعنی حالت اول مناسب است. پس برای احتمال کسر ¼ را دریافت می کنیم. اینک مساله شما حل شد.
- فهمیدم. اما مساله سه مرد را نیز می شود حل نمود: احتمال آنکه اولین سه شخص عابر مرد باشند، چقدر است؟
- خب، این را نیز محاسبه می کنیم. باز هم از برشماری حالات ممکنه شروع می کنیم. بطوریکه ما میدانیم در مورد دو تن عابر تعداد حالات ممکنه 4 است. با اضافه شدن عابر سوم تعداد حالات ممکنه دو برابر می شود زیرا به هر یک از چهار حالت دو عابر مرد یا زن می تواند اضافه گردد. در این مورد تعداد حالات ممکنه مساوی 8 است. و احتمال مطلوب، برابر کسر 1/8 می باشد. در اینجا می توان بآسانی قاعده محاسبه را برقرار نمود: در حالت دو عابر با احتمال 1/4= 1/2×1/2 و در حالت سه عابر با احتمال 1/8= 1/2×1/2×1/2 ، و در حالت چهار عابر با احتمال برابر حاصلضرب چهار نیمه واحد سر و کار داریم و الی آخر. بطوریکه ملاحضه میکنید احتمال پیوسته کوچکتر می شود.
- برای ده نفر عابر این احتمال چند است؟
- احتمال اینکه ده عابر اول همگی مرد باشند، برابر حاصلضرب ده نیمه واحد یعنی 1/1024 است. یعنی هرگاه شما در مقابل یک دلار شرط ببندید که این حادثه صورت بگیرد آنگاه من میتوانم 1000 دلار شرط بندم که این حادثه رخ نمی دهد.
- شرط بندی مفدیست! من حاضرم یک دلار شرط بندی کنم تا امکان بردن یک هزار دلار را پیدا کنم.
- ولی این را هم در نظر بگیرید که در برابر یک شانس شما 1000 شانس مخالف وجود دارد.
- هیچ تفاوتی ندارد. من حاضرم حتی بخاطر اینکه صد نفر عابر اول همه مرد باشند یک دلار را در مقابل هزار دلار بگذارم.
آماردان پرسید:
- آیا شما تصوری از کمی احتمال چنین حادثه ای دارید؟
- یک میلیونیم یا در این حدود؟
- خیلی کمتر! یک میلیونیم در مورد 20 نفر عابر حاصل می شود. در مورد صد عابر احتمال... اجازه بدهید روی کاغذ برآورد کنم. یک بیلیونیم... یک تریلیونیم... یک کواردیلیونیم... به به! یک واحد با دنباله ای از سی صفر!
- فقط همین؟
- مگر 30 صفر کم است؟ تعداد ریزترین قطرات آب اقیانوس حتی به یک هزارم این عدد نمی رسد.
- حرفی نیست، عددی بس بزرگ است! چقدر در برابر یک دلار من میگذارید؟
- ها – ها! تمام دار و ندارم را.
- تمام دار و ندارتان زیاد از حد است. شما در برابر دلار من اتومبیلتان را بگذارید. آخر، نمیگذارید؟
- چرا؟ بفرمائید! حال که میخواهید بگذار اتومبیل باشد. برای من کوچکترین ریسکی در میان نیست.
- من هم ریسک نمی کنم. یک دلار که چندان پولی نیست. ولی در عوض میتوانم برنده اتومبیل شوم و شما تقریبا برنده هیچ چیز نمیشوید.
- شما بدانید که حتما میبازید! شما هرگز صاحب اتومبیل من نمیشوید و میتوان گفت که دلار شما در جیب من است.
دوست آماردان او را نگه میداشت:
- شما چه میکنید! به خاطر یک دلار امکان دارد اتومبیلتان را از دست بدهید. چه بی عقلی!
بر عکس، بی عقلی آن است که حتی یک دلار هم در چنین شرایطی گذاشته شود. باخت حتمی است! بهتر است بلافاصله این دلار را بدهد.
- ولی با این همه یک شانس موجود است؟
- قطره ای در اقیانوس بیکران. در دهها اقیانوس! چنین است شانس شما. برنده بودن من همانقدر حتمی است که دو تا دو چهار است.
- در این موقع پیر مردی که تمام مدت ساکت مانده و به بحث گوش داده بود به آرامی گفت:
- ای جوان! شما خیلی سرگرم شده اید...
- مگر چطور؟ شما هم، پروفسور، کوتاه بینانه قضاوت میکنید؟
- آیا شما فکر نموده اید که در این مورد همه حالات دارای امکانات مساوی نمی باشند؟ محاسبه احتمالات فقط برای کدام حوادث درست است؟ برای حوادثِ دارای امکانات مساوی، همینطور نیست؟ در صورتیکه در مثال مورد نظر... در این لحظه پیر مرد گوشش را بطرفی متوجه ساخته و گفت: اتفاقا خود واقعیت اشتباه شما را واضح میسازد. صدای موزیک نظامی به گوش میرسد، همینطور نیست؟
آمار دان جوان شروع به حرف زدن کرد:
- موزیک به موضوع چه ربطی دارد؟... ولی حرفش ناتمام ماند و در چهره اش ترس هویدا شد. او از جایش برخاسته بطرف پنجره رفت و سرش را بیرون کرد. او با صدای غمگین گفت:
- بلی، همینطور است! شرط را باختم! اتومبیل من، خداحافظ...
پس از یک دقیقه برای همگان واضح شد که موضوع از چه قرار است. یک گردان از سربازان از جلوی پنجره رد می شد.
برگرفته با کمی تخلیص از کتاب "ریاضیات زنده" نوشته: ی. پرلمان ، ترجمه: ذبیح الله بشر دوست

نوروز، همه باغ و چمن غرق شکوفه ست
دل هر نفس از بوی گل و لطف هوا مست
برخیز و برقص آی و بنه بر سر غم پای
بنشین و بخوان شعر و بده جام و بزن دست
به گزارش الف، دو مرکز نظرسنجی در اسفندماه اقدام به انجام نظرسنجی کشوری
کردهاند که در هر دو مورد محمود احمدینژاد وضعیت خود را نسبت به
نظرسنجیهای قبلی بهبود بخشیده است. در هردوی این نظرسنجیها سیدمحمدخاتمی
بدون تغییر عمده و برروی یک خط تقریبا افقی موقعیت خود را حفظ کرده است و
سایر نامزدها نیز با شیب تقریبا مثبت ملایم به رقابت انتخاباتی ادامه
میدهند.
نتایج یکی از نظرسنجیها به شرح زیر است:
تاریخ: اول اسفند
مکان نظرسنجی: 32 شهر بزرگ
حجم نمونه: 22472
18 سال به بالا
دوست دارید چه کسی نامزد شود؟

خاتمی 30.4، احمدینژاد 27.9، هاشمی رفسنجانی 3.1، قالیباف 1.8، موسوی
1.7، کروبی 1.5، نمیدانم و نمیشناسم 11.7، هیچکس را انتخاب نکردهام
6.7، سایر موارد 5.6، بیپاسخ 5.5
اگر فردا 22 خرداد 1388 باشد به چه کسی رای میدهید؟ (پاسخهای افرادی که اعلام کردهاند در انتخابات شرکت میکنند)

46.5 احمدینژاد، 33.5 خاتمی، 4.2 قالیباف، 1.9 کروبی، موسوی 1.7، پورمحمدی 0.4، نمیدانم 13.2، بیپاسخ 0.5
منبع : alef.ir