فناوری اطلاعات و نرم افزار

فناوری اطلاعات , نرم افزار - هوش تجاری - داده کاوی - سیستم های اطلاعاتی مدیریت - مشاوره و اجرای پروژه

فناوری اطلاعات و نرم افزار

فناوری اطلاعات , نرم افزار - هوش تجاری - داده کاوی - سیستم های اطلاعاتی مدیریت - مشاوره و اجرای پروژه

داده کاوی و فرمول های آماری در آن

متدهای آماری در داده کاوی

مقدمه :

فن آمارگری علم جمع آوری و سازمان دهی اطلاعات و ترسیم نتیجه از مجموعه داده ها است .

سازمان دهی و توصیف مشخصه های عمومی مجموعه داده ها موضوع مورد مطالعه در حیطه

آمار تشریحی است .این فصل بر روی اصول اولیه استنتاج آماری تاکید می کند .

تحلیل داده های آماری دارای بیشترین مجموعه متدولوژی ها برای داده کاوی است . به صورت

تاریخی اولین کامپیوتر بر پایه برنامه های تحلیل داده با پشتیبانی از آمارگرها توسعه پیدا کرد .

آمار روشهای متنوعی شامل رگرسیون و تحلیلی تفکیکی برای داده کاوی عرضه می کند .

-1-5 استنتاج آماری

مجموع مشاهداتی که برروی تحلیل آماری مورد نظری صورت می گیرد صرف نظر از متناهی یا

نامتناهی بودن آن بستگی به واژه ای به نام جمعیت دارد . در زمینه استنتاج آماری، علاقه

مندیم وقتی که برسی تمام مشاهدات موجود غیر ممکن یا غیر عملی باشد به یک نتیجه

مطلوب برسیم. به طور مثال تست کردن تمام لامپ های روشنایی یک محصول خاص برای

رسیدن به میانگین طول عمر لامپ به صورت عملی غیر ممکن است. بنابر این باید زیرمجموعه

ای از جمعیت برای تحلیل آماری بسنده کنیم که به آن نمونه یا مجموعه داده ها هم میگویند.

از مجموعه داده های داده شده یک مدل آماری از جمعیت می سازیم که به ما کمک می کند

استنتاج مورد نظر را از جمعیت تولید کنیم. اگر نتایج استنتاج معتبر بود باید به نمونه هایی

برسیم که معرف جمعیت باشد. اغلب سعی می کنیم مجموعه داده های نمونه را از عناصری

انتخاب کنیم که در دسترس هستند، ولی روش مذکور ممکن است باعث ایجاد خطا در

استنتاج شود . بنابر این سعی می کنیم داده های انتخابی به صورت کاملا تصادفی انتخاب

شوند.

تئوری استنتاج آماری شامل آن دسته از روشهایی است که تولید استنتاج از جمعیت می کنند

، این روشها به دو دسته روش تخمینی و روش تست فرضیه تقسیم می شوند.

در روش تخمینی هدف رسیدن به یک یا مجموعه ای از مقادیر پذیرفتنی برای پارامترهای

ناشناخته سیستم است.

به ترتیبی که بتوان تخمینی از پارامترهای T هدف بدست آوردن اطلاعات از مجموعه داده های

زد. F(X,W) وابسته به مدل دنیای حقیقی سیستم W

T={(x11,…,x1n),(x21,…,x2n),…}

X={x1,…,xn}

زمانی که پارامترهای مدل تخمین زده شدند ، میتوانیم از آنهای برای پیشگویی متغیر تصادفی

استفاده کنیم . x* = x-y بر پایه X متعلق به مجموعه اولیه Y

جهت دانلود کامل مقاله به ادامه مطلب مراجعه کنید

http://dl.irpdf.com/CD20/Riyaziyat/www.irpdf.com(6936).pdf

عباس علامه چهارشنبه 12 خرداد 1389 ساعت 16:58

نظرات 1 + ارسال نظر

حسین چهارشنبه 12 خرداد 1389 ساعت 17:29 http://www.akslar.com

سلام وبلاگ خیلی قشنگی داری لطفا به ما هم سر بزن.منتظرم

برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)

نام

ایمیل

آدرس وبسایت

مشخصات مرا به خاطر بسپار

ایمیل شما بعد از ثبت نمایش داده نخواهد شد