امروز پنجشنبه 30 / 10 / 1395

MtAq13: کد محصول

Database Preprocessing and Comparison between Data Mining Methods
پردازش پایگاه داده ها و مقایسه بین روش های داده کاوی

زبان مبدا :انگلیسی

نام نویسنده :Yas A. Alsultanny

سال انتشار :2011

تعداد صفحات انگلیسی :13

تعداد صفحات فارسی :16

رشته و گرایش های مرتبط با این مقاله :HIT ، MIT

قیمت بر حسب ریال :160,000

تعداد بازديد :199

جزئیات بیشتر ودانلود
 

چکیده

پردازش پایگاه داده ها و مقایسه بین روش های داده کاوی

پردازش پایگاه داده ها در بهره برداری از مصرف حافظه بسیار حایز اهمیت می باشد ، متراکم سازی یکی از ابزار پیش پردازش ضروری برای کاستن از حافظه مورد نیاز برای ذخیره کردن و بارگذاری داده ها به منظور پردازش می باشد ، روش متراکم سازی ارایه شده در این مقاله از طریق بکارگیری مثال های پیشنهاد شده، مورد تست قرار گرفت  تا تاثیر تکرار در پایگاه داده ها و همچنین اندازه پایگاه داده ها را نشان بدهد و نتایج مشخص نمودند که هر وقت تکرار افزایش یافته است ، نسبت متراکم سازی افزایش خواهد یافت . متراکم  سازی یکی از فعالیت های مهم برای پیش پردازش داده ها قبل از اجرای داده کاوی می باشد . روش هاي داده كاوي نظير Naive bayes ، Nearest neighbor ، و درختان تصميم گيري مورد تست قرار ميگيرند. اجراي سه روش نشان داد كه روش Naive bayes بطور موثر زماني استفاده ميشود كه نشانه هاي داده ها دسته بندي ميشوند و ان روش را ميتوان بطور موفقيت آميزي در يادگيري ماشيني استفاده نمود. روش Nearest neighbor در زمانی بسیار مناسب می باشد که نشانه های داده ها دایمی هستند یا دسته بندی می شوند . درختان تصمیم گیری سومین روشی می باشد که مورد تست قرار گرفت و این روش یک روش پیشگویانه ساده می باشد که از طریق بکارگیری روش های ساده قاعده در دسته بندی داده ها اجراء گردید . موفقیت اجرای داده کاوی به کامل بودن پایگاه داده ها بستگی دارد که از طریق مخزن های داده ها نشان داده شدند که بایستی از طریق بکارگیری مشخصه های مهم مخزن داده ها سازماندهی گردند . 

Abstract

Database Preprocessing and Comparison between Data Mining Methods

Database preprocessing is very important to utilize memory usage, compression is one of the preprocessing needed to reduce the memory required to store and load data for processing, the method of compression introduced in this paper was tested, by using proposed examples to show the effect of repetition in database, as well as the size of database, the results showed that as the repetition increased the compression ratio will be increased. The compression is one of the important activities for data preprocessing before implementing data mining. Data mining methods such as Na¨ıve Bayes, Nearest Neighbor and Decision Tree are tested. The implementation of the three methods showed that Na¨ıve Bayes method is effectively used when the data attributes are categorized, and it can be used successfully in machine learning. The Nearest Neighbor is most suitable when the data attributes are continuous or categorized. The third method tested is the Decision Tree, it is a simple predictive method implemented by using simple rule methods in data classification.

The success of data mining implementation depends on the completeness of database, that represented by data warehouse, that must be organized by using the important characteristics of data warehouse.

 
 
برچسب ها : مقاله , ترجمه انگليسي به فارسي , ترجمه تخصصي , پايگاه داده , داده كاوي , data base , data mining , كامپيوتر , HIT , MIT , 2011