روش آنالیز خوشه ای در حقیقت نوعی کاوش ابتدایی بدون دانس یا با دانش قبلی کم می شود که تحصیلات زیادی در مورد آن به شکل های متفاوت پذیرفته است.بسیاری از تکنیک های خوشه ای مواردی همچون اندازه و سطح داده ها را در نظر نمی گیرند و در بسیاری موارد اشیائ با نمونه های مشابه را به اشتباه و بدون توجه به اینکه ممکن است آنها در سطوح مختلفی قرار داشته باشند.
روش خوشه بندی ترکیبی مطرح شده در این مقاله از دو مرحله خوشه بندی به صورت تقسیم و غلبه استفاده می نماید،این روش بدین ترتیب است که در مرحله اول خوشه بندی بمنظور گروه بندی نمونه های هم سطح ، کل فضا را به فضاهایی تبدیل کرده و در مرحله دوم به خوشه بندی هر یک از زیر فضاها به روش k-means می پردازد و مشکل مطرح شده بعنوان عدم هماهنگی را حذف می نماید. این روش هیچ بعدی را حذف نخواهد کرد و به جای آن زیر فضاهای کوچیکتر را انتخاب می نماید و بر اساس همین ....
تصمیم گیری یکی از کارهای مهمی است که میتوان روی پایگاه داده های بزرگ انجام داد.در این روش درخت تصمیم گیری با استفاده از الگوریتم ژنتیک ایجاد میشود.این تصمیم گیری بر اساس داده های خوشه بندی شده انجام میشود. طول کروموزوم ها در این روش 3n و هر ژن 2 بخش است .بخش اول عددی بین 1 تا تعداد فیلد هاست که بیانگر شماره فیلد است و بخش دوم یک رشته 2 بیتی باینری است.کروموزوم ها بصورت تصادفی ایجاد میشوند. بعد از ترکیب و جهش ........
نتایج نشان از افزایش سرعت استخراج قواعد تصمیم بر اساس داده های خوشه بندی شده است.
علایق کاربران وب می تواند توسط صفحات وب ملاقات شده و مدت زمان بر روی این صفحات در طی گشت و گذار آنها در وب مشخص شود.پارامتر مدت زمان یک صفحه وب که در لاگ فایلها ذخیره می شود،پارامتر مهمی در آنالیز رفتار حرکتی کاربران وب به حساب می آید.
در این مقاله یک الگوریتم دو مرحله ای برای خوشه بندی الگوهای دسترسی وب با استفاده از ترکیب اتوماتای یادگیر و منطق فازی پیشنهاد می کنیم.در اولین مرحله هر الگوی دسترسی وب از لاگهای وب به الگوی دسترسی فازی وب تبدیل می شود، که یک بردار فازی متشکل از متغیر های زبانی یا صفر می باشد.هر عنصر در الگوهای دسترسی فازی وب نشان دهنده صفحه وب ملاقات شده و مدت زمان بر روی این صفحه وب می باشد.سپس با استفاده از اتوماتای یادگیر هر الگوی دسترسی فازی ....
نتایج آزمایشها که بر روی چند لاگ داده واقعی وب تست شده است کارآیی بالای الگوی پیشنهادی را در مقایسه با سایر روشهای موجود نشان می دهد.