داده کاوی کلان داده ها و حفظ حریم خصوصی

داده کاوی کلان داده ها و حفظ حریم خصوصی

کلان­داده داده­ای حجیم، ناهمگون و با توزیع نامتمرکز است که ابعاد مختلفی دارد. در کاربردهای کلان­داده، میزان داده­های گردآوری­شده مدام رو به افزایش است، به همین دلیل مدیریت، حصول یا استخراج و پردازش داده­ها با استفاده از ابزارهای نرم­افزاری موجود دشوار است. تحلیل داده به علت حجم بزرگ داده­های موجود در انبار داده پرهزینه می­شود. حریم خصوصی داده­ها یکی از مشکلات داده­کاوی کلان­داده­ها است. برای حفظ حریم خصوصی کاربر، نیاز است از روش­هایی استفاده کنیم که هم حریم خصوصی داده­ها را حفظ می­کنند و هم سودمندی داده­ها را افزایش می­دهند. در الگوریتم­های متمرکز موجود فرض بر این است که تمام داده­ها باید در مکانی متمرکز باشند تا ناشناس باقی بمانند که این کار برای مجموعه داده­های بزرگ چندان ممکن نیست. الگوریتم­های توزیع­شده­ای نیز وجود دارند که عمدتاً به حفظ حریم خصوصی مجموعه داده­های بزرگ می­پردازند و کاری به مسألۀ مقیاس­پذیری ندارند. در سیستم پیشنهادی، به حفظ حریم خصوصی برای داده­های توزیع­شده می­پردازیم، و همچنین با تکنیک جدید برش و بی‌نام­سازی بر مشکلات m-privacy و رویکرد حفظ اسرار فائق می­آییم. هدف اصلی­مان انتشار دیدی عینی یا ناشناس از داده­های یکپارچه است که در مقابل حملات مصون­ است. از رویکرد MR-Cube استفاده می­کنیم که با معیاری جامع بر مشکلات محاسبات مکعب­های دادۀ بزرگ فائق می­آید. برش سه بخش دارد: تعمیم، برش و بی‌نام­سازی. وقتی برش انجام شد، کاربران می­توانند به داده­های ناشناس دسترسی پیدا کنند و دسترس­پذیری­شان به داده افزایش یابد.

در این مقاله، نحوۀ کاوش کلان­داده­ها را با استفاده از چارچوب نگاشت­کاهش هادوپ شرح دادیم. این چارچوب حریم خصوصی را در دسترسی غیرمجاز حفظ می­کند. در این مقاله، معماری پیشنهادیِ تعریف شد که شامل تکنیک­های مختلفی مانند نگاشت­کاهش، و تکنیک برش برای تحلیل کلان­داده­ها است، و با استفاده از این تکنیک­ها خروجی نهایی را تولید می­کند.


تلفن


آدرس

اصفهان: خیابان مدرس نجفی

ایمیل
info@novinweb.com
خدمات
میزبانی وب
میزبانی بانک اطلاعاتی
راه اندازی سرور
راهکارها
سیستم های توزیعی
مهندسی مدل رانده
توسعه فرایند نرم افزار
محصولات
وب سایت اختصاصی
برنامه کاربردی
اپلیکیشن موبایل
Top