سنجش
کیفیت اینترنت برای ارزیابی عملکرد لینکهای داده در سرتاسر دنیا و درک اینکه
کشورها چگونه در طول این سالها ارتباطات خود را بهبود دادهاند ضروری است. علاوه
بر این، ارزیابی عملکرد اینترنت باعث درک تنگناهای شبکه، عیبیابی و حتی بینشهایی
دربارۀ تأثیر رویدادهای مهمی مانند سونامی، قطع شدن کابلهای فیبری یا تحولات
اجتماعی بر اینترنت میشود. به این دلیل از سال 1998، طرح PingER (گزارشدهی پینگ سرتاسری) در آزمایشگاه شتابدهندۀ ملی اسلاک
عملکرد سرتاسری لینکهای اینترنت 160 کشور را پایش و تاریخچۀ جهانیِ از عملکرد
اینترنت ارائه میکند. دادههای حاوی اندازهگیریهای شبکۀ اینترنت به صورت روزانه
از سازمانهای اندازهگیری ( MA ها) PingER گردآوری و در فایلهای تخت مرتب میشوند. در نتیجه، PingER مجموعه دادۀ بزرگ ریزدانۀ ارزشمندی را نگهداری میکند که شامل
دادههایی دربارۀ عملکرد اینترنت در دنیا است. با این حال با توجه به میزان عظیم
دادهها، انجام تحلیلهای مشترک پیچیده روی فایلها ممکن است آنچنان دشوار باشد که
در برخی سناریوها شدنی نباشد. در این مقاله، تکنیک انبار داده را برای تبدیل دادههای
موجود در این فایلهای تخت به دادههای ساختارمند، با استفاده از مدل دادهای که
تحلیلهای پیچیده را تسهیل میکند، به کار میگیریم. دادههای تبدیلشده را در
انبار دادهی توزیعشدهی بزرگی بارگذاری میکنیم و در نتیجه میتوانیم در چند
ثانیه پرسوجوهای تحلیلی پیچیدهای روی حجم عظیمی از دادهها انجام دهیم. در
نهایت، برخی تحلیلهای داده را ارائه میکنیم که دادههای عملکرد اینترنت را به
سناریوهای فرضی دنیای واقعی ربط میدهند.