HDFS یک فایل سیستم توزیع شده متن باز است که به منظور مدیریت دادههای عظیم به صورت توزیع شده در سختافزارهای ارزان با تعداد بالا توسعه یافته است. در معماری HDFS دو نوع گره با نامهای NameNode و DataNode وجود دارد که نوع اول وظیفه مدیریت توزیع دادهها و دیگری وظیفه نگهداری دادهها و تبادل آنها با کلاینتها را بر عهده دارد. در سامانه مانیتورینگ معین امکان مانیتورینگ کلاستر HDFS با مانیتورینگ هر دو نوع گره وجود دارد که در ادامه شاخصهای هر یک به تفکیک ارائه میشود.
شاخصها و پارامترهای مانیتور شده Namenode توسط معین عبارتند از:
شاخصهای کلی NameNode:
- تعداد فایلها و پوشههای ایجاد شده
- تعداد فایلهای Append شده
- تعداد عملیات GetBlockLocations
- تعداد عملیات Directory Listing
- تعداد فایلها و پوشههای پاک شده
- تعداد عملیات دریافت اطلاعات فایل
- تعداد عملیات GetAdditionalDatanode
- تعداد عملیات CreateSymlink
- تعداد عملیات GetLinkTarget
- تعداد فایلها و پوشههای لیست شده با عملیات Listing
- تعداد پردازشهای گزارشات Blockها
- متوسط زمان تراکنشهای Journal
- متوسط زمان Journal Syncها
- تعداد تراکنشهای Batch در Sync
- مدت زمان بارگذاری FSImage
- تعداد Editهای دریافتی از Namenode ثانویه
- تعداد FSImageهای دریافتی از گرههای ثانویه
- متوسط زمان دریافت FSImage
- تعداد آپلودهای FSImage در گره ثانویه
- متوسط زمان آپلود FSImage در گره ثانویه
شاخصهای کلاستر:
- تعداد بلوکهای موجود تخصیصیافته در سیستم
- تعداد فایلها و پوشههای موجود
- تعداد بلوکهای Pend شده برای Replication
- تعداد بلوکهای در حال Replication
- تعداد بلوکهای زمانبندی شده برای Replication
شاخصهای DataNodeهای تحت مدیریت NameNode:
- درصد ظرفیت DFS استفاده شده
- درصد ظرفیت DFS آزاد از کل دیسک
- ظرفیت استفاده شده غیر DFS
- فضای استفاده از مخزن بلوکها
- درصد استفاده از مخزن بلوکها
اطلاعات گرههای زنده (Live):
- ظرفیت استفاده شده غیر DFS
- درصد ظرفیت DFS استفاده شده
- درصد ظرفیت DFS آزاد از کل دیسک
اطلاعات گرههای Dead:
مانیتورینگ NameNode به تنهایی برای مانیتورینگ کلاستر کافی است اما چنانچه مانیتورینگ DataNodeها به صورت مجزا مورد نظر باشد شاخصهای زیر به ازای هر DataNode توسط معین ارائه میشود:
پارامترهای کلی DataNode:
- تعداد ارتباطات فعال با Datanode
- درصد ظرفیت استفاده شده DFS
شاخصهای کارایی DataNode:
- تعداد بایتهای نوشته شده در Datanode
- تعداد بایتهای خوانده شده از Datanode
- نرخ نوشتن داده در Datanode
- نرخ خواندن داده از Datanode
- تعداد بلوکهای نوشته شده در Datanode
- تعداد بلوکهای خوانده شده از Datanode
- تعداد بلوکهای Replicate شده
- تعداد بلوکهای تایید نشده
- تعداد عملیات خواندن توسط Clientهای محلی
- تعداد عملیات خواندن توسط Clientهای Remote
- تعداد عملیات نوشتن توسط Clientهای محلی
- تعداد عملیات نوشتن توسط Clientهای Remote
- تعداد عملیات دریافت اطلاعات محلی بلوکها
- تعداد عملیات خواندن بلوکها
- تعداد عملیات نوشتن بلوکها
- تعداد عملیات Checksum بلوکها
- متوسط زمان عملیات Checksum
- متوسط زمان عملیات کپی بلوکها
- تعداد عملیات جایگزینی بلوکها
- متوسط زمان عملیات جایگزینی بلوکها
- متوسط زمان عملیات Heartbeat
- تعداد عملیات گزارش بلوکها
- متوسط زمان عملیات گزارش بلوکها
- متوسط زمان عملیات ACK RTT
- متوسط زمان عملیات Fsync Nanos
- متوسط زمان عملیات ارسال بسته

شاخصهای JVM:
HDFS با زبان جاوا توسعه یافته است و برای اجرا نیاز به JVM دارد. جزئیات شاخصهای JVM در بخش محیطهای اجرا ارائه شده است.
پروتکلهای ارتباطی: