تأثير اختيار الميزات على أداء خوارزميات التعلم الآلي في كشف التسلل باستخدام مجموعتي بيانات NSL-KDD وUNSW-NB15

محتوى المقالة الرئيسي

الصادق علي محمد العربي
عبيد بلقاسم زايد التقازي
سليمان عبدالجليل العارف المودي

الملخص

تهدف هذه الورقة الى تحليل تأثير اختيار الميزات (Feature Selection) على أداء أنظمة كشف التسلل (IDS) المعتمدة على التعلم الآلي باستخدام مجموعتي بيانات قياسيتين هما NSL-KDD وUNSW-NB15. وقد تم تقييم ثلاث خوارزميات تعلم آلي شائعة وهي شجرة القرار (Decision Tree)، والغابات العشوائية (Random Forest)، وأقرب الجيران (K-Nearest Neighbors - KNN) وتم قياس الأداء بإستخدام عدة مقاييس تقييم تشمل الدقة (Accuracy), الدقة التنبؤية (Precision), الاسترجاع (Recall), والمعدل التوافقي (F1-score) بالإضافة الى زمن الاستدلال (Inference time) وزمن التدريب كمعايير لقياس الكفاءة. وقد اعتمدت الدراسة على منهجية اختيار ميزات باستخدام مربع كاي (Chi-Square) لاستبعاد الميزات الزائدة وتقليل الابعاد.


أظهرت النتائج التجريبية أن اختيار الميزات نجح في الحفاظ على الاستقرار والدقة العالية للنماذج وتحسين الكفاءة الحسابية, حيث حققت خوارزمية الغابات العشوائية دقة 99.78% على بيانات NSL-KDD و 97.63% على بيانات UNSW-NB15 اما خوارزمية KNN فقد حققت انخفاض كبير في زمن الاستدلال بعد تقليل عدد الميزات, حيث انخفض من 34.77% الى 7.84%, وفي الغابات العشوائية على مجموعة بيانات UNSW-NB15 حيث انخفض زمن التدريب من 24 ثانية الى 5.6 ثانية, مما يعزز كفاءة النموذج في أنظمة كشف التسلل الزمن الحقيقي. تؤكد النتائج أن اختيار الميزات لا يساهم فقط في تحسين دقة التصنيف، بل يقلل أيضًا من التعقيد الحسابي، مما يجعل أنظمة كشف التسلل (IDS) أكثر كفاءة وقابلية للتطبيق في البيئات الشبكية واسعة النطاق.

التنزيلات

بيانات التنزيل غير متوفرة بعد.

تفاصيل المقالة

كيفية الاقتباس
[1]
الصادق علي محمد العربي, عبيد بلقاسم زايد التقازي, و سليمان عبدالجليل العارف المودي, "تأثير اختيار الميزات على أداء خوارزميات التعلم الآلي في كشف التسلل باستخدام مجموعتي بيانات : NSL-KDD وUNSW-NB15", SJST, م 8, عدد 1, ص 185–198, 2026.
القسم
قسم العلوم والتقنية