Professional Documents
Culture Documents
Phishing GRU LSTM Mortadha Al-Ajwad ١١٢٣١٩.en.ar
Phishing GRU LSTM Mortadha Al-Ajwad ١١٢٣١٩.en.ar
com -
جامعة أورميا
رسالة الماجستير
أسلوب جديد للكشف عن التصيد االحتيالي باستخدام شبكة GRUالمحسنة باستخدام خوارزمية تحسين
البطريق اإلمبراطور
مشرف: طالب:
جمشيد باقرزاده مرتضى حبيبآل-أجواد
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
مقدمة
التصيد االحتيالي هو هجوم عبر اإلنترنت حيث يخدع المهاجمون الضحايا ليكشفوا عن معلومات حساسة .تحاكي مواقع التصيد االحتيالي المواقع
الشرعية لسرقة البيانات الشخصية .تشمل " تقنيات الكشف" أساليب مختلفة مثل األنظمة القائمة على القواعد ،والتعلم اآللي ،والتعلم العميق .تعمل
هذه األساليب على تحليل بنية عنوان URLوسمعة النطاق والمحتوى وسلوك المستخدم للتمييز بين المواقع الحقيقية والمزيفة .مع تطور التصيد
االحتيالي ،يعد البحث عن أنظمة الكشف المبتكرة أمًر ا بالغ األهمية .تجمع هذه الدراسة بين الشبكة العصبية GRUوخوارزمية التحسين
Emperor Penguinلمكافحة تعقيد مواقع التصيد االحتيالي.
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
Start
Data cleaning
Normalization
Management of outliers
Handle duplicates
تستخدم هذه األطروحة الشبكة العصبية GRUلتعزيز دقة تحديد موقع التصيد
Management of inconsistencies
السياقية في محتوى الويب .باإلضافة إلى ذلك ،فهو يتضمن خوارزمية تحسين Utilizing GRU
البطريق اإلمبراطور ( )EPOلتحسين أداء شبكة GRUبشكل أكبر .يقوم EPO Network raining phase
Random determination
of number of hidden
layers of LSTM neural
بضبط المعلمات بشكل دقيق ،مما يحسن قدرة الشبكة على التمييز بين المواقع network
الوقت المناسب عن مواقع التصيد االحتيالي ،مما يؤدي في نهاية المطاف إلى Updating number of
LSTM optimized No Is stop
condition
Yes
الجمع بين نقاط قوة الشبكة العصبية GRUوإمكانيات التحسين لخوارزمية Network evaluation phase
Data classification using
optimized LSTM
المعالجة المسبقة
تعد المعالجة المسبقة ضرورية لتحسين البيانات لمهام مثل التحليل أو النمذجة أو التعلم اآللي.بياناتتطبيع
أتقنية إحصائية ،تعمل على توحيد البيانات الرقمية لتعزيز االتساق والمالءمة للنمذجة والتحليل والتصور.
تحجيم الحد األدنى والحد األقصىهي طريقة لقياس الميزات ضمن نطاق ،عادة ما يكون بين 0و.1
المعالجة المسبقة
خلط البيانات هو عملية إعادة ترتيب العينات أو المثيالت بشكل عشوائي داخل مجموعة البياناتُ .ت ستخدم هذه الطريقة بشكل متكرر في تحليل
البيانات والتعلم اآللي إلضافة العشوائية وإزالة أي تحيزات ترتيب محتملة قد تكون موجودة في البيانات.
تقسيم التسمية
تتضمن تقنية المعالجة المسبقة المعروفة باسم "تقسيم الملصقات" فصل تسميات مجموعة البيانات (المعروفة أيًض ا باسم المتغيرات المستهدفة) عن
البيانات األخرى .بمعنى آخر ،فإنه يستلزم فصل الميزات (متغيرات اإلدخال) التي ستستخدمها إلنشاء التنبؤات من األعمدة (األعمدة) التي تحتوي
على القيم المستهدفة التي تحاول التنبؤ بها.
تقسيم البيانات إلى اختبار وتدريب
يتطلب تحليل البيانات والتعلم اآللي تقسيم البيانات إلى مجموعات تدريب واختبار وتحقق من الصحة من أجل إنشاء النماذج واختبارها وضبطها
بشكل صحيح .يساعد هذا القسم في تقييم أداء النموذج بشكل موضوعي وواقعي.
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
تتناول األطروحة المشكلة الملحة المتمثلة في تحديد وإحباط نمو مواقع الويب االحتيالية والخطيرة المرتبطة بالتصيد .تقدم األطروحة اقتراًحا جديًد ا في هذا
الصدد من خالل االستفادة من الشبكة العصبية ذات الوحدة المتكررة ( .)GRUالوحدة المتكررة المسورة ( )GRUهي نوع من بنية الشبكة العصبية
المتكررة ( )RNNالتي تم إنشاؤها للتغلب على بعض أوجه القصور في شبكات RNNالتقليدية.يتم أيًض ا تنفيذ المعالجة التسلسلية للبيانات باستخدام شبكات
الذاكرة طويلة المدى ( ،)LSTMوالتي ُت عرف بشكل أكثر شيوًعا باسم .GRUs
بوابة التحديث (ض)
بوابة إعادة الضبط (ص)
الدولة المخفية للمرشح (ح)
الحالة المخفية النهائية (ح)
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
بمساعدة ،EPOنريد البحث بذكاء في مساحة المعلمات الفائقة لنموذج GRUعنمجموعة المعلمات الفائقة التي ستنتج أفضل أو أفضل النتائج تقريًبا
لتحديد مواقع التصيد االحتيالي .يتم تحقيق التوازن بين االستكشاف واالستغالل في ، EPOمما يمكن أن يساعد في اجتياز المشهد المعقد للمعلمات الفائقة
بنجاح.
• تقييم األداء :باستخدام مجموعة بيانات كافية من مواقع التصيد االحتيالي ،قم بتدريب وتقييم نموذج GRUمع كل مجموعة من المعلمات الفائقة باستخدام
المقاييس ذات الصلة بما في ذلك الدقة والدقة واالستدعاء ودرجة .F1
مقاييس التقييم
دقة دقةهو مقياس أساسي يقيس الصحة العامة للتنبؤات التي يقدمها نظام كشف التسلل .يتم حسابه على أنه نسبة المثيالت المصنفة بشكل صحيح (كل من
اإليجابيات والسلبيات الحقيقية) إلى إجمالي عدد المثيالت في مجموعة البيانات.
دقة: :الدقة ،والمعروفة أيًض ا بالقيمة التنبؤية اإليجابية ،تركز على دقة التنبؤات اإليجابية للنظام .على وجه التحديد ،فهو يقيس نسبة التنبؤات اإليجابية
الحقيقية (الهجمات المحددة بشكل صحيح) بين جميع الحاالت المتوقعة على أنها إيجابية (كل من اإليجابيات الحقيقية واإليجابيات الخاطئة).
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
مجموعة البيانات
ال PhishTankمجموعة البيانات هي مورد حاسم فياألمن اإللكترونيوالكشف عن التهديدات .وهو بمثابة مستودع شامل لهجمات التصيد االحتيالي
الفعلية ،مما يوفر بيانات قيمة للباحثين والمحللين وخبراء األمن .التصيد االحتيالي هو أسلوب خبيث ينتحل فيه المحتالون شخصيات شركات حسنة
السمعة الستخراج معلومات حساسة ،ويشكل خطًرا كبيًر ا على األفراد والشركات واألنظمة الرقمية .الPhishTankمجموعة البيانات هي جهد تعاوني
داخالألمن اإللكترونيالمجتمع ،حيث يقوم األفراد والمنظمات باإلبالغ عن عناوين URLالمشتبه بها للتصيد االحتيالي .ويتم بعد ذلك التحقق من هذه
التقارير من قبل متطوعين وخبراء للتأكد من صحتها .يتم تصنيف عناوين URLالمشروعة وتصنيفها وإضافتها إلى مجموعة البيانات ،مما يضمن
التدفق المستمر لعينات التصيد االحتيالي الجديدة .يضمن نهج التعهيد الجماعي أن تظل مجموعة البيانات ديناميكية وقابلة للتطبيق في معالجة التهديد
المستمر لهجمات التصيد االحتيالي.
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
نتائج المحاكاة
مقارنة
خاتمة
تتناول هذه األطروحة القضية الحاسمة المتمثلة في اكتشاف التصيد االحتيالي باستخدام نهج جديد :شبكة GRUمحسنة باستخدام
خوارزمية . EPOالتصيد ،وهو أمر مهماألمن اإللكترونيالتهديد ،يتضمن رسائل البريد اإللكتروني والمواقع االحتيالية التي تسعى
للحصول على معلومات حساسة .تتضمن طريقتنا معالجة مسبقة شاملة للبيانات ،بما في ذلك التطبيع والتنظيف والخلط والتجزئة .تتفوق
شبكة GRUفي تصنيف الحوادث الحقيقية وحوادث التصيد االحتيالي نظًر ا لقدرتها على التقاط األنماط التسلسلية.المعلمة
المفرطةالتحسين مع EPOأدى إلى تحسين األداء .االختبار علىفيشتانكأسفرت مجموعة البيانات عن نتائج مبهرة ،حيث بلغت دقة
التدريب %97.94ودقة االختبار .% 96.20تؤكد هذه النتائج على قدرة الطريقة على اكتشاف سمات التصيد االحتيالي الدقيقة ،مما
يجعلها أداة قيمة في العالم الحقيقياألمن اإللكتروني.
عروض
مقدمة مجموع الناتج
المقترحة الطريقة نتائج التقييم المقترحة الطريقة
خاتمة مقدمة
اقتراحات
اقتراحات
. 1هندسة الميزات المحسنة :قم بتوسيع مساحة الميزات من خالل األساليب المتقدمة للكشف عن األنماط المعقدة في عمليات التصيد االحتيالي ،بما
في ذلك السمات السلوكية الخاصة بالمجال في رسائل البريد اإللكتروني وصفحات الويب ،الكتشاف أكثر شموًال.
. 2االكتشاف في الوقت الفعلي :قم بتكييف النهج الكتشاف التصيد االحتيالي في الوقت الفعلي من خالل تحسين بنية النموذج الستدالل أسرع،
. 3األساليب الهجينة :اجمع بين الطريقة المقترحة وأحدث التقنيات مثل أساليب المجموعة أو بنيات التعلم العميق أو النماذج القائمة على الرسم
البياني إلنشاء حل مختلط للكشف المعزز والموثوق عن التصيد االحتيالي ،مع االستفادة من نقاط القوة في المنهجيات المتعددة.