تفاصيل الوثيقة

نوع الوثيقة : رسالة جامعية 
عنوان الوثيقة :
تطبيق خوارزمية تحسين الحيتان و الخوارزمية الجينية لكشف المحتوى الغير مرغوب فيه في تويتر
APPLYING WHALE OPTIMIZATION AND GENETIC ALGORITHMS FOR SPAM DETECTION IN TWITTER
 
الموضوع : كلية الحاسبات وتقنية المعلومات 
لغة الوثيقة : العربية 
المستخلص : على مدى السنوات العشر الماضية ، أصبحت شبكات التواصل الاجتماعي عبر الإنترنت أكثر شيوعًا. يزيد استخدام مواقع التواصل الاجتماعي المختلفة مثل ( Facebook و Twitter و Instagram و Snapchat و Pinterest و LinkedIn ) من القدرة على نشر المعلومات من خلال شبكات التواصل الاجتماعي. كما أنه يسهل انتشار المحتوى العشوائي ويهدد معلومات المستخدم وخصوصيته. تم إجراء العديد من الدراسات البحثية للكشف عن المحتوى المزعج في شبكات التواصل الاجتماعي . في هذه الدراسات ، يعتمد الباحثون على عمليات التصنيف التي تستخدم عددًا كبيرًا من الميزات ، مما يتطلب وقتًا أطول للتنفيذ. يقترح هذا البحث أطروحة جديدة للكشف عن التغريدات المزعجة في تويتر باستخدام مجموعتي بيانات لغويتين مختلفتين (الإنجليزية والعربية). يستخدم النموذج المقترح طريقة تصنيف محسنة لاكتشاف المحتوى المزعج في التغريدات. لعملية التصنيف ، يتم استخدام ثلاث خوارزميات (Naïve Bayes, Logistic Regression ,Stochastic Gradient Descent). ثم يتم التحسين في تجربتين منفصلتين. في التجربة الأولى ، تم تطبيق خوارزمية Whale Optimization Algorithm. في الثانية ، يتم تطبيق الخوارزمية الجينية Genetic Algorithm. أسفرت تجارب البحث عن النتائج التالية: بالنسبة لمجموعة البيانات الإنجليزية ، كانت خوارزمية Naïve Bayes هي أفضل مصنف لنتائجها العالية قبل التحسين و بعد التحسين ، وتحسنت دقتها من 93.1٪ إلى 95.3٪ بعد التحسين. بالإضافة إلى ذلك ، انخفض عدد الميزات المطلوبة من 20000 إلى 3000. بالنسبة لمجموعة البيانات العربية ، كانت خوارزمية Logistic Regression أفضل مصنف قبل وبعد التحسين ، تحسنت دقتها من 89.5٪ إلى 91.1٪. على غرار مجموعة البيانات الإنجليزية ، انخفض عدد الميزات المطلوبة من 6689 إلى 2400. وأظهرت النتائج أنه بالنسبة لمجموعتي البيانات ، فإن Whale Optimization Algorithm عزز دقة عملية التصنيف ، وخفض عدد الميزات المطلوبة. وبالتالي ، يمكننا أن نستنتج أن تحسين عملية التصنيف باستخدام خوارزمية Whale Optimization Algorithm يحسن نموذج التصنيف ، مما يؤدي إلى توقع أسرع في الوقت الفعلي ووقت تنفيذ أقصر. بينما استخدام Genetic Algorithm لم يحسن نتيجة نموذج التصنيف للتجارب التي أجريت في هذا البحث. 
المشرف : د. غادة أحمد عامودي 
نوع الرسالة : رسالة ماجستير 
سنة النشر : 1442 هـ
2020 م
 
تاريخ الاضافة على الموقع : Saturday, December 12, 2020 

الباحثون

اسم الباحث (عربي)اسم الباحث (انجليزي)نوع الباحثالمرتبة العلميةالبريد الالكتروني
فاطمة محمد القحطانيAlqahtani, Fatimah Mohammedباحثماجستير 

الملفات

اسم الملفالنوعالوصف
 46821.pdf pdf 

الرجوع إلى صفحة الأبحاث