الملخص التنفيذي
تدرك شركة ستارويز أن NHC Innovation تسعى، من خلال مبادرة AI Gateway لعام 2025، إلى البناء على النجاحات الهامة التي تحققت في عام 2024، بهدف تعزيز وتوسيع استخدام الذكاء الاصطناعي لتحسين كفاءة عمليات الامتثال والتنظيم، تقليل الأعباء اليدوية، تمكين اتخاذ القرارات المستندة إلى البيانات، وفتح آفاق جديدة لحالات الاستخدام المبتكرة.
الأهداف الرئيسية
- تعزيز المحركات الحالية لمعالجة الصور واستخراج البيانات
- تطوير وحدات متقدمة للكشف عن المخالفات والنقاط الساخنة
- إنشاء بنية تحتية موحدة للبيانات تدعم مصادر متنوعة
- الاستفادة من الذكاء الاصطناعي التوليدي لتعزيز تفاعل المستخدم
قيمة مضافة
- حلول فعالة ودقيقة قابلة للتطوير والتوسع
- نقل المعرفة والخبرة إلى فريق NHC Innovation
- تطبيق أحدث تقنيات التعلم العميق والذكاء الاصطناعي
- منهجية رشيقة تضمن المرونة والتكيف مع المتطلبات المتغيرة
نحن ملتزمون بتقديم شراكة استراتيجية مع NHC Innovation، لا تقتصر على تسليم المشروع فحسب، بل تمتد لتشمل نقل المعرفة ودعم التطور المستقبلي لمنظومة الذكاء الاصطناعي لديكم.
الحل المقترح
تعزيز محركات معالجة الصور
محرك تشابه الصور (ISE 2.0)
نماذج تعلم عميق متقدمة (Siamese Networks, Transformers for Vision) لتحسين المطابقة الجزئية والتعرف على الكائنات. دعم مختلف تنسيقات وجودات الصور مع تحسين دقة النتائج.
محرك التعرف على لوحات الترخيص (ALPR)
نماذج OCR متخصصة لتنسيقات لوحات الترخيص السعودية بالعربية والإنجليزية. تحسين التعرف في الظروف الصعبة (الإضاءة المنخفضة، الزوايا الحادة) ودمج البيانات المكانية.
استخراج أرقام الهواتف
توسيع دعم OCR للخطوط المتنوعة والنصوص المكتوبة بخط اليد. إضافة حزم لغات للهجات المحلية وتطوير وحدات للتحقق من صحة الأرقام المستخرجة.
محركات الذكاء الاصطناعي المتقدمة
محرك تجميع الحالات الإضافي (CCE Plus)
تطبيق خوارزميات Graph Neural Networks وتقنيات التجميع الهرمي لتحليل العلاقات المعقدة بين الحالات وتجميعها حسب الموقع الجغرافي، نوع المخالفة، والفترة الزمنية.
كشف المخالفين الاحترافي (VDE-Pro NextGen)
دمج مصادر خارجية (أبراج الاتصالات، بيانات المرور، الطقس) كميزات سياقية لنماذج الكشف. تطوير قدرات NLP لفهم وتحديد المخالفات على مستوى البنود الفرعية.
كشف النقاط الساخنة في الوقت الفعلي
إعادة تصميم المحرك ليعمل على بنية تدفق بيانات. تطوير نماذج Time Series Forecasting للتنبؤ بالنقاط الساخنة المستقبلية بناءً على البيانات التاريخية والعوامل الخارجية.
تكامل وجودة البيانات
بحيرة البيانات الموحدة (Unified Data Lake)
تصميم وتنفيذ بحيرة بيانات حديثة مع طبقات منظمة (Bronze, Silver, Gold) لتسهيل الوصول والاستخدام. تطوير خطوط أنابيب ETL/ELT قوية لدمج البيانات من مصادر متنوعة.
حوكمة البيانات المحسنة
تطبيق سياسات صارمة للتحكم في الوصول المستند إلى الأدوار، وتشفير البيانات الحساسة. إعداد أدوات لمراقبة وتدقيق استخدام البيانات وتنفيذ حلول لتتبع نسب البيانات.
الذكاء الاصطناعي التوليدي
MOMRAH Document AI
استخدام تقنيات Retrieval-Augmented Generation لتمكين Q&A عبر مستندات متعددة مع استشهادات دقيقة. ضبط نماذج LLMs لمهام التلخيص المتخصصة وتطوير آلية للتغذية الراجعة.
MOMRAH Chatbot
دمج الشات بوت مع بحيرة البيانات والأنظمة الأخرى للوصول إلى معلومات شاملة. تطوير محرك توصيات يستخدم بيانات المستخدم والسياق لاقتراح الإجراءات التالية.
تصميم الحل والبنية التقنية
البنية التقنية المقترحة
التقنيات المقترحة
البنية التحتية والسحابة
- Azure / AWS / GCP (مرن حسب تفضيلات NHC)
- Kubernetes (AKS, EKS, GKE) للحاويات وإدارة التطبيقات
- Prometheus / Grafana / ELK Stack للمراقبة
البيانات والتخزين
- Azure Data Lake Storage / AWS S3 + Delta Lake
- Azure Data Factory / AWS Glue / Databricks
- Neo4j / Azure Cosmos DB (Graph Database)
الذكاء الاصطناعي والتعلم الآلي
- TensorFlow / PyTorch / scikit-learn
- Hugging Face Transformers / spaCy / NLTK
- Azure OpenAI Service / AWS Bedrock / Fine-tuned LLMs
المميزات التنافسية والمتطلبات
المميزات التنافسية لشركة ستارويز
خبرة مثبتة في الذكاء الاصطناعي
سجل حافل في تطوير ونشر حلول معالجة الصور، NLP، التحليلات التنبؤية، والتعلم العميق في قطاعات متنوعة.
كفاءة في هندسة البيانات الضخمة
خبرة واسعة في بناء وإدارة بحيرات بيانات قابلة للتطوير وبنى تحتية سحابية قوية للتعامل مع كميات هائلة من البيانات.
منهجية رشيقة (Agile)
نعتمد منهجيات تطوير مرنة تسمح بالتسليم التدريجي، والحصول على التغذية الراجعة المستمرة، والتكيف السريع مع أي تغييرات.
فريق عمل ذو خبرة عالية
يضم فريقنا مهندسي بيانات، علماء بيانات، مهندسي تعلم آلي، ومهندسي برمجيات ذوي خبرة عالية.
المتطلبات الرئيسية
معالجة الصور
دعم تنسيقات متعددة، مطابقة جزئية، التعرف على لوحات متنوعة، استخراج أرقام من مستندات مختلفة.
الكشف والتجميع
تجميع الحالات المتشابهة، تحديد النقاط الساخنة، كشف المخالفات على مستوى البنود الفرعية.
تكامل البيانات
دمج بيانات من مصادر متعددة (إيجار، عدادات المياه، إعلانات، أعمدة اتصالات) في مستودع موحد.
الذكاء الاصطناعي التوليدي
معالجة مستندات متعددة، تلخيص محتوى، دعم متعدد اللغات، توصيات استباقية للمستخدمين.
قابلية التوسع والأداء
قدرة على التعامل مع زيادة حجم البيانات ومعدلات المعالجة، زمن استجابة سريع للعمليات الحرجة.
التوفر والموثوقية
ضمان نسبة توفر عالية للخدمات الحيوية، دقة النتائج ومعالجة الأخطاء.
الأمان وحوكمة البيانات
تطبيق أفضل ممارسات الأمان، حماية ضد التهديدات، الامتثال لسياسات أمن البيانات.
الصيانة وقابلية المراقبة
تصميم معياري، كود نظيف وموثق، لوحات معلومات لمراقبة أداء وصحة النظام.
مقترحات إضافية لتعزيز الحل
لوحات معلومات تحليلية متقدمة
لوحات معلومات تفاعلية توفر رؤى أعمق حول اتجاهات الامتثال، فعالية الإنفاذ، وتوزيع المخالفات.
تقنيات تفسير الذكاء الاصطناعي (XAI)
تقنيات لشرح مخرجات النماذج المعقدة، مما يزيد الثقة في القرارات ويدعم عمليات التدقيق.
نمذجة المخاطر الاستباقية
نماذج لتقييم مستوى المخاطر المرتبطة بكيانات معينة بناءً على تاريخ الامتثال والبيانات الخارجية.
المخاطر واستراتيجيات التخفيف
| المخاطر المحتملة | استراتيجية التخفيف |
|---|---|
| تحديات جودة وتوفر البيانات | تحليل استكشافي مبكر، بناء خطوط أنابيب قوية للتنقية، مؤشرات جودة للبيانات |
| عدم تحقيق دقة النماذج المستهدفة | تجربة معماريات متعددة، هندسة ميزات دقيقة، جمع بيانات إضافية، مراقبة مستمرة |
| تعقيدات التكامل مع الأنظمة القائمة | واجهات برمجة تطبيقات واضحة، اختبارات تكامل مبكرة، فريق مخصص للتكامل |
| قضايا أمن البيانات والخصوصية | مبدأ "الأمان بالتصميم"، مراجعات أمنية دورية، تشفير وضوابط وصول قوية |
خطة المشروع والجدول الزمني
الجدول الزمني للمشروع (12 شهرًا)
ملاحظة: بعض المراحل (3, 4, 5) قد تتداخل لتسريع عملية التسليم.
الأسئلة والتوضيحات المطلوبة
مقاييس الأداء المستهدفة
هل هناك مؤشرات أداء رئيسية (KPIs) أو أهداف محددة للدقة والسرعة لكل محرك من محركات الذكاء الاصطناعي؟
حجم البيانات الحالي والمتوقع
ما هو الحجم التقريبي للبيانات الحالية (صور، مستندات، بيانات منظمة) ومعدل النمو المتوقع خلال السنوات القادمة؟
البنية التحتية الحالية
ما هي منصة السحابة المفضلة أو المستخدمة حاليًا؟ هل هناك أدوات أو تقنيات محددة يجب أن نأخذها في الاعتبار؟
آليات الوصول للبيانات الخارجية
ما هي آليات الوصول المتاحة لبيانات الجهات الخارجية (Ejar, NWC, Ads, Telecom, Balady)؟ هل هي APIs، تفريغ بيانات، أم طرق أخرى؟
الافتراضات الأساسية
توفر الوصول الموثوق وفي الوقت المناسب إلى جميع مصادر البيانات المطلوبة مع الوثائق اللازمة.
توفر ممثلين من NHC و MOMAH للمشاركة في ورش العمل، تقديم التغذية الراجعة، وإجراء اختبارات القبول.
جودة البيانات في المصادر الحالية مقبولة أو وجود استعداد لمعالجتها كجزء من المشروع.
توفر البنية التحتية السحابية اللازمة أو الميزانية المخصصة لها.
تعريف واضح لمعايير القبول لكل مكون ومرحلة من مراحل المشروع.
عدم وجود تغييرات جوهرية في نطاق العمل بعد مرحلة التخطيط دون المرور بعملية إدارة تغيير رسمية.