استخدام التعلم الآلي والتعلم العميق للتعرف الضوئي على الأحرف
ورقة علمية وصول مفتوح | متاح بتاريخ:25 نوفمبر, 2020 | آخر تعديل:25 نوفمبر, 2020
تشهد أدوات التعرف الضوئي على الأحرف ثورة هادئة حيث يدمج مقدمو البرامج الطموحون التعرف الضوئي على الأحرف مع التعلم الآلي والتعلم العميق. ولذلك، تقوم برامج التقاط البيانات وجمع المعلومات على الفور وفهم المحتوى. وهذا يعني في الممارسة العملية أنه يمكن لأدوات التعلم الآلي والتعلم العميق التحقق من الأخطاء بشكل مستقل عن المستخدم البشري مما يوفر إدارة فعالة للأخطاء.
وحتى الآن، ساهمت تقنية التعرف الضوئي على الأحرف في مساعدة أصحاب الأعمال على أتمتة معالجة مسألة التعامل مع المستندات المادية. وعندما يتعلق الأمر بالأشخاص الذين يعانون من قيود وظيفية، فإن الشخص الذي يعاني من إعاقة بصرية يستخدم في عملية التعلم تقنية التعرف الضوئي على الأحرف التي تقدمها مؤسسات مختلفة. ولا تزال برامج التعرف الضوئي على الأحرف مستخدمة اليوم لتحويل النص المكتوب بخط اليد أو المطبوع إلى نص مشفر آليًا بحيث يمكن استرجاعه على الكمبيوتر. كما تقوم برامج التعرف الضوئي على الأحرف بعمل نسخ من المستندات مثل الإيصالات وكشوف الحسابات المصرفية وجوازات السفر وأشكال أخرى من الوثائق التي تحتاج إلى إدارة.
يتم تنشيط التكنولوجيا وإحيائها من جديد من خلال إدخال الذكاء الاصطناعي والتعلم الآلي والتعلم العميق، حيث يعمل مطورو البرمجيات على حلول فعالة وترقية أجهزة التعرف الضوئي على الأحرف الحالية. وحتى الآن، فإن الخيار الوحيد لمستخدم تقنية التعرف الضوئي على الأحرف لزيادة موثوقية عمليات المسح هو قياس وتقييم نتائج العملية يدويًا. ومن خلال تقديم التعلم الآلي والتعلم العميق، ستجري الحلول التقييم تلقائيًا مع استخلاص الأفكار من النص وفهم معنى النص المحول، بمعنى آخر، يمكن للحلول معالجة محتوى الوثيقة بدقة أكبر.
يمكن قراءة النص الموجود في صورة تحتوي على نقاط بارزة من خلال التعلم العميق وأنظمة التعرف الضوئي على الأحرف القائمة على التعلم الآلي، مثل واجهة برمجة تطبيقات “جوجل فيجين” Google Vision، حتى لو كان هذا النص مكتوبًا بخط نحيف أو غريب أو مقلوب أو محجوب جزئيًا. لقد أصبح هذا الأمر ممكنًا من خلال خاصية التحليلات الاحتمالية التي تبين أنه من المحتمل أن تظهر الحروف عند النظر إليها في سياق المشهد. بينما يقدم التعلم الآلي نتائج رائدة في استخراج المعلومات وبيانات الاستلام والتحرر من القوالب، يساعد الفهم العميق في اكتساب رؤىً حول البيانات والخوارزميات المحولة للتعلم من التعليقات المستمرة الناتجة عن التصحيحات على البيانات المستخرجة لإنشاء نتائج أفضل على مدى الزمن.
لقد ساعد التعلم العميق وابتكار التعلم الآلي في التعرف الضوئي على الأحرف في التغلب على تحديات القراءة للأفراد الذين يعانون من عسر القراءة واضطراب فرط الحركة ونقص الانتباه ومتلازمة إرلين مع تمكين الأشخاص ذوي الإعاقة البصريًة من استخدام ملفات PDF “بي دي إف” المصورة عالية الدقة باستخدام تقنية تحويل النص إلى كلام واشتقاق المعنى من العبارات المحولة.
وعندما يتعلق الأمر باللغة العربية، فإن معدل دقة التعرف الضوئي على الاحرف منخفض للغاية، مما يجعل التكنولوجيا غير قابلة للاستخدام بشكل فعال على نطاق واسع. وبالنسبة للأشخاص ذوي الإعاقة، وبالذات الأشخاص ذوي الإعاقات البصرية، فإن هذا يعني قلة توافر المحتوى الرقمي القابل للنفاذ باللغة العربية. وعلاوةً على ذلك، فهذا يعني أن وسائل إنشاء مثل هذه المواد من خلال التعرف الضوئي على الأحرف غير متوفرة أيضًا.
ومن هذا المنطلق، عمل برنامج مدى للابتكار على مسألة الاستخدام وما يتعلق بها من تحديات وذلك من أجل تطوير تقنية التعرف الضوئي على الأحرف من خلال تقديم دعم محسّن للغة العربية مع مزايا رئيسية مثل تحسين النفاذ إلى المستندات الرقمية للأشخاص ذوي الإعاقة الناطقين باللغة العربية مع توفير دقة فائقة للتعرّف البصري على الأحرف للغة العربية والتي يمكن استخدامها عبر طرق متعددة. وسيسمح ذلك أيضًا بتحويل وإدارة وخصوصية البيانات الضخمة باللغة العربية.
تعدّ أدوات التعرف الضوئي على الأحرف المضمّنة في التعلم العميق والتعلم الآلي بالغة الأهمية وهي مقومات أساسية لموضوع أوسع وهو التحول الرقمي. ونظرًا لأنه يتم تبنّي التعلم العميق والتعلم الآلي على نطاق واسع باعتباره تقنية حديثة وثورية لها عمليات يدوية آلية، فقد أدى نموها إلى رفع الشركات الحديثة لتوقعاتها بشأن ما يمكن تحقيقه من خلال الأتمتة. فؤلئك الذين يستخدمون محركات تقنية التعرف الضوئي على الأحرف المدمجة مع التعلم العميق والتعلم الآلي للبحث عن الأخطاء والمعاني بدأوا في التفوق على محركات التعرف الضوئي على الأحرف التي تحتاج إلى التحكم من قبل المستخدمين البشريين.
يمثل هذا الأمر ثورةً للمستخدمين من ذوي القيود الوظيفية تسهل عملية الاستخدام في المدارس وأماكن العمل والمنازل من خلال توافر إعدادات مختلفة تسمح بتحسين التعليم وتمكين المستخدم من تولي المهام والدورات والمناصب الصعبة. وفي حين أنه قد لا تكون أدوات التعرف الضوئي على الأحرف القائمة على الذكاء الاصطناعي مرغوبةً مثل التقنيات التحويلية الأخرى، إلا أنه من المتوقع أن يكون لها تأثيرًا كبيرًا.