مداخلة دور الذكاء الاصطناعي في رقمنة التراث الوثائقي والمخطوطات التاريخية: قراءة في ضوء المخطوطات الجزائرية ومخطوطات أدرار

دور الذكاء الاصطناعي في رقمنة التراث الوثائقي والمخطوطات التاريخية: قراءة في ضوء المخطوطات الجزائرية ومخطوطات أدرار
اعداد الباحث حسوني محمد عبد الغني

مقدمة

لم تعد رقمنة المخطوطات اليوم مجرد عملية تصوير إلكتروني تحفظ الأصل من التداول المباشر، بل أصبحت جزءًا من مشروع أوسع لإعادة بناء العلاقة بين الوثيقة التاريخية والباحث والمؤسسة الحافظة. ففي البيئة الرقمية الجديدة، لا يكفي أن تُصوَّر المخطوطة، بل ينبغي أن تُقرأ، وتُوصف، وتُفهرس، وتُربط بغيرها، وتُتاح ضمن نظم بحث ذكية تسمح باسترجاعها وتحليلها. وهنا بالذات يتدخل الذكاء الاصطناعي بوصفه أداة قادرة على نقل الرقمنة من مستوى الحفظ السلبي إلى مستوى المعالجة الذكية. غير أن هذا التحول لا يخلو من إشكال، لأن الوثيقة التراثية ليست مادة معلوماتية محضة، بل كيان مادي ورمزي وتاريخي، وأي تدخل آلي في تمثيلها أو قراءتها أو وصفها يثير أسئلة تتعلق بالثقة، والأصالة، والدقة، وحدود سلطة الخوارزمية. وقد نبّهت اليونسكو صراحة إلى أن الاعتماد السريع وغير المتبصر على الذكاء الاصطناعي قد يمس موثوقية التراث الوثائقي نفسه.

وتتأكد أهمية هذا الموضوع أكثر في الجزائر، لأن البلاد تملك رصيدًا معتبرًا من المخطوطات العربية والإسلامية، خصوصًا في الجنوب الغربي، حيث تمثل توات وأدرار فضاءً مركزيًا في خريطة الخزائن الخاصة والعائلية والزوايا والبيوت العلمية. كما أن هذا الرصيد لم يبق خارج الاهتمام المؤسسي؛ إذ توجد بأدرار مؤسسات ومشاريع متخصصة، منها المركز الوطني للمخطوطات، والبوابة الجزائرية للمخطوطات، ودراسات علمية كثيرة تناولت الجرد، والفهرسة، والخزائن، والرقمنة، والتثمين الرقمي للمخطوطات المحلية. وهذا ما يجعل أدرار مثالًا مناسبًا جدًا لإبراز ما يمكن أن يقدمه الذكاء الاصطناعي فعليًا لمشروعات الرقمنة الذكية.

أولًا: من الرقمنة التقليدية إلى الرقمنة الذكية

الرقمنة التقليدية كانت تنحصر غالبًا في إنتاج نسخة رقمية من الأصل، بغرض الحفظ أو التيسير على الباحثين. أما الرقمنة الذكية، فهي عملية متعددة المستويات: تبدأ بالتصوير، ثم تمر بتحسين الصورة، والتعرف على الحروف أو الكتابة اليدوية، واستخراج البيانات الوصفية، والتصنيف الموضوعي، وربط الوثائق بسياقاتها المعرفية، وانتهاءً ببناء واجهات اكتشاف واسترجاع أكثر تقدمًا. وقد أبرزت فعاليات IFLA حول الذكاء الاصطناعي ومستقبل الحفظ الرقمي أن هذه الأدوات يمكن أن تساعد المكتبات والأرشيفات في تنظيم المجموعات الضخمة، وتحسين الاكتشاف، وتعزيز الإتاحة والوصول. كما أن مشاريع بحثية دولية، مثل InterPARES Trust AI، باتت تدرس خصيصًا “الرقمنة المدعومة بالذكاء الاصطناعي” للتراث الوثائقي، ما يدل على أن الأمر لم يعد فكرة نظرية بل مجالًا بحثيًا وتطبيقيًا قائمًا بذاته.

لكن هذه الرقمنة الذكية لا تُقاس بنجاحها التقني وحده. فكما تشير دراسة Jaillant حول تطبيق الذكاء الاصطناعي على الأرشيفات الرقمية، فإن المسألة ترتبط أيضًا بالثقة، والتعاون بين المختصين، ووضوح الأدوار بين المبدع المؤسسي والمهني الأرشيفي والمستفيد النهائي. وهذا مهم جدًا في المخطوطات، لأن الخطأ هنا لا يفضي فقط إلى نتيجة تقنية ضعيفة، بل قد ينتج وصفًا غير دقيق، أو قراءة خاطئة، أو علاقة زائفة بين وثائق لا يجمعها سياق حقيقي.

ثانيًا: ما الذي يتيحه الذكاء الاصطناعي فعليًا للمخطوطات؟

أول ما يتيحه الذكاء الاصطناعي هو تحسين الصور الرقمية. كثير من المخطوطات القديمة تعاني من بهتان الحبر، أو تشقق الورق، أو تداخل الحواشي، أو ضعف الإضاءة في الصور القديمة. وتسمح تقنيات المعالجة المدعومة بالتعلم الآلي برفع التباين، وتنظيف الخلفية، وتقليل الضجيج، وتصحيح الميل، وإبراز النصوص الباهتة. وهذه الخطوة ليست شكلية، لأنها تمثل الأساس الذي تُبنى عليه كل العمليات اللاحقة من قراءة ووصف وفهرسة. وقد تناولت أدبيات حديثة، منها أعمال منشورة في MDPI، دور النماذج المتقدمة في رقمنة المخطوطات التاريخية، لا سيما عبر التحسينات المسبقة والتعرف اللاحق على النصوص.

وثاني ما يتيحه هو التعرف على الكتابة اليدوية Handwritten Text Recognition. وهذا من أهم مجالات التقدم اليوم، لأن المخطوط لا يكفي أن يكون صورة قابلة للعرض؛ بل القيمة العلمية الكبرى تظهر حين يتحول إلى نص قابل للبحث أو إلى تمثيل نصي أولي يساعد في التحقيق والفهرسة. وقد أشارت الأدبيات الحديثة إلى أدوات مثل Transkribus وغيرها بوصفها منصات تُدرَّب على عينات خطية خاصة وتستطيع تحسين أداء التعرف على أنماط الكتابة اليدوية. غير أن هذه الفائدة تبقى نسبية في المخطوطات العربية القديمة بسبب تنوع الخطوط، وكثرة الاختصارات، وتشابك الحواشي، وتفاوت جودة النسخ. ولهذا تظل هذه التقنيات أداة مساعدة لا بديلًا عن القراءة العلمية البشرية.

وثالث ما يتيحه هو إنتاج البيانات الوصفية والتصنيف الذكي. إذ يمكن للذكاء الاصطناعي أن يقترح عنوانًا أو موضوعًا أو أسماء أعلام أو أماكن أو كلمات مفتاحية أو حتى مجموعات موضوعية للمخطوطات. وهذا مهم جدًا عندما تكون المؤسسة أمام آلاف المواد التي يصعب فهرستها يدويًا بالسرعة الكافية. والبوابة الجزائرية للمخطوطات نفسها تُظهر وجود فهرس واسع وخزائن متعددة، وهو ما يجعل استخدام أدوات مساعدة في الضبط والوصف أمرًا ذا جدوى كبيرة، بشرط أن يخضع للمراجعة البشرية.

ورابع ما يتيحه هو تحسين الاكتشاف والوصول. فالمخطوط المرقمن رقمنة ذكية لا يبقى مجرد صورة في قاعدة بيانات، بل يصبح جزءًا من بيئة بحثية يمكن فيها الربط بين المؤلفين، والموضوعات، والخزائن، والمناطق، والأزمنة، والأنواع. وهذا مفيد جدًا للباحثين في التاريخ، والفقه، واللغة، وعلم المخطوط، والأرشيف، لأنه يتيح رؤية أوسع للرصيد بدل التشتت بين خزائن وملفات وصور منفصلة. وقد أكدت IFLA أن الذكاء الاصطناعي يمكن أن يحسّن الاكتشاف والوصول في المكتبات والأرشيفات، خاصة حين يُدمج في استراتيجيات مؤسساتية واضحة.

ثالثًا: لماذا تُعد الجزائر، وأدرار خصوصًا، حالة تطبيقية ممتازة؟

الجزائر تملك سياقًا غنيًا جدًا للمخطوطات، لكن أدرار تُعد حالة مميزة لأسباب متراكبة. أولًا، لأن منطقة توات اشتهرت تاريخيًا بكثرة الخزائن الخاصة والعائلية والعلمية؛ وقد وصفتها دراسات جزائرية بأنها من أهم البيئات الحافظة للمخطوطات في الجنوب الغربي، بل أشارت بعض الأعمال إلى وجود أكثر من سبعين خزانة في المنطقة. ثانيًا، لأن هناك دراسات كوديكولوجية ووصفية منشورة عن مخطوطات توات وأدرار، ما يعني أن الرصيد ليس مجهولًا تمامًا، بل توجد حوله معرفة علمية أولية يمكن البناء عليها. وثالثًا، لأن البنية المؤسسية موجودة: المركز الوطني للمخطوطات بأدرار، ومخبر المخطوطات الجزائرية في إفريقيا، والبوابة الجزائرية للمخطوطات.

كما أن الأدبيات الجزائرية نفسها تؤكد أن التحول نحو الرقمنة ليس طارئًا في هذا المجال. فهناك دراسات عن المكتبة الرقمية للمخطوطات بالمركز الوطني للمخطوطات بأدرار، وأخرى عن التثمين الرقمي للتراث المخطوط عبر البوابات الإلكترونية، وأخرى عن السياسة التجميعية للمخطوطات وقضايا الملكية الفكرية، بل وأخرى عن مدى جاهزية مراكز الأرشيف لرقمنة التراث الوثائقي. وهذا يعني أن النقاش في الجزائر لم يعد محصورًا في الجرد والحفظ التقليدي، بل دخل فعلًا مرحلة التفكير في الرقمنة، والوصول، والتثمين، والملكية، وهي كلها نقاط يلامسها الذكاء الاصطناعي مباشرة.

رابعًا: إسقاط مباشر على مخطوطات أدرار وتوات

إذا نزلنا من المستوى النظري إلى الحالة الأدرارية، أمكن تصور أدوار عملية جدًا للذكاء الاصطناعي:

أولًا، في توحيد المعالجة الرقمية لمخطوطات الخزائن المتفرقة في توات. فوجود خزائن خاصة متعددة يعني اختلاف جودة الصور، واختلاف طرق الوصف، وتفاوت إمكانية الوصول. هنا يمكن للذكاء الاصطناعي أن يوفّر طبقة تقنية موحدة: تحسين الصور، واستخراج بيانات وصفية أولية، وربط المخطوطات موضوعيًا، واقتراح فهارس أولية للخزائن. وهذا يفيد جدًا في الانتقال من التشتت المحلي إلى قاعدة معرفية جهوية متماسكة.

ثانيًا، في خدمة الفهرسة العلمية. الدراسات الجزائرية حول مخطوطات أدرار انتقلت فعلًا من الحديث عن الجرد والوصف الوصفي إلى الحديث عن الفهرسة العلمية، وهو تطور مهم. الذكاء الاصطناعي هنا لا يحل محل المفهرس، لكنه قد يساعده في اقتراح العنوان، والمؤلف المحتمل، والموضوع، والكلمات المفتاحية، والتواريخ، والمواضع المتكررة. وهذا يخفف الجهد الأولي ويجعل الفهرسة العلمية أسرع وأكثر اتساقًا، خاصة في حالة الأرصدة الكبيرة.

ثالثًا، في إحياء المخطوط للبحث الجامعي المحلي. جامعة أدرار تمتلك بوابة للمخطوطات ومخبرًا متخصصًا؛ وإذا أُدمجت أدوات ذكاء اصطناعي مدروسة داخل هذا الفضاء، فقد يصبح بالإمكان بناء مشاريع جامعية في: التعرف على الخطوط المحلية، وفهرسة الخزائن، وربط المؤلفات الفقهية واللغوية والتاريخية، وتحويل جزء من الصور إلى نصوص قابلة للبحث، وإعداد خرائط معرفية للمؤلفين والشيوخ والخزائن في توات. بهذا المعنى، لا يكون الذكاء الاصطناعي مجرد وسيلة تقنية، بل أداة لتحويل الرصيد المحلي إلى مختبر بحث حي.

رابعًا، في التثمين الثقافي والتعليمي. فالمخطوط المرقمن رقمنة ذكية يمكن أن يُعرض في بوابات عامة، ومعارض رقمية، وبرامج تعليمية، ومحتوى ثقافي موجّه للجمهور، لا للباحثين فقط. وتجارب اليونسكو في السودان وأوكرانيا ومالي تظهر أن رقمنة التراث الوثائقي لا تُفهم فقط بوصفها حفظًا، بل أيضًا بوصفها إعادة إتاحة للذاكرة الثقافية ضمن شروط آمنة. هذا مهم جدًا لأدرار، لأن المخطوطات ليست مجرد مواد علمية، بل أيضًا جزء من الهوية المحلية والذاكرة الجماعية.

خامسًا: ما الذي يجب الحذر منه

رغم هذه الإمكانات، توجد حدود واضحة يجب التأكيد عليها.

أولها أن الذكاء الاصطناعي لا يقرأ المخطوط قراءة محقِّق أو كوديكولوجي. فقد يخطئ في التمييز بين المتن والحاشية، أو بين التملك والوقف، أو بين اسم المؤلف والناسخ، أو بين العنوان الحقيقي والعنوان المكتوب على الغلاف المتأخر. وهذا الخطر يزداد في المخطوطات الصحراوية والعائلية بسبب تنوع الخطوط وخصوصية بعض الصيغ المحلية. لذا فكل استعمال للذكاء الاصطناعي في أدرار يجب أن يكون تحت مراجعة بشرية صارمة.

ثانيها أن النسخة الرقمية لا تعوّض الأصل المادي. فالمخطوط ليس نصًا فقط، بل مادة وحبر وخط وتوريق وتجليد وآثار استعمال، وهي عناصر لا تنقلها الرقمنة بالكامل. لذلك ينبغي أن يكون الذكاء الاصطناعي خادمًا للحفظ لا مبررًا للاستغناء عن العناية بالأصول. وهذا مهم جدًا في الخزائن الخاصة بتوات، حيث ترتبط قيمة المخطوط أحيانًا بسياقه العائلي أو الوقفي أو التاريخي.

ثالثها أن مسألة الثقة المجتمعية والملكية مركزية في أدرار. فالكثير من المخطوطات يوجد في خزائن عائلية أو زوايا، وأصحابها قد يكونون متحفظين تجاه التصوير أو النشر أو الإتاحة الرقمية. بعض الدراسات الجزائرية الحديثة تناولت أصلًا سياسة تجميع المخطوطات وقضايا الملكية الفكرية، ما يدل على أن المسألة ليست تقنية فقط، بل اجتماعية وقانونية أيضًا. ومن ثم فإن أي مشروع رقمنة ذكية في أدرار ينبغي أن يُبنى على شراكة وثقة وإطار قانوني واضح.

سادسًا: تصور عملي أعمق لأدرار

إذا أردنا تصور مشروع جاد في أدرار، فالأفضل ألا نبدأ من “شراء أدوات ذكاء اصطناعي”، بل من بناء مسار مؤسسي تدريجي:

تبدأ المرحلة الأولى بـ حصر الخزائن والمجموعات ذات الأولوية: الأقدم، والأكثر هشاشة، والأعلى قيمة علمية، والأكثر طلبًا بحثيًا.
ثم المرحلة الثانية بـ بروتوكول تصوير موحد يضمن جودة كافية تتيح المعالجة الآلية اللاحقة.
ثم المرحلة الثالثة بـ معالجة ذكية مساعدة: تحسين الصور، وتقسيم الصفحات، والتعرف الأولي على النص، واقتراح بيانات وصفية.
ثم المرحلة الرابعة بـ مراجعة بشرية متعددة التخصصات: مفهرس، مختص مخطوطات، مؤرخ، وربما مختص خط عربي.
ثم المرحلة الخامسة بـ نشر تدريجي مدروس عبر البوابة الجزائرية للمخطوطات، مع مستويات مختلفة من الإتاحة بحسب حالة المخطوط وحقوقه ووضعه.
ثم المرحلة السادسة بـ استعمال الرصيد في البحث والتكوين الجامعي داخل جامعة أدرار وغيرها.

هذا النموذج يجعل الذكاء الاصطناعي في موضعه الصحيح: مسرّع ومساعد ومنظّم، لا صاحب قرار في وصف التراث أو تفسيره.

خاتمة

إن تعميق البحث في هذا الموضوع يكشف بوضوح أن أدرار ليست مجرد مثال فرعي، بل يمكن أن تكون مختبرًا وطنيًا لرقمنة المخطوطات الجزائرية رقمنة ذكية. فهي تجمع بين كثافة الرصيد، ووجود خزائن تاريخية في توات، وبنية مؤسساتية وعلمية، ومبادرات رقمية قائمة، وأدبيات بحثية متراكمة. كما أن الذكاء الاصطناعي، إذا أُدخل إليها بوعي، قد يفتح مسارات حقيقية: من تحسين الصور، إلى المساعدة في القراءة والفهرسة، إلى بناء بوابات بحث واستكشاف، إلى تثمين التراث علميًا وثقافيًا.

لكن التعمق نفسه يكشف أيضًا أن الخطر قائم إذا ساد منطق الانبهار التقني: فالمخطوط ليس ملفًا، والرقمنة ليست غاية، والخوارزمية ليست محققًا. ولهذا فإن النجاح الحقيقي في الجزائر، وفي أدرار خصوصًا، لن يكون في “رقمنة أكبر عدد ممكن” فقط، بل في إنتاج تراث رقمي موثوق، قابل للبحث، قابل للتحقق، ومحترِم للأصل المادي والسياق الاجتماعي والعلمي للمخطوط. وهذا هو المعنى العميق لأي استعمال رشيد للذكاء الاصطناعي في مجال المخطوطات.

مصادر

منظمة الأمم المتحدة للتربية والعلم والثقافة، Artificial intelligence and documentary heritage.
IFLA، Artificial Intelligence and the Future of Digital Preservation.
InterPARES Trust AI، Report on the Survey “Digitization and Artificial Intelligence...”.
لورا جايان، Applying AI to digital archives: trust, collaboration and shared authority.
دنداني زبير، عبد الله رزوقي، خزائن المخطوطات في منطقة توات (ولاية أدرار) أهميتها وأبعادها التاريخية.
مولاي عبد القادر، نحو إنشاء المكتبة الرقمية للمخطوطات بالمركز الوطني للمخطوطات.
من المخطوطات الورقية بالخزانات الشعبية إلى المكتبة الرقمية للمخطوطات بالمركز الوطني للمخطوطات أدرار.
مخطوطات أدرار: من الجرد والفهرسة الوصفية إلى الفهرسة العلمية.
التثمين الرقمي للتراث المخطوط من خلال البوابات الإلكترونية: البوابة الجزائرية للمخطوطات بأدرار أنموذجًا.
المخطوطات الجزائرية بين جدلية الرقمنة وحفظ التراث الثقافي.
مساهمة المركز الوطني للمخطوطات بأدرار في رقمنة التراث المخطوط
 

Ikram Boualem

عضو نشيط
المشاركات
33
مستوى التفاعل
3
النقاط
8
تقنيات التعرف البصري على الحروف (OCR) وأثرها في معالجة الوثائق التاريخية

تُعدّ تقنيات التعرف البصري على الحروف من أهم الأدوات التي أحدثت تحولًا نوعيًا في معالجة الوثائق التاريخية والمخطوطات، لأنها تسمح بتحويل النصوص المصوَّرة إلى نصوص رقمية قابلة للبحث والفهرسة والمعالجة. وإذا كانت الرقمنة التقليدية تكتفي بإنتاج نسخة رقمية من الوثيقة، فإن OCR يضيف مستوىً جديدًا من القيمة العلمية، يتمثل في إمكانية استخراج النص، وربطه ببيانات وصفية، وتمكين الباحث من البحث داخله بدل الاكتفاء بمشاهدته بصريًا. وقد أظهرت مسوح دولية سابقة دعمتها اليونسكو أن أكثر من نصف المؤسسات المستجوبة كانت تستخدم برمجيات OCR في معالجة النصوص، وهو ما يكشف مبكرًا عن المكانة المركزية لهذه التقنية في مشاريع الرقمنة.

غير أن الحديث عن OCR في الوثائق التاريخية، وخاصة العربية، لا يمكن أن يكون حديثًا مبسطًا أو عامًا، لأن الأمر يرتبط بتمييز أساسي بين النصوص المطبوعة والنصوص اليدوية. فالتعرف على النص المطبوع، رغم ما يطرحه من مشكلات عند رداءة النسخة أو قدم الحامل، يظل أسهل نسبيًا من التعرّف على المخطوطات. أما المخطوطات العربية التاريخية، فتخضع غالبًا إلى ما يعرف اليوم بـ HTR، أي التعرف على النصوص اليدوية، وهو مجال أكثر تعقيدًا بسبب الطبيعة المتصلة للخط العربي، وتعدد أشكال الحروف بحسب الموقع، وكثرة الاختصارات، والتصحيفات، والحواشي، وتفاوت أنماط الخط بين الناسخين والفترات. ولهذا تؤكد الأبحاث الحديثة أن النصوص العربية التاريخية تظل من أصعب البيئات على أنظمة OCR/HTR بسبب تعقيد الخط العربي وندرة البيانات التدريبية مقارنة باللغات اللاتينية.

وتظهر أهمية هذه التقنيات في الوثائق التاريخية على مستويات متعددة. أول هذه المستويات هو إتاحة البحث النصي؛ فالمخطوط أو الوثيقة التاريخية المرقمنة على شكل صورة فقط تظل صعبة الاستغلال، لأن الباحث يحتاج إلى قراءة بصرية طويلة لكل صفحة. أما إذا أمكن تحويل محتواها إلى نص، ولو بدرجة أولية قابلة للمراجعة، فإن ذلك يفتح الباب أمام البحث بالكلمات المفتاحية، وتتبع المصطلحات، واستخراج الأعلام والأماكن، وبناء فهارس موضوعية، وربط الوثائق المتقاربة. وثانيها هو دعم الفهرسة والوصف العلمي، لأن النص المستخرج يساعد المفهرس على اقتراح العنوان، والتعرف على المؤلف، والموضوع، والبدايات والخواتيم، وبعض الخصائص الببليوغرافية. وثالثها هو توسيع الوصول، لأن النص القابل للبحث يجعل الرصيد التاريخي أكثر نفعًا للباحثين، بل وأكثر قابلية للاندماج في المستودعات الرقمية والبوابات البحثية.

وتؤكد الأدبيات الحديثة أن التطور في هذا المجال لم يعد قائمًا فقط على خوارزميات OCR التقليدية، بل أصبح يعتمد بدرجة كبيرة على التعلم العميق والنماذج التحويلية. فقد عرضت دراسة HATFormer لسنة 2024/2025 نموذجًا مخصصًا للتعرّف على النصوص العربية التاريخية المكتوبة يدويًا، وبيّنت أن النص العربي التاريخي يمثل تحديًا خاصًا بسبب تنوع أنماط الكتابة وقلة مجموعات البيانات المتاحة. كما عرضت أعمال أخرى مثل Muharaf وQARI-OCR وInvizo اتجاهًا متصاعدًا نحو تطوير حلول أكثر تخصصًا للنصوص العربية المطبوعة واليدوية، بما يدل على أن OCR العربي لم يعد مجالًا هامشيًا، بل أصبح ورشًا بحثيًا نشطًا يرتبط مباشرة برقمنة التراث العربي والإسلامي.

ومع ذلك، لا ينبغي النظر إلى OCR بوصفه حلًا سحريًا. فحتى أفضل النماذج الحديثة ما تزال تواجه صعوبات جدية مع المخطوطات التاريخية التي تتسم بضعف جودة الصورة، أو تآكل الورق، أو تشابك المتون بالحواشي، أو اختلاف الخطوط والاختصارات، أو وجود تعليقات وقف وتملك وتصحيحات ناسخين. ولهذا تذهب الأدبيات المتخصصة إلى أن الفائدة الحقيقية من OCR/HTR في المخطوطات تكمن في كونه أداة مساعدة تُنتج نصًا أوليًا أو قراءة شبه آلية، لا نصًا نهائيًا معتمدًا دون مراجعة. وقد أشارت ورقة منشورة سنة 2025 حول رقمنة المخطوطات التاريخية إلى أن منصات مثل Transkribus تفيد جدًا في هذا السياق، لكنها تعتمد على تدريب نماذج على عينات من الخط نفسه، ما يعني أن الأداء يتحسن كلما خُصِّص النموذج لبيئة خطية معيّنة.

وعند إسقاط ذلك على الوثائق التاريخية والمخطوطات الجزائرية، وبالأخص على مخطوطات أدرار وتوات، تبدو أهمية OCR/HTR أوضح. فهذه المنطقة تزخر بخزائن مخطوطات خاصة وعائلية وعلمية، وقد أكدت دراسات جزائرية أهمية خزائن توات وأبعادها التاريخية والعلمية. غير أن جزءًا من الإشكال لا يتمثل فقط في وجود المخطوط أو تصويره، بل في جعل محتواه قابلًا للبحث والاستغلال العلمي. وهنا يمكن لتقنيات OCR/HTR أن تلعب دورًا مهمًا في تحويل الصور الرقمية لمخطوطات أدرار إلى نصوص أولية قابلة للمراجعة، بما يخدم الفهرسة، والتحقيق، والوصف، وبناء قواعد بيانات للمؤلفين والموضوعات والألفاظ المحلية والفقهية. غير أن هذه الاستفادة تتطلب تدريب النماذج على عينات من الخطوط المحلية، لأن الخطوط المتداولة في مخطوطات توات قد تحمل خصائص لا تستجيب لها النماذج العامة بصورة كافية. ثر OCR في معالجة الوثائق التاريخية يمكن تلخيصه في أربعة اتجاهات أساسية. الأول: نقل الوثيقة من الحفظ الصوري إلى الاستغلال النصي. الثاني: تسريع الفهرسة والوصف والتحقيق. الثالث: توسيع فرص البحث الموضوعي داخل الرصيد التاريخي. الرابع: تعزيز الإتاحة الرقمية للمستفيدين والباحثين. لكن هذه الآثار الإيجابية لا تتحقق إلا إذا جرى التعامل مع OCR بوصفه جزءًا من منظومة أوسع تضم التصوير الجيد، والمعالجة المسبقة للصورة، والمراجعة البشرية، والتوصيف العلمي، والحفظ المادي للأصل. ولهذا فإن الذكاء الاصطناعي، ومنه OCR، لا ينبغي أن يُنظر إليه كبديل عن الخبير في المخطوط، بل كوسيط تقني يختصر بعض مراحل العمل ويزيد من كفاءتها. ة بأدرار
وفي حالة أدرار، يمكن أن يشكل إدماج OCR/HTR داخل مشاريع المركز الوطني للمخطوطات والبوابة الجزائرية للمخطوطات خطوة استراتيجية، خاصة إذا وُجِّه إلى مخطوطات الخزائن الأكثر استعمالًا أو الأكثر عرضة للهشاشة. فبدل الاكتفاء بنشر الصور، يمكن إنشاء مسار عمل يبدأ بالتصوير عالي الجودة، ثم تحسين الصورة، ثم استخراج نص أولي آلي، ثم مراجعته من طرف المختصين، ثم ربطه ببيانات وصفية داخل البوابة. وبهذا يتحول مخطوط أدرار من مادة مصورة فقط إلى مادة قابلة للبحث والدراسة والاستثمار العلمي داخل الجامعة وخارجها. ل الخطة
إذا أردت إدراجها كمطلب أو محور فرعي داخل المداخلة، يمكن أن تكون بهذا العنوان:

تقنيات التعرف البصري على الحروف (OCR/HTR) وأثرها في معالجة المخطوطات التاريخية الجزائرية: مخطوطات أدرار نموذجًا

مراجع مناسبة لهذا الجزء

اليونسكو، IFLA/UNESCO survey on digitisation and preservation.

دراسة ndwritten Arabic Text Recognition**. in-Based Dataset for Arabic Handwritten Text Recognition**.

دراسة f Handwritten Arabic Dataset**.

دراسة y Arabic Text Recognition**.

دراسةe for Historical Manuscripts Digitization**.

دندان خزائن المخطوطات في منطقة توات (ولاية أدرار) أهميتها وأبعادها التاريخية*.
 

Ikram Boualem

عضو نشيط
المشاركات
33
مستوى التفاعل
3
النقاط
8
تقنيات التعرف البصري على الحروف (OCR) وأثرها في معالجة الوثائق التاريخية والمخطوطات

تُعدّ تقنيات التعرف البصري على الحروف من أهم الأدوات التي أحدثت تحولًا نوعيًا في معالجة الوثائق التاريخية والمخطوطات، لأنها تنقل الوثيقة من مجرد صورة رقمية إلى نص قابل للبحث والفهرسة والمعالجة. وإذا كانت الرقمنة التقليدية تكتفي غالبًا بإنتاج نسخة مصوّرة تحفظ الأصل من التداول المباشر، فإن OCR يضيف قيمة علمية أعلى، تتمثل في إمكان استخراج النص، وربطه بالبيانات الوصفية، وتمكين الباحث من البحث داخل الوثيقة بدل الاكتفاء بمشاهدتها بصريًا. وقد أظهرت مسوح دولية مبكرة دعمتها اليونسكو أن OCR أصبح عنصرًا حاضرًا في مشاريع الرقمنة داخل عدد معتبر من المؤسسات، بما يؤكد مركزيته في الانتقال من الحفظ الرقمي إلى الاستغلال العلمي للوثيقة.

غير أن الحديث عن OCR في مجال الوثائق التاريخية والمخطوطات يستلزم التمييز بين التعرف على النصوص المطبوعة والتعرف على النصوص اليدوية. فالمخطوطات، بخاصة العربية منها، لا تخضع دائمًا لـ OCR بالمعنى التقليدي، بل لامتداد أكثر تعقيدًا يعرف بـ HTR، أي التعرف على الكتابة اليدوية. وتزداد الصعوبة في المخطوطات العربية بسبب اتصال الحروف، وتعدد أنماط الخط، وكثرة الاختصارات، واختلاط الحواشي بالمتون، وتفاوت حالة الأصول وجودة الصور. ولهذا تؤكد الأدبيات الحديثة أن النصوص العربية التاريخية المكتوبة يدويًا تظل من أكثر البيئات تحديًا أمام أنظمة التعرف الآلي، رغم التطور الواضح الذي عرفته النماذج المعتمدة على التعلم العميق والنماذج التحويلية.

وتظهر أهمية OCR/HTR في معالجة الوثائق التاريخية على مستويات متعددة. أول هذه المستويات هو الإتاحة النصية؛ إذ يصبح المحتوى قابلًا للبحث بالكلمات، وتتبع الأعلام، واستخراج المواضع، وبناء الفهارس، ورصد التكرارات والمفاهيم. وثانيها هو خدمة الفهرسة العلمية، لأن النص المستخرج يساعد على اقتراح العنوان، أو تحديد المؤلف، أو التعرف على الموضوع، أو تمييز بدايات النصوص وخواتيمها. وثالثها هو دعم التحقيق العلمي، لأن النص الآلي الأولي، رغم حاجته إلى المراجعة، يختصر على الباحث جزءًا من الجهد الأولي في النسخ والضبط والمقارنة. ورابعها هو تحسين الوصول إلى التراث، إذ يسمح بإدماج المخطوطات في بيئات بحث ذكية بدل بقائها مجرد صور جامدة داخل قواعد بيانات مغلقة أو ضعيفة الاستكشاف.

وتؤكد الدراسات الحديثة أن التطور في هذا المجال لم يعد قائمًا على الخوارزميات البسيطة، بل على نماذج أكثر تخصصًا. فقد عرضت أبحاث حديثة نماذج موجهة للتعرف على النصوص العربية التاريخية المكتوبة يدويًا، وأخرى موجهة لبناء مجموعات بيانات عربية متخصصة، وهو ما يدل على أن التقدم في OCR/HTR العربي أصبح مرتبطًا بإنشاء corpora تدريبية مناسبة وبناء نماذج تراعي خصوصية الخط العربي التاريخي. كما تشير بعض الأدوات المعاصرة إلى أن نجاح التعرف يرتبط أيضًا بمرحلة المعالجة المسبقة للصورة، مثل إزالة الضجيج، وتحسين التباين، وتصحيح الميل، وفصل طبقات النص، وهي أمور أساسية قبل أي قراءة آلية.

وإذا أسقطنا ذلك على المخطوطات الجزائرية، وبالأخص على مخطوطات أدرار وتوات، اتضحت الفائدة بصورة أكبر. فالدراسات الجزائرية تؤكد أهمية خزائن المخطوطات في توات وأبعادها التاريخية والعلمية، غير أن هذه الأهمية لا تتحول تلقائيًا إلى استثمار علمي ما لم تصبح المادة المرقمنة قابلة للبحث والاستغلال. وهنا يمكن لتقنيات OCR/HTR أن تؤدي دورًا محوريًا، خاصة في المخطوطات التي جرى تصويرها داخل المركز الوطني للمخطوطات بأدرار أو تلك المندرجة ضمن البوابة الجزائرية للمخطوطات. فهي يمكن أن تساعد في إنتاج نصوص أولية قابلة للمراجعة، وفي تسريع الجرد والوصف والفهرسة، وفي بناء قواعد بيانات موضوعية تتعلق بالمؤلفين، والعناوين، والموضوعات، والخزائن.

غير أن إدماج OCR/HTR في الحالة الأدرارية يجب أن يتم بوعي شديد بحدوده. فمخطوطات أدرار وتوات تتسم في كثير منها بخصوصيات خطية ومحلية، كما أن بعضها يضم حواشي كثيفة، أو صيغ تملك ووقف، أو تعقيبات ناسخين، أو صفحات متضررة، وهي كلها عناصر قد تربك القراءة الآلية. ولذلك، فإن أفضل تصور عملي هو أن تُستخدم هذه التقنيات في إطار سلسلة عمل متدرجة: تصوير عالي الجودة، ثم تحسين الصورة، ثم استخراج نص أولي آلي، ثم مراجعة علمية بشرية من طرف مختصي المخطوطات والفهرسة والتحقيق، ثم ربط الناتج ببيانات وصفية داخل البوابة الرقمية. وبهذا المعنى، لا يكون OCR بديلًا عن الباحث أو المفهرس، بل أداة ذكية تعزز عمله وتختصر بعض مراحله.


وعليه، فإن تقنيات التعرف البصري على الحروف تمثل حلقة مفصلية في رقمنة الوثائق التاريخية، لأنها تجعل الانتقال ممكنًا من “الحفظ الصوري” إلى “الاستغلال النصي”. وفي حالة المخطوطات الجزائرية، وخاصة في أدرار، يمكن أن تشكل OCR/HTR رافعة مهمة لتطوير الفهرسة العلمية، وتحسين الإتاحة، وربط الرصيد المخطوط بالبحث الجامعي المعاصر، شريطة أن تظل خاضعة للمراجعة البشرية الصارمة، وأن تُكيف مع خصوصية الخطوط المحلية والرصيد الصحراوي.
 
أعلى