كيفية تحويل المستندات المكتوبة بخط اليد إلى نص
إذا كان لديك كومة من المستندات المكتوبة بخط اليد والتي تحتاج إلى تحويلها إلى صيغة رقمية للسماح بتحريرها ومشاركتها وتخزينها بسهولة، فإن تقنية الكتابة اليدوية إلى نص (HTR) موجودة هنا لإنقاذك. وبمساعدتها، يمكنك تحويل المستندات المكتوبة بخط اليد إلى نص في بضع خطوات بسيطة، وكل ما تحتاجه هو ماسح ضوئي وبرنامج.
التحدي المتمثل في مسح المستندات المكتوبة بخط اليد
يمكن أن يمثل مسح المستندات المكتوبة بخط اليد ضوئيًا وتحويلها إلى نص رقمي أمرًا صعبًا للغاية، لأنه يأتي مع مجموعة فريدة من التحديات:
- تختلف الكتابة اليدوية من شخص لآخر، مما يجعل من الصعب على برنامج التعرف البصري على الأحرف (OCR) القياسي التعرف على النص ونسخه بدقة.
- غالبًا ما تحتوي المستندات المكتوبة بخط اليد على أخطاء، مثل الكلمات المشطوبة والأخطاء الإملائية، مما قد يزيد من إرباك برامج المسح الضوئي.
- العديد من المستندات المكتوبة بخط اليد قديمة، كما أن جودة الورق والحبر المستخدم وحتى وجود علامات أو طيات شاردة يمكن أن تزيد من تعقيد عملية المسح الضوئي.
للتعامل مع هذه التحديات وغيرها، أنشأ مطورو البرامج برنامجًا متخصصًا للكتابة اليدوية إلى نص (HTR)، مصمم خصيصًا لمهمة تحويل المستندات المكتوبة بخط اليد إلى نص.
تستخدم أدوات HTR خوارزميات متقدمة للتكيف مع أنماط الكتابة اليدوية المختلفة، والتمييز بين النص المقصود والعلامات الضالة أو التصحيحات، والتعامل مع المستندات القديمة أو التالفة.
تحويل المستندات المكتوبة بخط اليد إلى نص باستخدام Transkribus
عندما يتعلق الأمر بتحويل المستندات المكتوبة بخط اليد إلى نص، هناك العديد من أدوات HTR المتاحة. ومع ذلك، فإن أكثر ما أوصي به هو Transkribus. إنه برنامج عبر الإنترنت بإصدار سطح مكتب يسهل للغاية التقاطه، ويمكنك تدريبه لتحسين أدائه.
خارج الصندوق، قد تكون النتائج مع Transkribus مخيبة للآمال. ومع ذلك، فإن القوة الحقيقية لهذه الأداة تكمن في واجهة التدريب الخاصة بها. مع بعض الوقت والجهد، يمكنك تدريب Transkribus على التعرف على خط يدك بشكل أكثر دقة، مما قد يؤدي إلى تحسين جودة النسخ بشكل كبير.
يتيح لك الإصدار المجاني من Transkribus تحويل ما يصل إلى 100 مستند وإجراء ما يصل إلى خمس دورات تدريبية شهريًا (المزيد عنها قريبًا). للبدء، قم بزيارة موقع الأداة، وانقر فوق حاول مجانا زر، وإنشاء حساب مستخدم.
للبدء في تحويل المستند الخاص بك، افتح المجموعة الافتراضية في ترانسكريبوس. فكر في المجموعات كمجلدات حيث يمكنك تنظيم عملك، حيث تحتوي كل مجموعة على مستندات فردية. وتتكون كل وثيقة من الصور التي تمثل الصفحات الفعلية للنص الخاص بك.
لإضافة المستند الخاص بك، انقر فوق تحميل الملفات زر. يقبل Transkribus تنسيقات مختلفة، مثل ملفات JPEG، وPNG، وPDF، ولكن للتعرف الأمثل، يوصي باستخدام ملفات JPEG بدقة 300 نقطة في البوصة. بمجرد تحميل مستنداتك، تصبح جاهزًا لتحويل المستند المكتوب بخط اليد إلى نص.
افتح المستند، وحدد جميع الصور التي تريد تحويلها. انقر على يتعرف على زر.
تقدم Transkribus مجموعة من النماذج العامة للغات وفترات زمنية مختلفة. للتعرف الفوري على النص دون أي تدريب، اختر الخيار الذي يتوافق بشكل أفضل مع خصائص المستند الخاص بك، ثم انقر فوق ابدأ الاعتراف زر وانتظر. انا ذهبت مع النسر الإنجليزي نموذج.
تحظى مهام التعرف على النص المكتوب بخط اليد التي أنشأها المستخدمون المجانيون بأولوية منخفضة، لذلك قد يستغرق الأمر بعض الوقت حتى ينتهي Transkribus.
بعد عملية التعرف، قم بضبط النتائج باستخدام محرر المستندات Transkribus. يقوم بمزامنة طرق عرض النص والصور لعملية تحرير بديهية. يمكنك استخدام العلامات لوضع علامة على الكيانات أو الأحداث أو النسخ غير المؤكدة.
تدريب نموذج مخصص لتحسين أداء HTR
لتدريب نموذج مخصص، قم بإعداد بيانات الحقيقة الأساسية الخاصة بك. يتضمن ذلك النسخ الدقيق لمجموعة من المستندات المكتوبة بخط اليد والتي تتطابق مع أنماط الكتابة التي تريد أن يتعرف عليها النموذج. كلما كانت بياناتك أكثر تنوعًا وتمثيلًا، كان أداء نموذجك أفضل.
لتدريب نموذج، انقر على تدريب النموذج الجديد زر. حدد نموذج التعرف على النص اختر المجموعة التي تحتوي على مستند (وثائق) الحقيقة الأساسية الخاصة بك، ثم حدد الصفحات التي سيتم تضمينها في بيانات التدريب والتحقق من الصحة. يتم استخدام بيانات التدريب لتناسب معلمات النموذج، بينما توفر بيانات التحقق تقييمًا غير متحيز لأداء النموذج.
قم بتكوين إعدادات النموذج، مثل مجموعة اللغة والأحرف لبدء عملية التدريب، والتي تتضمن دورات أو “فترات” متعددة حيث يتعلم النموذج من بياناتك. يقوم Transkribus تلقائيًا بإيقاف التدريب عندما يتوقف أداء النموذج عن التحسن.
بعد التدريب، استخدم النموذج المخصص الخاص بك لنسخ المستندات الجديدة بدقة محسنة.
بدائل ترانسكريبوس
على الرغم من أن Transkribus هو خياري الأفضل لتحويل المستندات المكتوبة بخط اليد إلى نص، إلا أن هناك العديد من الخيارات الرائعة الأخرى:
- Pen2Txt هو الوافد الجديد إلى مشهد HTR. ويهدف إلى تقديم دقة عالية من خلال الاستفادة من أحدث تقنيات الذكاء الاصطناعي للتكيف مع أنماط الكتابة اليدوية المتنوعة. بينما لا يزال العمل جاريًا، يوفر Pen2Txt واجهة سهلة الاستخدام وأداءً قويًا. ومع ذلك، يقتصر المستخدمون المجانيون على ثلاثة تحويلات فقط.
- يعد Google Document AI جزءًا من مجموعة أدوات معالجة المستندات التي تعمل بالذكاء الاصطناعي من Google. فهو يوفر ميزة التعرف على الملفات بشكل ممتاز بدون تدريب، مما يجعله خيارًا قويًا للتحويلات السريعة. يمكنك الحصول على رصيد مجاني بقيمة 300 دولار لتجربة الأداة، ولكن سيتعين عليك الدفع على أساس كل تحويل لمواصلة الاستخدام.
- GrabText هي أداة بسيطة عبر الإنترنت تلتقط النص المكتوب بخط اليد أو المطبوع من الصور والرسومات والمستندات، وتحوله إلى نص قابل للتحرير. فهو يقدم عملية مباشرة من ثلاث خطوات: التقاط النص، وتطبيق التصحيحات التلقائية (بما في ذلك التدقيق الإملائي والنحوي)، وتصدير النص المحول بتنسيقات مختلفة. لسوء الحظ، تحتاج إلى دعوة صديق لاستخدامه مجانًا.
سواء اخترت Transkribus أو أحد البدائل المذكورة أعلاه، ستتمكن من تحويل مستنداتك إلى صيغة رقمية بسهولة. إذا كنت تبحث عن المزيد من الخيارات، فتعرف على كيفية تحويل الصور إلى نص باستخدام OCR على Android.
حقوق الصورة: بيكساباي. جميع لقطات الشاشة بواسطة ديفيد موريلو.
اشترك في نشرتنا الإخبارية!
يتم تسليم أحدث البرامج التعليمية لدينا مباشرة إلى صندوق البريد الوارد الخاص بك
اكتشاف المزيد من تكتك تكنولوجيا
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.