Anonim

أحد الأشياء التي أحبطتني غالبًا هو عدم القدرة على نسخ النص بسهولة من الصور وملفات PDF معينة (مثل تلك التي قد تكون تم إنشاؤها من المستندات الممسوحة ضوئيًا). لحسن الحظ ، تم تطوير حلول البرامج بمرور الوقت لمعالجة هذه المشكلة ، مما أتاح توفيرًا كبيرًا في الوقت كان من الممكن إنفاقه يدويًا في نسخ النص وإعادة كتابته. في تلميح اليوم ، أتحدث عن أداة برمجيات مجانية تسمى Capture2Text تستخدم خوارزمية التعرف الضوئي على الأحرف (OCR) التي تتيح لك التقاط نص من ملفات الصور وملفات PDF.

التثبيت والإعداد

للبدء ، انتقل إلى صفحة SourceForge للمشروع وقم بتنزيل أحدث إصدار من Capture2Text. يأتي البرنامج كأرشيف مضغوط وفي ذلك الوقت لا يتضمن مثبّتًا مخصصًا. بمجرد التنزيل ، قم بفك ضغط الأرشيف وتشغيل ملف Capture2Text.exe. سيؤدي ذلك إلى تشغيل البرنامج ووضع أيقونة في علبة النظام:

أولاً ، ما تريد القيام به هو إعداد تفضيلات البرنامج ، وعلى وجه التحديد أي مفاتيح التشغيل السريع (أو الاختصارات) لاستخدامها في بدء الالتقاط وإيقافه:

في حالتي ، اخترت استخدام مفاتيح "Windows + q" لبدء الالتقاط و "Enter" لإيقافه. يمكنك ضبط هذه الخيارات بما يناسبك. ضع في اعتبارك أن مفتاح "Windows + s" يستخدم غالبًا لالتقاط الشاشة بالفعل (على سبيل المثال بواسطة برامج مثل Microsoft One Note).

في علامة التبويب التالية ، يمكن تكوين خيارات التعرف الضوئي على الحروف بما في ذلك لغة الإدخال (حاليًا يتم دعم سبع لغات) وما إذا كان يجب استخدام المعالجة المسبقة لـ OCR لتحسين الدقة (يوصى بشدة). أخيرًا ، ضمن علامة التبويب "الإخراج" ، من بين خيارات أخرى ، يمكن للمرء اختيار ما إذا كنت تريد حفظ النص الملتقط في الحافظة أم فقط لبدء نافذة منبثقة منفصلة.

باستخدام البرنامج

بمجرد تثبيت البرنامج وتهيئته ، يمكنك البدء في استخدامه عبر مجموعة المفاتيح الساخنة لبدء التشغيل. باستخدام الماوس الخاص بك ، حدد المساحة في الصورة التي تتضمن النص الذي تريد التقاطه. لإيقاف الالتقاط ، اضغط فقط على المفتاح السريع الذي اخترته لإيقاف الالتقاط. سيتم بعد ذلك نسخ النص إما إلى الحافظة ، أو نافذة منبثقة للإخراج ، أو كليهما. مثال يمكن أن ينظر إليه أدناه.

من الاختبار السريع للأداة مع الصور ، وجدت أن دقتها جيدة. من الواضح ، هناك قيود على أدوات مثل هذا و OCR بشكل عام. على سبيل المثال ، قد لا يعمل النص المعدل بشدة (الخطي أو المائل أو الحديث) بشكل جيد ، وأحيانًا لا يعمل على الإطلاق. أيضًا ، في بعض الحالات ، سيساعد ذلك في ضبط أبعاد صندوق الالتقاط قليلاً أو اللعب مع التكبير على الصورة نفسها للحصول على نتيجة أكثر دقة.

عند التقاط نص من مستندات PDF الممسوحة ضوئيًا ، تكون الدقة على ما يرام ، مع بعض التعديلات النهائية لا تزال ضرورية بشكل عام على المخرجات الملتقطة (اعتمادًا على جودة المسح الأولي). أيضًا ، لاحظت أن البرنامج قد يستغرق بضع ثوانٍ أطول للمعالجة ، لا سيما عند مطالبتك بتحويل كميات كبيرة من النص.

بعد كل ما قيل ، أعتقد عمومًا أن الأداة تقوم بعمل جيد ، لا سيما لأنها متوفرة مجانًا - أشجعك على تجربتها.

الإضافة 11/16/2015:

كخيار آخر ، بالنسبة لأولئك الذين لديهم حسابات Google ، من الممكن أيضًا استخدام إمكانات التعرف الضوئي على الحروف من Google عن طريق تحميل ملف على Google Drive (يمكن العثور على مزيد من التفاصيل هنا). علاوة على ذلك ، هناك أيضًا مكون إضافي لبرنامج التعرف الضوئي على الحروف متاح لمستخدمي Google Chrome يسمى Copyfish قد ترغب في سحبه أيضًا.

كيفية التقاط النص من الصور مع برنامج ocr