حدد اللغة
  1. منتجات
  2. Aspose.OCR
  3. Recognize PDF
clearbit icon

مسح PDF إلى نص لـ .NET

المكون الإضافي .NET OCR الذي يستخرج النص من ملفات PDF الممسوحة ضوئيًا أو يحولها إلى مستندات قابلة للبحث يمكنك من خلالها تحديد النص ونسخه. تحدد خوارزميات التعلم الآلي المتقدمة بدقة بنية النص والجداول. يتم وضع الصور الأصلية في الخلفية حتى لا تفقد المحتوى.

Buy for $99
يشارك
شعار Instagram شعار Dribbble شعار Twitter شعار Youtube

الميزات والفوائد

  • يدعم اللغات الأوروبية والسيريلية والآسيوية ، بما في ذلك الصينية والهندية.
  • سرعة ودقة التعرف الفائقة.
  • يمكن استخدامها لإنشاء تطبيقات سطح المكتب والسحابة والويب لعدد من الأنظمة الأساسية.
  • يكتشف ويتعرف على جميع المحارف وأنماط الخطوط الشائعة.
  • عمليات تدوير الصور مشوهة وصاخبة.
  • يقرأ جميع تنسيقات الصور التي يمكنك الحصول عليها من ماسح ضوئي أو كاميرا.
  • التعرف المجمع على صور متعددة في مجلد أو أرشيف.
  • يتعرف على الصورة بأكملها أو المناطق المحددة فقط.
  • يكتشف الأخطاء الإملائية ويصححها تلقائيًا.

كيفية استخدام المكون الإضافي

1
Install-Package Aspose.OCR

تحويل ملف PDF ممسوح ضوئيًا إلى نص

رقمنة المستندات الممسوحة ضوئيًا أو تحويل النسخ الممسوحة ضوئيًا إلى ملفات PDF قابلة للفهرسة والبحث مع أقل من 10 أسطر من التعليمات البرمجية. انس أمر إعادة الكتابة اليدوية ووفر وقتك الثمين وركز على المهمة التي بين يديك.

كيفية استخدام المكون الإضافي

  1. قم بتثبيت حزمة Aspose.OCR من Nuget أو ملف تم تنزيله محليًا.
  2. قم بتحميل صورة ممسوحة ضوئيًا في كائن "OcrInput".
  3. قم بإنشاء مثيل لمحرك التعرف Aspose.OCR.
  4. استخراج نص من ملف PDF ممسوح ضوئيًا.
  5. أخرج النص الذي تم التعرف عليه أو احفظه في ملف.
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
using System;
 using Aspose.ocr;

namespace CSharpTutorials
{
    class Program
    {
        static void Main(string[] args)
        {
            Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
            metered.SetMeteredKey("PublicKey", "PrivateKey");
            // This code recognize image             
            Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
            // Add images to OcrInput object
            Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
            input.Add("source1.pdf", 0, 3); // set start page and pages number
            input.Add("source2.pdf"); // all pages for recognition
            // Set recognition language
            Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
            recognitionSettings.Language = Aspose.OCR.Language.Latin;
            // Recognize image
            List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
            foreach(Aspose.OCR.RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
            }
            //save as a file
            results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
            //or
            Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
        }
    }
}

متطلبات النظام

ليستخدم مسح PDF إلى نص لـ .NET المكون الإضافي ، تأكد من أن نظامك يلبي ما يلي متطلبات