Choisir la langue
  1. Des produits
  2. Aspose.OCR
  3. Recognize PDF
clearbit icon

PDF numérisé en texte pour .NET

Plug-in .NET OCR qui extrait le texte des PDF numérisés ou les convertit en documents consultables à partir desquels vous pouvez sélectionner et copier du texte. Des algorithmes avancés d'apprentissage automatique identifient avec précision la structure du texte et des tableaux. Les images originales sont placées en arrière-plan afin que vous ne perdiez pas le contenu.

Buy for $99
Partager
Instagram Logo Dribbble Logo Twitter Logo Youtube Logo

Caractéristiques et avantages

  • Prend en charge les langues européennes, cyrilliques et asiatiques, y compris le chinois et l'hindi.
  • Vitesse et précision de reconnaissance supérieures.
  • Peut être utilisé pour créer des applications de bureau, cloud et Web pour un certain nombre de plates-formes.
  • Détecte et reconnaît toutes les polices de caractères et styles de police populaires.
  • Traite les images tournées, déformées et bruyantes.
  • Lit tous les formats d'image que vous pouvez obtenir à partir d'un scanner ou d'un appareil photo.
  • Reconnaissance en bloc de plusieurs images dans un dossier ou une archive.
  • Reconnaît l'intégralité de l'image ou uniquement les zones sélectionnées.
  • Détecte et corrige automatiquement les fautes d'orthographe.

Comment utiliser le plugin

1
Install-Package Aspose.OCR

Conversion d'un PDF numérisé en texte

Numérisez des documents numérisés ou convertissez des numérisations en PDF indexables et interrogeables avec moins de 10 lignes de code. Oubliez la saisie manuelle, gagnez un temps précieux et concentrez-vous sur la tâche à accomplir.

Comment utiliser le plugin

  1. Installez le package Aspose.OCR à partir de Nuget ou d'un fichier téléchargé localement.
  2. Chargez une image numérisée dans l'objet `OcrInput`.
  3. Créez une instance du moteur de reconnaissance Aspose.OCR.
  4. Extraire le texte d'un PDF numérisé.
  5. Sortez le texte reconnu ou enregistrez-le dans un fichier.
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
using System;
 using Aspose.ocr;

namespace CSharpTutorials
{
    class Program
    {
        static void Main(string[] args)
        {
            Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
            metered.SetMeteredKey("PublicKey", "PrivateKey");
            // This code recognize image             
            Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
            // Add images to OcrInput object
            Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
            input.Add("source1.pdf", 0, 3); // set start page and pages number
            input.Add("source2.pdf"); // all pages for recognition
            // Set recognition language
            Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
            recognitionSettings.Language = Aspose.OCR.Language.Latin;
            // Recognize image
            List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
            foreach(Aspose.OCR.RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
            }
            //save as a file
            results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
            //or
            Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
        }
    }
}

Configuration requise

Utiliser PDF numérisé en texte pour .NET plug-in, assurez-vous que votre système répond aux conditions suivantes exigences