Отсканированный PDF в текст для .NET
Подключаемый модуль .NET OCR, который извлекает текст из отсканированных PDF-файлов или преобразует их в доступные для поиска документы, из которых можно выбирать и копировать текст. Передовые алгоритмы машинного обучения точно определяют структуру текста и таблиц. Оригинальные изображения размещаются на заднем плане, поэтому вы не потеряете содержимое.
Buy for $99
Делиться
Особенности и преимущества
- Поддерживает европейские, кириллические и азиатские языки, включая китайский и хинди.
- Превосходная скорость и точность распознавания.
- Может использоваться для создания настольных, облачных и веб-приложений для ряда платформ.
- Обнаруживает и распознает все популярные шрифты и стили шрифтов.
- Обрабатывает повернутые, искаженные и зашумленные изображения.
- Читает все форматы изображений, которые вы можете получить со сканера или камеры.
- Массовое распознавание нескольких изображений в папке или архиве.
- Распознает все изображение или только выбранные области.
- Обнаруживает и автоматически исправляет орфографические ошибки.
Как использовать плагин
|
|
Преобразование отсканированного PDF в текст
Оцифровывайте отсканированные документы или конвертируйте отсканированные файлы в индексируемые и доступные для поиска PDF-файлы, написав менее 10 строк кода. Забудьте о ручном перепечатывании, сэкономьте драгоценное время и сосредоточьтесь на текущей задаче.
Как использовать плагин
- Установите пакет Aspose.OCR из Nuget или локально загруженного файла.
- Загрузите отсканированное изображение в объект OcrInput.
- Создайте экземпляр механизма распознавания Aspose.OCR.
- Извлечение текста из отсканированного PDF.
- Выведите распознанный текст или сохраните его в файл.
|
|
Системные Требования
Использовать Отсканированный PDF в текст для .NET подключаемый модуль, убедитесь, что ваша система соответствует следующим требованиям