Zoeken in deze blog

maandag 1 maart 2021

2021.03.01_Creativities.PDF 1.2.0

Een alles-in-één toepassing voor het beheren en converteren van PDF-bestanden

Creativities.PDF is een alles-in-één toepassing voor het beheren en converteren van PDF-bestanden.

Het biedt basisfuncties voor het bewerken van PDF-bestanden, zoals het roteren, verwijderen en uitpakken van pagina's, tekstherkenning in PDF- en afbeeldingsbestanden, het toevoegen of verwijderen van wachtwoordbeveiliging, het converteren van Office-documenten en afbeeldingen naar PDF. Verder kunt u meerdere bestanden samenvoegen tot één enkel bestand, afbeeldingen exporteren die zijn ingesloten in een PDF-bestand en een PDF-bestand comprimeren.

Een OCR-module is eveneens inbegrepen. Hiermee kunt u niet-doorzoekbare documenten (bijvoorbeeld PDF-bestanden die gescande pagina's met tekst bevatten) converteren naar doorzoekbare documenten of tekst uit afbeeldingen extraheren.

Creativities.PDF voert alle bewerkingen lokaal uit, op de computer van de gebruiker, zonder uw bestanden online te uploaden.

Vertaald met www.DeepL.com/Translator (gratis versie)

Systeemeisen: Windows 7/ 8/ 10 (x32 and x64); .NET Framework 4.6.1; Supported languages: English, German

Dit product van een Duitse zzp-er kregen we nog niet eerder. Kent geen Nederlands, dus zal de OCR niet perfect kunnen zijn. Geen sleutel nodig en een levenslange licentie: dat zie ik graag bij een weggevertje.

De functionaliteiten maken niet veel indruk. Met een modern Officepakket kunt u al pdf's maken. En met het gratis PDF Tools kunt u meer. Behalve dan OCR. Die OCR maakt gebruik van het openbare Tesseract, dat nu wordt beheerd door Google. Citaat van Wikipedia: "Tesseract wordt beschouwd als een van de meest nauwkeurige vrije OCR-softwaremachines die tegenwoordig beschikbaar zijn. ... Tesseract kan Engels, Frans, Italiaans, Duits, Spaans, Braziliaans Portugees en Nederlands verwerken, en kan geoefend worden om andere talen te herkennen. ... Tesseract leest grafische bestanden in TIFF-formaat (met bestandsextensie .tif) andere bestandsformaten moeten eerst naar TIFF geconverteerd worden voordat ze door Tesseract gelezen kunnen worden.

Tesseract ondersteunt geen analyse van opmaak (lay-out), wat betekent dat het geen tekst in meervoudige kolommen kan interpreteren, geen afbeeldingen, noch formules, en zal in deze gevallen een verbroddelde tekst als uitvoer produceren".

On November 2020, Brewster Kahle from the Internet Archive praised Tesseract saying: "Tesseract has made a major step forward in the last few years. When we last evaluated the accuracy it was not as good as the proprietary OCR, but that has changed– we have done evaluations and it is just as good, and can get better for our application because of its new architecture."

Met wat knutselen zou het daarom mogelijk moeten zijn er Nederlands aan toe te voegen. 

Het programma staat in %AppData%, een vreemde keuze. Ik zag hier en daar zaken, die op een sleutel leken. Maar ik kon er de oudere trial (versie 1.1.0) niet mee activeren. "Das neue Update mit Versionsnummer 1.2.0 erweitert die OCR-Funktionen. Es lassen sich nun auch Texte in Bildern erkennen und abspeichern."

De inhoud van de map Creativities in %AppData% is bruikbaar als semi-portable. Klik daarvoor op Creativities.PDF.UI.exe. Bij het eerste gebruik op een schone virtuele ThinPC wordt een bestand in %AppData% gezet:

C:\Users\gebruikersnaam\AppData\Local\Max_Lock_Softwareentwickl\Creativities.PDF.UI.exe_Url_n03az5oesbzecakmdsnu0bjg33zu5u05\AppCenter.config

Ik kreeg de OCR van een pdf en een png niet aan de praat. Jammer dan. Ik heb ABBYY PDF Transformer Plus. Die/dat is goed.

In de uitwisselmap staat een install_and_"activate" , een semi-portable en een Cameyo portable.



Geen opmerkingen:

Een reactie posten