Nachkalkulation mit OCR und Excel: Unterschied zwischen den Versionen

Aus Colliseum
Zur Navigation springen Zur Suche springen
(Die Seite wurde neu angelegt: „Übersicht der EVU-Seiten im VKU Die OCR in Tabellen stellt eine spezielle Herausforderung dar, die von Standard-OCR nicht gemeistert wird. ==Online-Konvertierung== * https://pdftables.com * https://www.adobe.com/de/acrobat/how-to/pdf-to-excel-xlsx-converter.html ==Mit Microsoft Office 365== * https://www.youtube.com/watch?v=EaS2Ooe9BNc ==Unter Python== ==Tesseract== ''Googles Tesseract'' ist in diesem Fall zwar in diesem s…“)
 
 
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt)
Zeile 6: Zeile 6:
* https://pdftables.com
* https://pdftables.com
* https://www.adobe.com/de/acrobat/how-to/pdf-to-excel-xlsx-converter.html
* https://www.adobe.com/de/acrobat/how-to/pdf-to-excel-xlsx-converter.html
==Offline-Konvertierung==
* https://pdf.wondershare.net
* https://www.adobe.com/de/acrobat/pricing.html
Ältere Versionen von ''Acrobat Pro'' sind noch vereinzelt als Dauerlizenz erhältlich.


==Mit Microsoft Office 365==
==Mit Microsoft Office 365==
Zeile 13: Zeile 20:


==Tesseract==
==Tesseract==
''Googles Tesseract'' ist in diesem Fall zwar in diesem speziellen Fall nicht die Lösung, kann bei anderen (größeren) Projekten jedoch eine große Hilfe sein. (Sie kann z.B. in [[ffmpeg]] eingebunden werden, um Texte in Videos zu erkennen.) Die kompilierte Windowsversion (läuft im CMD-Fenster) wird u.a. von der Universität Mannheim angeboten, siehe https://github.com/UB-Mannheim/Tesseract_Dokumentation/blob/main/Tesseract_Doku_Windows.md.
''Googles Tesseract'' ist in diesem Fall zwar in diesem speziellen Fall nicht die Lösung, kann bei anderen (größeren) Projekten jedoch eine große Hilfe sein. (Sie kann z.B. in [[FFmpeg]] eingebunden werden, um Texte in Videos zu erkennen.) Die kompilierte Windowsversion (läuft im CMD-Fenster) wird u.a. von der Universität Mannheim angeboten, siehe https://github.com/UB-Mannheim/Tesseract_Dokumentation/blob/main/Tesseract_Doku_Windows.md.


[[Kategorie:Scriptum]]
[[Kategorie:Scriptum]]

Aktuelle Version vom 23. November 2023, 17:41 Uhr

Übersicht der EVU-Seiten im VKU

Die OCR in Tabellen stellt eine spezielle Herausforderung dar, die von Standard-OCR nicht gemeistert wird.

Online-Konvertierung


Offline-Konvertierung

Ältere Versionen von Acrobat Pro sind noch vereinzelt als Dauerlizenz erhältlich.

Mit Microsoft Office 365

Unter Python

Tesseract

Googles Tesseract ist in diesem Fall zwar in diesem speziellen Fall nicht die Lösung, kann bei anderen (größeren) Projekten jedoch eine große Hilfe sein. (Sie kann z.B. in FFmpeg eingebunden werden, um Texte in Videos zu erkennen.) Die kompilierte Windowsversion (läuft im CMD-Fenster) wird u.a. von der Universität Mannheim angeboten, siehe https://github.com/UB-Mannheim/Tesseract_Dokumentation/blob/main/Tesseract_Doku_Windows.md.