"Dokumentenmanagement" mit Qnap, OCR Konvertierung, finden von Dokumenten

  last edited: Tue, 10 Dec 2019 23:02:25 +0100  
Da ich ja schon seit Jahren meine Post digitalisiere und in meinem Postsorter organisiere
bin ich ja immer auf der Suche nach neuen Ideen und Lösungen rund um das Dokumentenmanagement im privaten Bereich.
Ich hatte mir ja schon mal überlegt das ganze als Produkt zu vermarkten aber Schlussendlich ist das im Paket als  on Premise Lösung zu teuer  ;-/   und durch die Smartphones und Cloud Lösungen wie Scanbot (bäh..)viel zu unattraktiv.

Zudem hat jetzt beispielsweise QNAP ein paar Apps im QTS die den Prozess sehr gut automatisieren können.
Scannen tue ich weiterhin mit meinem Brother ADS-1600 wegen Duplex und Auflösung, auch übertragen werden die Dateien (pdf) wie zuvor über WLAN und FTP zum NAS (TS-251, 16GB Ram).
Allerdings nicht mehr in einem LXC-Ubuntu Container sondern direkt in einen Ordner auf dem NAS im Home Verzeichnis.
Ab hier Übernimmt der OCR-Converter, die Erkennung mit Tesseract 4.0 ist echt super auch wenn die Geschwindigkeit nicht gerade berauschend ist, 50 PDF Dateien ohne Layer durch die OCR Erkennung dauerte ca. 6h.
Aber wenn man mal den Hauptteil durch hat reicht es für die tägliche oder auch wöchentliche Post.

nach dem konvertieren nutze ich die Qfiling App um zuerst die konvertierten Dateien mit dem Dateifilter "#deu#a.pdf" in einen Ordner und dann die Originale in einen anderen Ordner zu sortieren.
Per QSirch ist dann das Ergebnis sauber zu durchsuchen und man findet auch das passende PDF mit dem enthaltenen Suchbegriff.

Man muss nur schauen dass man das konvertieren und verschieben etwas timed damit nichts durcheinander kommt.(erst scannen, dann die gescannten anhand des Filter verschieben danach die Originale)
Oder aber man stößt die verschiebe Prozesse alle paar Wochen manuell an.
Leider ist Qfiling noch nicht für User sondern nur für Administratoren verfügbar so das man Qfiling über den Admin konfigurieren muss.
OCR-Convert ist auch für NAS-User verfügbar.
Was nicht funktioniert ist, PDFs anhand von Schlagworten oder Barcodes in Ordner zu sortieren.
Solange allerdings die Suche das richtige auswirft ist dies zu verschmerzen.