Postsorter

  last edited: Tue, 20 Nov 2018 23:34:54 +0100  
Intention

Da ich im Wust der #Dokumentenmanagementsysteme ( #DMS ) nichts gefunden habe was meinen Vorstellungen entsprach habe ich mir kurzerhand etwas aus den Fingern gesaugt was jetzt letztendlich auch produktiv bei mir im internen Netzt läuft.

Das Projekt bedarf noch der Überarbeitung da Ein und Ausgaben des Scripts nicht validiert werden und so die Möglichkeit von SQL-Injektions etc. pp besteht.

Für den internen Eigengebrauch reicht es mir allerdings im Moment und die Scriptüberarbeitung wird nach und nach durchgeführt.

Folgende Punkte waren mir bei der Erstellung des Scripts wichtig:

- Verwendung von #PDF und #JPG Scan Dateien
- Dokumente sollen durchsuchbar werden
- Dokumente sollen nach Parametern(Schlagwörter, #Barcode Datum etc.) automatisch benannt werden
- Vorsortierung der Dateien in Unterordner
- Nachträgliches Umbenennen und einsortieren.

Zusätzlich “entstandene” Features:

- #Barcode Erstellung
- #Volltextsuche in OCR-Text
- Vorschaubildchen
- Manuelle File Upload vorhandener PDF oder JPG Dateien
- Intervall(#Cron) und manuelles Anstoßen des Scanvorgangs
- Notify erfolgreicher Scans per Mail oder #NMA (NotifyMyAndroid)

Verwendet werden hier folgende Dienste bzw zusätzliche Scripts

- #OCRmyPDF.sh   // Erzeugt aus PDF Dateien durchsuchbare PDFs
- #zbarimg  // Erkennt in Bilddateien Barcodes
- #pdftotxt  // Extrahiert den Text aus PDF Dateien
- #convert  // Erstellt aus PDF Daten Bilder (in diesem Fall)
- #convmv  // kopiert dateien und erzwingt das Fileencoding beim kopieren
- #lockfile  // prüft aktuellen RUN-Zustand des Sripts
- #mysql Datenbank // Speicherort für die Metadaten und den Volltextindex

All diese zusätzlichen Programme und Scripte wurden in eine logische Reihenfolge gebracht um schlussendlich die PDF Dateien durchsuchbar zu machen und die Daten in eine #MySql Datenbank einzutragen.

Frontend
Das #Frontend besteht aus einem Satz PHP Dateien und dem Zugriff aus der MySql Datenbank um die dort gespeicherten Daten entsprechend anzuzeigen.

[Postsorter Home]
Image/photo

[Postsorter Schlagworte]
Image/photo


Mehr Infos und die Script #Downloads gibts im WIKI

#Postsorter #OCR #PDF #SCAN #Barcode