Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
bin zwar bissl spät dran, aber da mich das Thema auch persönlich betrifft schreib ich mal
Ich persönlich nutze one folder. Ist zwar nicht kostenlos, aber 10€ im Jahr sind für Privatpersonen definitiv verkraftbar.
Mit dem Programm kann ich direkt vom Drucker die Dokumente hochladen und dann danach suchen, also ist OCR.
Und dafür hast Du Dich nun angemeldet? Werbung im ersten Beitrag hinterlässt immer einen faden Beigeschmack...
Die Website strotzt vor Rechtschreibfehlern, Datenschutzerklärung ein Witz, schlechte SSL Konfiguration (http/https gemischt) usw.
Erstmal Hausaufgaben machen...
Ich habe einen "vernünftigen" Multifunktionsdrucker, der auch einen Dokumenteneinzug hat. Daher sehe ich es als umständlich an jedes Blatt mit dem Handy abzufotografieren anstelle es einfach auf den Scanner zu legen und der macht direkt eine PDF daraus und speichert es im Netzwerk. Daher geht es mir eher um die Weiterbehandlung des PDFs mit Nextcloud (OCR).
Ich persönlich nutze Office'n' PDF kostet allerdings einmalig 49€. Ich persönlich bin damit völlig zufrieden.
Nutze es Privat und auch für Vereinstätigkeiten.
Zu finden unter: DMS Office-n-PDF - Das Dokumentenmanagement
also ich setze seit einiger Zeit die kostenlose Version von Bitfarm ein. Bis jetzt finde ich das Programm super.
Die Software ist komplett kostenlos und besitzt die oben geforderten Windows Clients aber leider auch eine Server Komponente für Windows. Ich bin jetzt in dieses Forum geraten weil ich auf der Suche war ob es ein Docker Image für eine QNAP von Bitfarm gibt.
Also nochmal zu Bitfarm:
MySQL Datenbank und Ordner sind Datenablage. Die Software hat eine Scannerkomponente, eine Importkomponente und diverse Plugins z.B. für Outlook. Eine Explorerintegration und eine Ordnerüberwachung. Als Highlight empfinde ich die integrierte OCR Komponente die digitale Inhalte "durchsuchbar" macht.
Das habe ich mal vor einem Jahr angetestet und fand es sehr umständlich. Wie hast du es für dich organisiert, dass du nicht ewig brauchst um ein einzelnes Dokument vernünftig zu archivieren?
Auch inspiriert damals durch den Artikel von Cashy (und den Blogbeiträgen von gruenert.de) habe ich mir für den Mac Devonthink angeschafft und bin im Prinzip sehr zufrieden. Dazu gibt es auch einige Artikel im Netz wie der eine oder andere Devonthink entsprechend nutzt.
Ich nutze, da Mac User, seit Deinem Post Devonthink und frage mich ständig, warum ich sowas früher noch nicht hatte.
Ich habe beruflich, wie privat alle wichtigen Dokumente darin archiviert. Das passiert über einen Scanner, oder mit dem iPhone (devonThinktoGo) per Kamera oder per Notiz oder per Drag&Drop von Files auf dem Mac oder ... oder ... oder. Zusammen mit Notability und Stifteingabe bin ich seitdem komplett vom Papier weg. Ausnahme sind "amtliche Dokumente". Alles verschlüsselt und nahezu in Echtzeit über alle Geräte synchronisiert.
Ich mache mir keine Gedanken mehr, wo ich welche Notiz/Info, welches Dokument habe.
Wichtig allerdings: Die Datenbanken offline wegsichern. Backups werden so nur noch wichtiger
Wenn man einzelne PDFs mit OCR-Layer ausstatten will, kann man auch den PDF-XChange Viewer nehmen. Da ist oben im Programm ein Button, der für das PDF ein unsichtbares OCR-Layer drüber legt, womit das PDF durchsuchbar wird. Ich finde das äußerst praktisch - allerdings kann man das wohl schlecht automatisieren.
Sehr schön, danke. Baut auf solider Technologie auf (Elasticsearch).
Wobei mir Traefik als Homeuse etwas zu heavy vor kommt, aber okay. Wollte man sich wohl den nginx RP sparen und gleich auf was Modernes setzen.
Krass.
Ich dachte, mit Mayan EDMS hätte ich was passendes gefunden. Solide Basis und selbst noch etwas Hirnschmalz reinstecken, um die Kategorisierung zu verbessern (entwickeln kann ich Perl/Python/...).
Aber dann das....
Sowas habe ich noch nie erlebt...
Zum Glück hatte ich meinen Post noch in einem Tab offen, sonst hätte ich schon an mir gezweifelt, was ich denn schlimmes geschrieben habe?!?
Post weg und ich habe nen permanent Ban bekommen.
Ich bin echt mittelmäßig fassungslos und ziemlich angepi**t.
Ja, da war auch Kritik dabei. Aber doch eigentlich zielführend, konstruktiv und fragend, ob das wirklich so sein soll. Und nachdem ich mehr als 20 Jahre Programmiererfahrung habe, hätte ich da sicher auch einiges zurückfließen lassen können. Aber so? Wer weiß, was dort noch alles gelöscht wird/wurde.
Selbst wenn ich wieder unbanned werde (hatte per Kontaktformular nachgehakt), muss ich mich doch echt fragen, ob das die richtige Community und damit das richtige System ist. Den Zickenkrieg, von dem man im Netz bzgl. diverser Forks liest und den er im Kauf-Buch auch ausführlich ausschmückt, mal abgesehen.
Ne, Mayan EDMS ist eher eine halboffene Zwei-Mann-Show: RR ist der Gründer (sich einen eigenen Wiki Eintrag anzulegen, sagt auch schon einiges aus) und einen weiteren hat er noch im Team: https://gitlab.com/mayan-edms/mayan-edms/activity -> Team
Wobei er sich laut Wiki im März 2019 aus allen Projekten zurückziehen wollte. Hat er wohl doch nicht gemacht.
Das offizielle phpBB Forum ist afaik die einzige Community. Auf reddit gibt es wohl einen invitation-only Bereich und die früher bestehende Mailinglist wurde mit Verweis aufs Forum geschlossen. Wahrscheinlich wegen reduzierter Zensur-Möglichkeiten
Je länger ich drüber nachdenke, desto mehr überzeuge ich mich, dass ich mir wohl etwas anderes suchen muss. Schon wieder :-(
Nachdem ich mittlerweile vom Gedanken an einen Fat-Client (den ich laut erstem Post eigentlich wollte) ziemlich verabschiedet habe (gibt es für privat einfach nicht - EcoDMS war lange im Rennen, hat aber seine App seit ca. 4 Jahren nicht mehr aktualisiert und ist mit der 18er auch seit mehr als einem Jahr nicht mehr lauffähig), werde ich mir doch nochmal die webbasierenden Tips hier im Thread. Auf den ersten Blick sah echt einiges erfolgversprechend aus.
Agorum hatte ich auch nochmal getestet. Leider einige Funktionen (u.a. OCR, AD-Anbindung, maskenbasiertes Erkennen von Daten etc.) weder für Geld noch für gute Worte zu bekommen als Privatmann. Hatte per Mail nachgefragt, Pro Version gibt es nur für Unternehmen. Mit wenig Hirnschmalz ist zwar auch der pro Link zu erraten und vermutlich auch geduldet, privat nicht produktiv zu nutzen (gibt auf der Website eine Nutzungsvereinbarung dazu), aber lief auch nicht wirklich stabil und reproduzierbar.
Bitfarm Archiv nennt sein Produkt auch vollkommen quelloffen und lizenzkostenfrei. Wen aber die Restriktionen der "Light" GPL Version an der einen oder anderen Stelle zu sehr einengen, hat trotzdem Pech - die Enterprise Version kann man einfach nicht herunterladen mit Hinweis darauf, dass diese zu kompliziert für einen Endnutzer zu installieren ist und dass das ein zertifizierter Partner übernehmen muss. Kostenpunkt vierstellig (habe irgendwo ca 3500€ gelesen, aber nagelt mich nicht drauf fest).
Beitrag automatisch zusammengeführt:
Nachdem es im Thread einige Fragen bzgl. OCR gab:
Tesseract ist mittlerweile wirklich gut und OCRmyPDF macht aus Texterkennung und PDF ein durchsuchbares PDF. Habe ich bei mir in einem Debian 10 Container laufen.
Scanner schiebt es auf ein Netzlaufwerk, OCRmyPDF holt es sich, bearbeitet es und schiebt es auf ein anderes Netzlaufwerk.
lodestone von @maxpowers hast du dir schon angeschaut ? Das macht quasi genau das was du mit deinem Script machst, in ner einfachen WebUI mit Elasticsearch Backend.
Lodestone ist explizit "non-destructive". Heißt, es erkennt per OCR, behält den Text in der Datenbank, überführt es aber nicht in ein durchsuchbares PDF. (wie auch Agorum oder Mayan).
Das wollte ich aber explizit, dass ich auch den Weg zurück in ein anderes System habe.
Ne, das wird explizit als Vorteil genannt im Vergleich zu Mayan und PaperlessProject.
Kann auch durchaus nützlich sein, aber ich habe eben eine andere Herangehensweise. Und mich stört es nicht, das vorher automatisiert machen zu lassen.
Endgültig raus ist Lodestone auch noch nicht, aber das hat schon relativ viele Einschränkungen/wenig Features. Von einer LDAP-Anbindung ganz zu schweigen, ist es z.B. nur SingleUser.
Ich werde mir jetzt auch mal Alfresco installieren. Gestern Nacht noch Doku gewälzt, sieht noch deutlich mächtiger aus als Mayan. Aber auch noch mal ne Schippe komplexer zu konfigurieren.