Dieser Beitrag dokumentiert, wie ich einen KI-Dokumentenmanager mit Azure OpenAI gebaut habe, um papierlose Büros zu Hause und am Arbeitsplatz zu ermöglichen. Es ist dasselbe Projekt, das ich für meinen eigenen Haushaltspapierkram nutze: scannen, klassifizieren, extrahieren, ablegen und durchsuchen – mit Azure AI Foundry und OpenAI-Modellen als Kern.
Seien wir ehrlich: Die meisten Dokumentenmanagementsysteme fühlen sich an, als wären sie im Jahr 2005 stecken geblieben. Ich habe mich entschieden, auf ein papierloses Büro umzusteigen und alle meine Dokumente zu scannen. Ich habe mehrere Wege ausprobiert, um das umzusetzen, konnte aber kein Tooling finden, mit dem ich mich wohlfühlte und das mir viel Arbeit beim Speichern und Wiederfinden von Dokumenten abnahm.
Ich wäre kein Entwickler oder AI MVP, wenn ich mich nicht hineingekniet und mein eigenes Tool geschrieben hätte. Mit dem Doc Manager zeige ich, wie man Azure OpenAI / AI Foundry nutzt, um ein erstklassiges Dokumentenmanagementsystem zu bauen – aufbauend auf Ideen wie Azure AI Search für KI-gestützte Suche.

Inhaltsverzeichnis
Auftritt KI: Der Game Changer
Was wäre, wenn dein Dokumentensystem deine Dokumente tatsächlich verstehen würde? Nicht nur ihre Titel oder Tags, sondern ihren eigentlichen Inhalt und ihre Bedeutung? Genau das wollte ich mit DocumentManager bauen.
Hinter dem Dokumentenmanager steht eine Vektordatenbank, die eine fortschrittliche Suche bereitstellt, welche all deine Dokumente auf Basis von Inhaltsverständnis findet. Statt Schlüsselwörter abzugleichen, versteht das System Konzepte. Suche nach „Zahlungsbedingungen“ und es findet Dokumente, die Rechnungsstellung, Verträge mit Zahlungsklauseln und Finanzvereinbarungen behandeln – selbst wenn sie genau diese Wörter nie verwenden. Während der Initialisierung aller Dokumente wird für jedes von ihnen ein Embedding erzeugt, das für eine Vektorsuche genutzt wird.

Schlüsselfunktionen, die wirklich zählen
1. Intelligente OCR mit mehrsprachiger Unterstützung
Ein gescanntes PDF auf Deutsch hochladen? Kein Problem. Ein Foto eines Whiteboards auf Japanisch? Auch das ist abgedeckt. Das System extrahiert automatisch Text aus Bildern und PDFs in über 50 Sprachen mithilfe von Tesseract OCR.

2. Abfragen in natürlicher Sprache
Hör auf, wie eine Datenbank zu denken. Stell einfach Fragen ganz natürlich. Es ist ein KI-Chat integriert, der alle relevanten Dokumente findet und es dir ermöglicht, mit ihnen zu chatten – vom Konzept her ähnlich dem Intune Co Pilot, den ich mit Azure OpenAI Studio gebaut habe:
- „Zeig mir alle Verträge, die dieses Jahr auslaufen“
- „Finde Dokumente über die Renovierung des Berliner Büros“
- „Wie hoch waren unsere Marketingausgaben im Q4?“
Die KI versteht Kontext und Absicht, nicht nur Schlüsselwörter.

3. Automatische Kategorisierung
Lade ein Dokument hoch und sieh zu, wie die KI es automatisch anhand des Inhalts verschlagwortet. Finanzberichte werden als „Finanzen“ getaggt, Verträge als „Recht“, technische Spezifikationen als „Engineering“. Kein manuelles Verschlagworten nötig (obwohl du es bei Bedarf jederzeit überschreiben kannst). Außerdem werden Titel, Zusammenfassung, Korrespondent, Dokumententyp, Dokumentendatum, Tags und Steuerrelevanz erkannt oder automatisch generiert. Die KI-generierte Zusammenfassung macht es sehr einfach, den Inhalt zu verstehen, selbst bei umfangreichen Dokumenten.

Der technische Stack
Für die Technikbegeisterten unter euch – hier ist, was unter der Haube steckt:
- **Backend**: FastAPI
- **Vektordatenbank**: ChromaDB für blitzschnelle semantische Suche
- **KI-Modelle**: OpenAI oder Azure OpenAI (deine Wahl)
- **Frontend**: Vanilla JavaScript (einfach und schnell gehalten)
- **Deployment**: Docker-fertig mit einem praktischen Setup-Skript
In 3 Minuten loslegen
Das Schöne an Open Source? Du kannst das hier sofort auf deinem Rechner laufen lassen:
Stelle sicher, dass Docker auf deinem Gerät läuft.
git clone https://github.com/your-username/DocumentManager.git
cd DocumentManager
./setup.sh prod
Das war’s. Rufe `http://localhost:8000` auf und beginne, Dokumente hochzuladen.
Sicherheit zuerst
Ich weiß, was du denkst – „KI und sensible Dokumente?“ Keine Sorge, ich habe an alles gedacht:
- Rollenbasierte Zugriffskontrolle (RBAC)
- Vollständige Audit-Trails
- Option, Azure OpenAI zu nutzen, um die Modelle in deinem eigenen Tenant zu halten
- Alle Daten bleiben auf deiner Infrastruktur / deinem Speicher
Wie funktioniert es

Der Open-Source-Vorteil
Warum Open Source? Weil dein Dokumentenmanagementsystem keine Blackbox sein sollte. Du kannst:
- Den Code prüfen
- Ihn an deine Bedürfnisse anpassen
- Alles selbst hosten
- Verbesserungen beitragen
Außerdem kein Vendor-Lock-in. Deine Dokumente, deine Regeln. Wenn du das Projekt unterstützen möchtest, kannst du mir einen Kaffee spendieren. Du findest die Option in der Seitenleiste meines Blogs.
Was kommt als Nächstes?
Das Fundament steht solide, aber ich habe gerade erst angefangen. Auf der Roadmap stehen:
- Unterstützung für selbst gehostete Modelle
- Mobile Apps für den Zugriff unterwegs oder zum Scannen
- Workflow-Automatisierung (stell dir vor, Dokumente leiten sich selbst weiter)
- Erweiterte Analyse-Dashboards
- Plugin-System für individuelle Integrationen
Probiere es selbst aus
Bereit, dein Dokumentenchaos in organisierte Intelligenz zu verwandeln? Das gesamte Projekt ist auf GitHub verfügbar.
Gib dem Repo einen Stern ⭐, wenn du es nützlich findest – das hilft wirklich bei der Motivation.
DocumentManager ist quelloffen und unter der MIT-Lizenz verfügbar. Gebaut mit ❤️ von Jannik Reinhard und Fabian Peschke
Brauchst du KI in deinen Prozessen? Brauchst du einen Agenten oder ein Tool wie dieses? Schreib mir über das Kontaktformular – ich helfe gerne.