Home Lab — eigene Server, eigener Stack
Anwendungsfall
Eine kleine eigene Infrastruktur, auf der alle privaten Projekte und Daten laufen, ohne Hersteller-Cloud. Authentifizierung läuft zentral über Forward-Auth, DNS und Ad-Blocking über Pi-hole, Smart-Home-Steuerung und Sprach-Eingabe über Home Assistant mit Wyoming-Services, Container-Workloads über Docker auf den größeren Maschinen. Alles in einem Heim-Server-Rack mit USV, Switch und einer aufgeräumten Verkabelung, an die ich mich gewöhnt habe.
Hardware
- AI Server — AMD Ryzen 5 4500, 31 GB RAM, mit zwei mittelgroßen GPUs (GTX 1060 6 GB + RTX 2060 6 GB). Docker-Host für die meisten Services.
- LLM Server — eigene Maschine mit einer modernen 24-GB-Consumer-GPU für ernstzunehmende LLM-Inferenz mit quantisierten Open-Weights-Modellen aus der qwen-Familie.
- Raspberry-Pi-Cluster — mehrere Pis im Einsatz, u. a. einer als Reverse-Proxy mit Forward-Auth und einer als CCU-Bridge (debmatic) für Homematic-IP.
- Switch + USV — kleine Layer-2-Welt im Rack, USV für die kritischen Knoten.
Bisher erreicht
- Authentifizierung: Forward-Auth-SSO als zentrale Instanz vor allen internen Services
- DNS: Pi-hole filtert für das ganze LAN, plus eigene Domain-Auflösung
- LLM-Inferenz: Ollama auf dem LLM-Server, Hybrid-Routing zwischen lokalen Modellen und externen Providern, Bridge-Layer für Agent-Integration
- Smart Home: Home Assistant mit Wyoming-Services und Faster-Whisper (large-v3-turbo) für Sprachauswertung
- Observability: Grafana mit eigenem Look + TimescaleDB als zentrale Zeitreihen-Datenbank
- Datenbank-Layer: mehrere PostgreSQL-Instanzen pro Projekt-Domain
- Vector-Store: Qdrant für Embeddings und RAG-Experimente
- Reverse-Proxy: TLS-Termination via Let's-Encrypt-Wildcard, Routing auf die Service-Container im LAN
Aktuell in Arbeit
Sauberere Backup-Strategie über mehrere Maschinen hinweg, Capacity-Planning für die GPU-Auslastung wenn mehrere KI-Projekte gleichzeitig ziehen, ein paar weitere Wyoming-Services und ein Refactoring der Firewall-Regeln. Smart-Home-, Health-, Legal- und Trading-Stacks laufen alle hierauf.