You've seen the architecture (SOUL.md, AGENTS.md, memory/, skills/). Now the question is: where does all this actually run?Du hast die Architektur gesehen (SOUL.md, AGENTS.md, memory/, skills/). Jetzt ist die Frage: Wo läuft das alles eigentlich?
An agent needs a place to run. Your options:Ein Agent braucht einen Ort, an dem er laufen kann. Deine Optionen:
| OptionOption | Cost/monthKosten/Monat | UptimeVerfügbarkeit | Best forAm besten für |
|---|---|---|---|
| Your laptopDein Laptop | $0 | Only when openNur wenn geöffnet | ExperimentingExperimentieren |
| Home serverHeimserver (Mac mini, NUC) | $5-15 | 24/7 | Personal agent, full controlPersönlicher Agent, volle Kontrolle |
| VPS (Hetzner, DO, Hostinger) | $5-25 | 24/7, managed24/7, verwaltet | Always-on, no hardwareImmer an, keine Hardware |
| Raspberry Pi | $3-5 | 24/7 | Ultra-low costSehr kostengünstig |
| Cloud VMCloud-VM (AWS, GCP, Azure) | $15-100+ | 24/7, scalable24/7, skalierbar | Teams, enterpriseTeams, Unternehmen |
Kubernetes and serverless are poor fits.Kubernetes und Serverless passen schlecht. Agents are long-running and stateful, not ephemeral. A Kubernetes pod that gets rescheduled loses the agent's in-memory context. Serverless functions have timeout limits that conflict with agent tasks that take minutes.Agents sind langlebig und zustandsbehaftet, nicht kurzlebig. Ein Kubernetes-Pod, der neu geplant wird, verliert den In-Memory-Kontext des Agents. Serverless-Funktionen haben Zeitlimits, die mit Agent-Aufgaben, die Minuten dauern, in Konflikt stehen.
An agent isn't just a model — it's a system:Ein Agent ist nicht nur ein Modell – es ist ein System:
Routes messages (Telegram, Signal, Discord) to the right session. Manages approvals and enforces policies.Leitet Nachrichten (Telegram, Signal, Discord) an die richtige Sitzung weiter. Verwaltet Genehmigungen und setzt Richtlinien durch.
Daily digest (07:00), heartbeat (every 2h), weekly review (Mon 09:00). macOS: LaunchAgents. Linux: crontab/systemd.Tägliche Zusammenfassung (07:00), Heartbeat (alle 2 Std.), wöchentlicher Rückblick (Mo 09:00). macOS: LaunchAgents. Linux: crontab/systemd.
Watchdog (is it alive?), cost tracking (API spend), error logs (what failed?). Unmonitored agents are liabilities.Watchdog (lebt es noch?), Kostenverfolgung (API-Ausgaben), Fehlerprotokolle (was ist fehlgeschlagen?). Unüberwachte Agents sind ein Risiko.
Software to orchestrate your agent — as of March 2026:Software zur Orchestrierung deines Agents – Stand März 2026:
| PlatformPlattform | TypeTyp | Best forAm besten für | ComplexityKomplexität |
|---|---|---|---|
| Claude Code | CLI | Developers, localEntwickler, lokal | LowNiedrig |
| OpenClaw | Gateway | Always-on personal agentsImmer aktive persönliche Agents | MediumMittel |
| LangGraph | Framework | Complex workflows, enterpriseKomplexe Workflows, Unternehmen | HighHoch |
| CrewAI | Framework | Multi-agent teamsMulti-Agent-Teams | MediumMittel |
| AutoGen | Framework | Research, conversationalForschung, konversationell | MediumMittel |
| Semantic Kernel | SDK | Enterprise .NET | HighHoch |
| No frameworkKein Framework | DIY | Simple setups, full controlEinfache Setups, volle Kontrolle | VariesVariiert |
Key insight:Wichtige Erkenntnis: You don't need a framework. This starter kit works with any platform — or none. The architecture is framework-agnostic by design.Du brauchst kein Framework. Dieses Starter-Kit funktioniert mit jeder Plattform – oder keiner. Die Architektur ist absichtlich Framework-unabhängig.
Sources:Quellen: SparkCo (2026), DEV.to Framework Guide (2026)
Not just cost — it's about sovereignty, privacy, and capability.Nicht nur Kosten – es geht um Souveränität, Datenschutz und Leistungsfähigkeit.
| Cloud APICloud-API | Local (Ollama)Lokal (Ollama) | |
|---|---|---|
| QualityQualität | Frontier (bestam besten) | 70-85% of frontierder Spitzenmodelle (benchmark dataBenchmark-Daten) |
| Cost/requestKosten/Anfrage | $0.01-0.80 | $0 (after hardwarenach Hardware) |
| PrivacyDatenschutz | Data leaves your networkDaten verlassen dein Netzwerk | Data stays localDaten bleiben lokal |
| Context | 128K-1M tokens | 8K-128K |
| StrengthStärke | Complex reasoningKomplexes Denken | Routine tasks, chatRoutineaufgaben, Chat |
Ollama reached 52 million monthly downloads in Q1 2026:Ollama erreichte im 1. Quartal 2026 52 Millionen monatliche Downloads:
| ModelModell | SizeGröße | MMLU | Hardware | SpeedGeschwindigkeit |
|---|---|---|---|---|
| Qwen 2.5 32B | 32B | 83.2% | M4 Pro (36GB+) | ~15 t/s |
| Qwen 3.5 7B | 7B | 76.8% | Any M-series (16GB) | ~45 t/s |
| Llama 3.1 8B | 8B | 73.0% | 16GB RAM | ~40 t/s |
| DeepSeek-R1 70B | 70B | 85.1% | M4 Max (128GB) | ~12 t/s |
| Phi-4 14B | 14B | 79.3% | 16GB RAM | ~25 t/s |
For comparison: GPT-4 ~86.4% (OpenAI), Claude Opus ~86% (Anthropic).Zum Vergleich: GPT-4 ~86,4 % (OpenAI), Claude Opus ~86 % (Anthropic).
Most production systems use both: local for routine tasks (summarization, classification, embeddings) and cloud APIs for complex work (deep analysis, research, code generation). Route to the right model based on the task.Die meisten Produktionssysteme verwenden beides: lokale Modelle für Routineaufgaben (Zusammenfassung, Klassifizierung, Embeddings) und Cloud-APIs für komplexe Arbeiten (Tiefenanalyse, Recherche, Codegenerierung). Leite je nach Aufgabe an das richtige Modell weiter.
Sources:Quellen: DEV.to Benchmarks (2026), PremAI Guide (2026)
An agent has access to your file system, shell, network, and potentially email and calendar. If compromised (via prompt injection, malicious input, or a bug), it has the same access as the user it runs under.Ein Agent hat Zugriff auf dein Dateisystem, deine Shell, dein Netzwerk und potenziell auf E-Mails und Kalender. Wenn er kompromittiert wird (durch Prompt-Injection, bösartige Eingaben oder einen Fehler), hat er denselben Zugriff wie der Benutzer, unter dem er ausgeführt wird.
Agent reads ~/.ssh/ and leaks your keysAgent liest ~/.ssh/ und gibt deine Schlüssel preis
Agent runs rm -rf on a directoryAgent führt rm -rf in einem Verzeichnis aus
Agent sends unauthorized emailsAgent sendet unautorisierte E-Mails
Agent pushes secrets to a public repoAgent pusht Geheimnisse in ein öffentliches Repo
Dedicated userDedizierter Benutzer — separate OS accountseparates OS-Konto
Restricted pathsEingeschränkte Pfade — block sensitive dirssensible Verzeichnisse blockieren
Approval gatesGenehmigungsschleusen — human confirms destructive opsMensch bestätigt destruktive Operationen
ContainersContainer — full filesystem isolationvollständige Dateisystem-Isolation
Network rulesNetzwerkregeln — limit outbound connectionsausgehende Verbindungen begrenzen
Start simple:Fang einfach an: Dedicated user + restricted paths (see TOOLS.md). Add containers when you're ready. The less your agent can access, the less it can break.Dedizierter Benutzer + eingeschränkte Pfade (siehe TOOLS.md). Füge Container hinzu, wenn du bereit bist. Je weniger dein Agent zugreifen kann, desto weniger kann er kaputt machen.
| OptionOption | CostKosten | Amortized/mo (36mo)Amortisiert/Monat (36 Mon.) |
|---|---|---|
| Raspberry Pi 5 (8GB) | ~$80 | ~$2 |
| Used Intel NUC (16GB)Gebrauchter Intel NUC (16GB) | ~$150-250 (estimate, used marketSchätzung, Gebrauchtmarkt) | ~$5-7 |
| Mac mini M4 (16GB) | ~$499 | ~$14 |
| Mac mini M4 Pro (48GB) | ~$1,599 | ~$44 |
| VPS (no hardwarekeine Hardware) | $0 | $5-25/mo |
| CategoryKategorie | RangeSpanne | NotesAnmerkungen |
|---|---|---|
| ElectricityStrom | $3-15 | Mac mini ~15W idleLeerlauf, ~60W loadLast (Apple) |
| VPS | $5-25 | Hetzner, DigitalOcean, Hostinger |
| Cloud API (light)Cloud-API (leicht) | $5-20 | ~100-500 req/day, mixed modelsAnfr./Tag, gem. Modelle |
| Cloud API (heavy)Cloud-API (stark) | $30-100+ | 1000+ req/day, Opus-heavyAnfr./Tag, viel Opus |
| Automated cronAutomatisierter Cron | $15-60 | Digests, reviews, heartbeatsZusammenfassungen, Reviews, Heartbeats |
Sources:Quellen: Alchemic Technology (2026), Anthropic Pricing, OpenAI Pricing. As of March 2026.Stand März 2026.
"An AI agent that runs 24/7 costs $20-50/month (server + API). It handles research, monitoring, content drafting, and routine tasks while we sleep. The ROI is one employee-hour saved per day — at a fraction of the cost."„Ein KI-Agent, der rund um die Uhr läuft, kostet 20–50 $/Monat (Server + API). Er erledigt Recherche, Überwachung, das Entwerfen von Inhalten und Routineaufgaben, während wir schlafen. Der ROI ist eine eingesparte Mitarbeiterstunde pro Tag – zu einem Bruchteil der Kosten.“
"Running agents on employee laptops means they stop when the laptop closes, have access to personal files, and can't be audited. A dedicated server with proper isolation is safer, more reliable, and auditable."„Wenn Agents auf Mitarbeiter-Laptops laufen, stoppen sie, wenn der Laptop geschlossen wird, haben Zugriff auf persönliche Dateien und können nicht geprüft werden. Ein dedizierter Server mit richtiger Isolation ist sicherer, zuverlässiger und prüfbar.“
| EmployeeMitarbeiter | Agent (server)Agent (Server) | Agent (laptop)Agent (Laptop) | |
|---|---|---|---|
| AvailabilityVerfügbarkeit | 8h/dayTag | 24/7 | When openWenn geöffnet |
| Cost/monthKosten/Monat | $5,000+ | $20-50 | $0 (unreliableunzuverlässig) |
| Audit trailPrüfpfad | Email, Slack | Git, logsProtokolle | NoneKeine |
| SecuritySicherheit | TrainedGeschult | SandboxedAbgeschottet | User-level accessZugriff auf Benutzerebene |
This is not about replacing people. It's about giving people a reliable async teammate.Hier geht es nicht darum, Menschen zu ersetzen. Es geht darum, Menschen einen zuverlässigen asynchronen Teamkollegen zu geben.