🖥️ Runtime: Where and How Agents Live🖥️ Laufzeitumgebung: Wo und wie Agents leben

You've seen the architecture (SOUL.md, AGENTS.md, memory/, skills/). Now the question is: where does all this actually run?Du hast die Architektur gesehen (SOUL.md, AGENTS.md, memory/, skills/). Jetzt ist die Frage: Wo läuft das alles eigentlich?

Section 1Abschnitt 1Where Agents LiveWo Agents leben

An agent needs a place to run. Your options:Ein Agent braucht einen Ort, an dem er laufen kann. Deine Optionen:

OptionOptionCost/monthKosten/MonatUptimeVerfügbarkeitBest forAm besten für
Your laptopDein Laptop$0Only when openNur wenn geöffnetExperimentingExperimentieren
Home serverHeimserver (Mac mini, NUC)$5-1524/7Personal agent, full controlPersönlicher Agent, volle Kontrolle
VPS (Hetzner, DO, Hostinger)$5-2524/7, managed24/7, verwaltetAlways-on, no hardwareImmer an, keine Hardware
Raspberry Pi$3-524/7Ultra-low costSehr kostengünstig
Cloud VMCloud-VM (AWS, GCP, Azure)$15-100+24/7, scalable24/7, skalierbarTeams, enterpriseTeams, Unternehmen
The case for a dedicated server:Das Argument für einen dedizierten Server: A laptop works for experimenting. But a real agent system — one with cron jobs, heartbeat checks, and messaging integrations — needs something that runs when your laptop is closed. A Mac mini M4 (from $499) on your desk is the simplest 24/7 setup.Ein Laptop funktioniert zum Experimentieren. Aber ein echtes Agent-System – eines mit Cron-Jobs, Heartbeat-Prüfungen und Messaging-Integrationen – braucht etwas, das läuft, wenn dein Laptop geschlossen ist. Ein Mac mini M4 (ab 499 $) auf deinem Schreibtisch ist die einfachste 24/7-Einrichtung.

Kubernetes and serverless are poor fits.Kubernetes und Serverless passen schlecht. Agents are long-running and stateful, not ephemeral. A Kubernetes pod that gets rescheduled loses the agent's in-memory context. Serverless functions have timeout limits that conflict with agent tasks that take minutes.Agents sind langlebig und zustandsbehaftet, nicht kurzlebig. Ein Kubernetes-Pod, der neu geplant wird, verliert den In-Memory-Kontext des Agents. Serverless-Funktionen haben Zeitlimits, die mit Agent-Aufgaben, die Minuten dauern, in Konflikt stehen.

Section 2Abschnitt 2What Keeps Them RunningWas sie am Laufen hält

An agent isn't just a model — it's a system:Ein Agent ist nicht nur ein Modell – es ist ein System:

🚪

Gateway

Routes messages (Telegram, Signal, Discord) to the right session. Manages approvals and enforces policies.Leitet Nachrichten (Telegram, Signal, Discord) an die richtige Sitzung weiter. Verwaltet Genehmigungen und setzt Richtlinien durch.

Cron & SchedulingCron & Zeitplanung

Daily digest (07:00), heartbeat (every 2h), weekly review (Mon 09:00). macOS: LaunchAgents. Linux: crontab/systemd.Tägliche Zusammenfassung (07:00), Heartbeat (alle 2 Std.), wöchentlicher Rückblick (Mo 09:00). macOS: LaunchAgents. Linux: crontab/systemd.

📊

MonitoringÜberwachung

Watchdog (is it alive?), cost tracking (API spend), error logs (what failed?). Unmonitored agents are liabilities.Watchdog (lebt es noch?), Kostenverfolgung (API-Ausgaben), Fehlerprotokolle (was ist fehlgeschlagen?). Unüberwachte Agents sind ein Risiko.

Section 3Abschnitt 3Platform LandscapePlattform-Landschaft

Software to orchestrate your agent — as of March 2026:Software zur Orchestrierung deines Agents – Stand März 2026:

PlatformPlattformTypeTypBest forAm besten fürComplexityKomplexität
Claude CodeCLIDevelopers, localEntwickler, lokalLowNiedrig
OpenClawGatewayAlways-on personal agentsImmer aktive persönliche AgentsMediumMittel
LangGraphFrameworkComplex workflows, enterpriseKomplexe Workflows, UnternehmenHighHoch
CrewAIFrameworkMulti-agent teamsMulti-Agent-TeamsMediumMittel
AutoGenFrameworkResearch, conversationalForschung, konversationellMediumMittel
Semantic KernelSDKEnterprise .NETHighHoch
No frameworkKein FrameworkDIYSimple setups, full controlEinfache Setups, volle KontrolleVariesVariiert
Just experimenting?Nur experimentieren? → Claude Code (or any LLM CLIoder jedes LLM CLI)
Personal agent, always on?Persönlicher Agent, immer an? → OpenClaw or gateway + cron
Team or product?Team oder Produkt? → LangGraph or CrewAI
Enterprise compliance?Unternehmens-Compliance? → LangGraph or Semantic Kernel

Key insight:Wichtige Erkenntnis: You don't need a framework. This starter kit works with any platform — or none. The architecture is framework-agnostic by design.Du brauchst kein Framework. Dieses Starter-Kit funktioniert mit jeder Plattform – oder keiner. Die Architektur ist absichtlich Framework-unabhängig.

Sources:Quellen: SparkCo (2026), DEV.to Framework Guide (2026)

Section 4Abschnitt 4Cloud APIs vs. Local ModelsCloud-APIs vs. Lokale Modelle

Not just cost — it's about sovereignty, privacy, and capability.Nicht nur Kosten – es geht um Souveränität, Datenschutz und Leistungsfähigkeit.

Cloud APICloud-APILocal (Ollama)Lokal (Ollama)
QualityQualitätFrontier (bestam besten)70-85% of frontierder Spitzenmodelle (benchmark dataBenchmark-Daten)
Cost/requestKosten/Anfrage$0.01-0.80$0 (after hardwarenach Hardware)
PrivacyDatenschutzData leaves your networkDaten verlassen dein NetzwerkData stays localDaten bleiben lokal
Context128K-1M tokens8K-128K
StrengthStärkeComplex reasoningKomplexes DenkenRoutine tasks, chatRoutineaufgaben, Chat

What local models can do (March 2026)Was lokale Modelle können (März 2026)

Ollama reached 52 million monthly downloads in Q1 2026:Ollama erreichte im 1. Quartal 2026 52 Millionen monatliche Downloads:

ModelModellSizeGrößeMMLUHardwareSpeedGeschwindigkeit
Qwen 2.5 32B32B83.2%M4 Pro (36GB+)~15 t/s
Qwen 3.5 7B7B76.8%Any M-series (16GB)~45 t/s
Llama 3.1 8B8B73.0%16GB RAM~40 t/s
DeepSeek-R1 70B70B85.1%M4 Max (128GB)~12 t/s
Phi-4 14B14B79.3%16GB RAM~25 t/s

For comparison: GPT-4 ~86.4% (OpenAI), Claude Opus ~86% (Anthropic).Zum Vergleich: GPT-4 ~86,4 % (OpenAI), Claude Opus ~86 % (Anthropic).

🔒 Sovereign AI:🔒 Souveräne KI: Some use cases require that no data leaves your infrastructure — regulated industries, personal privacy, corporate policy. Local models solve this completely. The tradeoff: lower capability on complex reasoning.Einige Anwendungsfälle erfordern, dass keine Daten Ihre Infrastruktur verlassen – regulierte Branchen, persönlicher Datenschutz, Unternehmensrichtlinien. Lokale Modelle lösen dieses Problem vollständig. Der Kompromiss: geringere Leistungsfähigkeit bei komplexem Denken.

The Hybrid ApproachDer hybride Ansatz

Most production systems use both: local for routine tasks (summarization, classification, embeddings) and cloud APIs for complex work (deep analysis, research, code generation). Route to the right model based on the task.Die meisten Produktionssysteme verwenden beides: lokale Modelle für Routineaufgaben (Zusammenfassung, Klassifizierung, Embeddings) und Cloud-APIs für komplexe Arbeiten (Tiefenanalyse, Recherche, Codegenerierung). Leite je nach Aufgabe an das richtige Modell weiter.

Sources:Quellen: DEV.to Benchmarks (2026), PremAI Guide (2026)

Section 5Abschnitt 5Security & IsolationSicherheit & Isolation

Why your agent should NOT run on your main machineWarum dein Agent NICHT auf deiner Hauptmaschine laufen sollte

An agent has access to your file system, shell, network, and potentially email and calendar. If compromised (via prompt injection, malicious input, or a bug), it has the same access as the user it runs under.Ein Agent hat Zugriff auf dein Dateisystem, deine Shell, dein Netzwerk und potenziell auf E-Mails und Kalender. Wenn er kompromittiert wird (durch Prompt-Injection, bösartige Eingaben oder einen Fehler), hat er denselben Zugriff wie der Benutzer, unter dem er ausgeführt wird.

🔴 Real risks🔴 Echte Risiken

Agent reads ~/.ssh/ and leaks your keysAgent liest ~/.ssh/ und gibt deine Schlüssel preis
Agent runs rm -rf on a directoryAgent führt rm -rf in einem Verzeichnis aus
Agent sends unauthorized emailsAgent sendet unautorisierte E-Mails
Agent pushes secrets to a public repoAgent pusht Geheimnisse in ein öffentliches Repo

🟢 Mitigation layers🟢 Abwehrmaßnahmen

Dedicated userDedizierter Benutzerseparate OS accountseparates OS-Konto
Restricted pathsEingeschränkte Pfadeblock sensitive dirssensible Verzeichnisse blockieren
Approval gatesGenehmigungsschleusenhuman confirms destructive opsMensch bestätigt destruktive Operationen
ContainersContainerfull filesystem isolationvollständige Dateisystem-Isolation
Network rulesNetzwerkregelnlimit outbound connectionsausgehende Verbindungen begrenzen

Start simple:Fang einfach an: Dedicated user + restricted paths (see TOOLS.md). Add containers when you're ready. The less your agent can access, the less it can break.Dedizierter Benutzer + eingeschränkte Pfade (siehe TOOLS.md). Füge Container hinzu, wenn du bereit bist. Je weniger dein Agent zugreifen kann, desto weniger kann er kaputt machen.

Section 6Abschnitt 6What It CostsWas es kostet

Hardware (one-time)Hardware (einmalig)

OptionOptionCostKostenAmortized/mo (36mo)Amortisiert/Monat (36 Mon.)
Raspberry Pi 5 (8GB)~$80~$2
Used Intel NUC (16GB)Gebrauchter Intel NUC (16GB)~$150-250 (estimate, used marketSchätzung, Gebrauchtmarkt)~$5-7
Mac mini M4 (16GB)~$499~$14
Mac mini M4 Pro (48GB)~$1,599~$44
VPS (no hardwarekeine Hardware)$0$5-25/mo

Running costs (monthly)Laufende Kosten (monatlich)

CategoryKategorieRangeSpanneNotesAnmerkungen
ElectricityStrom$3-15Mac mini ~15W idleLeerlauf, ~60W loadLast (Apple)
VPS$5-25Hetzner, DigitalOcean, Hostinger
Cloud API (light)Cloud-API (leicht)$5-20~100-500 req/day, mixed modelsAnfr./Tag, gem. Modelle
Cloud API (heavy)Cloud-API (stark)$30-100+1000+ req/day, Opus-heavyAnfr./Tag, viel Opus
Automated cronAutomatisierter Cron$15-60Digests, reviews, heartbeatsZusammenfassungen, Reviews, Heartbeats
⚠️ The invisible costs:⚠️ Die unsichtbaren Kosten: Cron jobs run silently. A daily digest + weekly review + heartbeats can cost $15-45/month. Opus is 5-15× more expensive than Haiku. Context window usage scales cost linearly. Set spending alerts before you automate.Cron-Jobs laufen im Hintergrund. Eine tägliche Zusammenfassung + ein wöchentlicher Rückblick + Heartbeats können 15–45 $/Monat kosten. Opus ist 5–15-mal teurer als Haiku. Die Nutzung des Kontextfensters skaliert die Kosten linear. Richte Ausgabenwarnungen ein, bevor du automatisierst.

Sources:Quellen: Alchemic Technology (2026), Anthropic Pricing, OpenAI Pricing. As of March 2026.Stand März 2026.

Section 7Abschnitt 7Making the CaseDie Argumentation

The 30-second pitchDer 30-Sekunden-Pitch

"An AI agent that runs 24/7 costs $20-50/month (server + API). It handles research, monitoring, content drafting, and routine tasks while we sleep. The ROI is one employee-hour saved per day — at a fraction of the cost."„Ein KI-Agent, der rund um die Uhr läuft, kostet 20–50 $/Monat (Server + API). Er erledigt Recherche, Überwachung, das Entwerfen von Inhalten und Routineaufgaben, während wir schlafen. Der ROI ist eine eingesparte Mitarbeiterstunde pro Tag – zu einem Bruchteil der Kosten.“

The risk argumentDas Risiko-Argument

"Running agents on employee laptops means they stop when the laptop closes, have access to personal files, and can't be audited. A dedicated server with proper isolation is safer, more reliable, and auditable."„Wenn Agents auf Mitarbeiter-Laptops laufen, stoppen sie, wenn der Laptop geschlossen wird, haben Zugriff auf persönliche Dateien und können nicht geprüft werden. Ein dedizierter Server mit richtiger Isolation ist sicherer, zuverlässiger und prüfbar.“

EmployeeMitarbeiterAgent (server)Agent (Server)Agent (laptop)Agent (Laptop)
AvailabilityVerfügbarkeit8h/dayTag24/7When openWenn geöffnet
Cost/monthKosten/Monat$5,000+$20-50$0 (unreliableunzuverlässig)
Audit trailPrüfpfadEmail, SlackGit, logsProtokolleNoneKeine
SecuritySicherheitTrainedGeschultSandboxedAbgeschottetUser-level accessZugriff auf Benutzerebene

This is not about replacing people. It's about giving people a reliable async teammate.Hier geht es nicht darum, Menschen zu ersetzen. Es geht darum, Menschen einen zuverlässigen asynchronen Teamkollegen zu geben.

Next: Agent Exchange →Weiter: Agent Exchange → ← Back to Kit← Zurück zum Kit