🖥️ Runtime: Where and How Agents Live🖥️ Laufzeitumgebung: Wo und wie Agents leben

You've seen the architecture (SOUL.md, AGENTS.md, memory/, skills/). Now the question is: where does all this actually run?Du hast die Architektur gesehen (SOUL.md, AGENTS.md, memory/, skills/). Jetzt ist die Frage: Wo läuft das alles eigentlich?

Section 1Abschnitt 1Where Agents LiveWo Agents leben

An agent needs a place to run. Your options:Ein Agent braucht einen Ort, an dem er laufen kann. Deine Optionen:

OptionOption	Cost/monthKosten/Monat	UptimeVerfügbarkeit	Best forAm besten für
Your laptopDein Laptop	$0	Only when openNur wenn geöffnet	ExperimentingExperimentieren
Home serverHeimserver (Mac mini, NUC)	$5-15	24/7	Personal agent, full controlPersönlicher Agent, volle Kontrolle
VPS (Hetzner, DO, Hostinger)	$5-25	24/7, managed24/7, verwaltet	Always-on, no hardwareImmer an, keine Hardware
Raspberry Pi	$3-5	24/7	Ultra-low costSehr kostengünstig
Cloud VMCloud-VM (AWS, GCP, Azure)	$15-100+	24/7, scalable24/7, skalierbar	Teams, enterpriseTeams, Unternehmen

The case for a dedicated server:Das Argument für einen dedizierten Server: A laptop works for experimenting. But a real agent system — one with cron jobs, heartbeat checks, and messaging integrations — needs something that runs when your laptop is closed. A Mac mini M4 (from $499) on your desk is the simplest 24/7 setup.Ein Laptop funktioniert zum Experimentieren. Aber ein echtes Agent-System – eines mit Cron-Jobs, Heartbeat-Prüfungen und Messaging-Integrationen – braucht etwas, das läuft, wenn dein Laptop geschlossen ist. Ein Mac mini M4 (ab 499 $) auf deinem Schreibtisch ist die einfachste 24/7-Einrichtung.

Kubernetes and serverless are poor fits.Kubernetes und Serverless passen schlecht. Agents are long-running and stateful, not ephemeral. A Kubernetes pod that gets rescheduled loses the agent's in-memory context. Serverless functions have timeout limits that conflict with agent tasks that take minutes.Agents sind langlebig und zustandsbehaftet, nicht kurzlebig. Ein Kubernetes-Pod, der neu geplant wird, verliert den In-Memory-Kontext des Agents. Serverless-Funktionen haben Zeitlimits, die mit Agent-Aufgaben, die Minuten dauern, in Konflikt stehen.

Section 2Abschnitt 2What Keeps Them RunningWas sie am Laufen hält

An agent isn't just a model — it's a system:Ein Agent ist nicht nur ein Modell – es ist ein System:

🚪

Gateway

Routes messages (Telegram, Signal, Discord) to the right session. Manages approvals and enforces policies.Leitet Nachrichten (Telegram, Signal, Discord) an die richtige Sitzung weiter. Verwaltet Genehmigungen und setzt Richtlinien durch.

⏰

Cron & SchedulingCron & Zeitplanung

Daily digest (07:00), heartbeat (every 2h), weekly review (Mon 09:00). macOS: LaunchAgents. Linux: crontab/systemd.Tägliche Zusammenfassung (07:00), Heartbeat (alle 2 Std.), wöchentlicher Rückblick (Mo 09:00). macOS: LaunchAgents. Linux: crontab/systemd.

📊

MonitoringÜberwachung

Watchdog (is it alive?), cost tracking (API spend), error logs (what failed?). Unmonitored agents are liabilities.Watchdog (lebt es noch?), Kostenverfolgung (API-Ausgaben), Fehlerprotokolle (was ist fehlgeschlagen?). Unüberwachte Agents sind ein Risiko.

Section 3Abschnitt 3Platform LandscapePlattform-Landschaft

Software to orchestrate your agent — as of March 2026:Software zur Orchestrierung deines Agents – Stand März 2026:

PlatformPlattform	TypeTyp	Best forAm besten für	ComplexityKomplexität
Claude Code	CLI	Developers, localEntwickler, lokal	LowNiedrig
OpenClaw	Gateway	Always-on personal agentsImmer aktive persönliche Agents	MediumMittel
LangGraph	Framework	Complex workflows, enterpriseKomplexe Workflows, Unternehmen	HighHoch
CrewAI	Framework	Multi-agent teamsMulti-Agent-Teams	MediumMittel
AutoGen	Framework	Research, conversationalForschung, konversationell	MediumMittel
Semantic Kernel	SDK	Enterprise .NET	HighHoch
No frameworkKein Framework	DIY	Simple setups, full controlEinfache Setups, volle Kontrolle	VariesVariiert

Just experimenting?Nur experimentieren?         → Claude Code (or any LLM CLIoder jedes LLM CLI)

Personal agent, always on?Persönlicher Agent, immer an?  → OpenClaw or gateway + cron

Team or product?Team oder Produkt?            → LangGraph or CrewAI

Enterprise compliance?Unternehmens-Compliance?      → LangGraph or Semantic Kernel

Key insight:Wichtige Erkenntnis: You don't need a framework. This starter kit works with any platform — or none. The architecture is framework-agnostic by design.Du brauchst kein Framework. Dieses Starter-Kit funktioniert mit jeder Plattform – oder keiner. Die Architektur ist absichtlich Framework-unabhängig.

Sources:Quellen: SparkCo (2026), DEV.to Framework Guide (2026)

Section 4Abschnitt 4Cloud APIs vs. Local ModelsCloud-APIs vs. Lokale Modelle

Not just cost — it's about sovereignty, privacy, and capability.Nicht nur Kosten – es geht um Souveränität, Datenschutz und Leistungsfähigkeit.

	Cloud APICloud-API	Local (Ollama)Lokal (Ollama)
QualityQualität	Frontier (bestam besten)	70-85% of frontierder Spitzenmodelle (benchmark dataBenchmark-Daten)
Cost/requestKosten/Anfrage	$0.01-0.80	$0 (after hardwarenach Hardware)
PrivacyDatenschutz	Data leaves your networkDaten verlassen dein Netzwerk	Data stays localDaten bleiben lokal
Context	128K-1M tokens	8K-128K
StrengthStärke	Complex reasoningKomplexes Denken	Routine tasks, chatRoutineaufgaben, Chat

What local models can do (March 2026)Was lokale Modelle können (März 2026)

Ollama reached 52 million monthly downloads in Q1 2026:Ollama erreichte im 1. Quartal 2026 52 Millionen monatliche Downloads:

ModelModell	SizeGröße	MMLU	Hardware	SpeedGeschwindigkeit
Qwen 2.5 32B	32B	83.2%	M4 Pro (36GB+)	~15 t/s
Qwen 3.5 7B	7B	76.8%	Any M-series (16GB)	~45 t/s
Llama 3.1 8B	8B	73.0%	16GB RAM	~40 t/s
DeepSeek-R1 70B	70B	85.1%	M4 Max (128GB)	~12 t/s
Phi-4 14B	14B	79.3%	16GB RAM	~25 t/s

For comparison: GPT-4 ~86.4% (OpenAI), Claude Opus ~86% (Anthropic).Zum Vergleich: GPT-4 ~86,4 % (OpenAI), Claude Opus ~86 % (Anthropic).

🔒 Sovereign AI:🔒 Souveräne KI: Some use cases require that no data leaves your infrastructure — regulated industries, personal privacy, corporate policy. Local models solve this completely. The tradeoff: lower capability on complex reasoning.Einige Anwendungsfälle erfordern, dass keine Daten Ihre Infrastruktur verlassen – regulierte Branchen, persönlicher Datenschutz, Unternehmensrichtlinien. Lokale Modelle lösen dieses Problem vollständig. Der Kompromiss: geringere Leistungsfähigkeit bei komplexem Denken.

The Hybrid ApproachDer hybride Ansatz

Most production systems use both: local for routine tasks (summarization, classification, embeddings) and cloud APIs for complex work (deep analysis, research, code generation). Route to the right model based on the task.Die meisten Produktionssysteme verwenden beides: lokale Modelle für Routineaufgaben (Zusammenfassung, Klassifizierung, Embeddings) und Cloud-APIs für komplexe Arbeiten (Tiefenanalyse, Recherche, Codegenerierung). Leite je nach Aufgabe an das richtige Modell weiter.

Sources:Quellen: DEV.to Benchmarks (2026), PremAI Guide (2026)

Section 5Abschnitt 5Security & IsolationSicherheit & Isolation

Why your agent should NOT run on your main machineWarum dein Agent NICHT auf deiner Hauptmaschine laufen sollte

An agent has access to your file system, shell, network, and potentially email and calendar. If compromised (via prompt injection, malicious input, or a bug), it has the same access as the user it runs under.Ein Agent hat Zugriff auf dein Dateisystem, deine Shell, dein Netzwerk und potenziell auf E-Mails und Kalender. Wenn er kompromittiert wird (durch Prompt-Injection, bösartige Eingaben oder einen Fehler), hat er denselben Zugriff wie der Benutzer, unter dem er ausgeführt wird.

🔴 Real risks🔴 Echte Risiken

Agent reads ~/.ssh/ and leaks your keysAgent liest ~/.ssh/ und gibt deine Schlüssel preis
Agent runs rm -rf on a directoryAgent führt rm -rf in einem Verzeichnis aus
Agent sends unauthorized emailsAgent sendet unautorisierte E-Mails
Agent pushes secrets to a public repoAgent pusht Geheimnisse in ein öffentliches Repo

🟢 Mitigation layers🟢 Abwehrmaßnahmen

Dedicated userDedizierter Benutzer — separate OS accountseparates OS-Konto
Restricted pathsEingeschränkte Pfade — block sensitive dirssensible Verzeichnisse blockieren
Approval gatesGenehmigungsschleusen — human confirms destructive opsMensch bestätigt destruktive Operationen
ContainersContainer — full filesystem isolationvollständige Dateisystem-Isolation
Network rulesNetzwerkregeln — limit outbound connectionsausgehende Verbindungen begrenzen

Start simple:Fang einfach an: Dedicated user + restricted paths (see TOOLS.md). Add containers when you're ready. The less your agent can access, the less it can break.Dedizierter Benutzer + eingeschränkte Pfade (siehe TOOLS.md). Füge Container hinzu, wenn du bereit bist. Je weniger dein Agent zugreifen kann, desto weniger kann er kaputt machen.

Section 6Abschnitt 6What It CostsWas es kostet

Hardware (one-time)Hardware (einmalig)

OptionOption	CostKosten	Amortized/mo (36mo)Amortisiert/Monat (36 Mon.)
Raspberry Pi 5 (8GB)	~$80	~$2
Used Intel NUC (16GB)Gebrauchter Intel NUC (16GB)	~$150-250 (estimate, used marketSchätzung, Gebrauchtmarkt)	~$5-7
Mac mini M4 (16GB)	~$499	~$14
Mac mini M4 Pro (48GB)	~$1,599	~$44
VPS (no hardwarekeine Hardware)	$0	$5-25/mo

Running costs (monthly)Laufende Kosten (monatlich)

CategoryKategorie	RangeSpanne	NotesAnmerkungen
ElectricityStrom	$3-15	Mac mini ~15W idleLeerlauf, ~60W loadLast (Apple)
VPS	$5-25	Hetzner, DigitalOcean, Hostinger
Cloud API (light)Cloud-API (leicht)	$5-20	~100-500 req/day, mixed modelsAnfr./Tag, gem. Modelle
Cloud API (heavy)Cloud-API (stark)	$30-100+	1000+ req/day, Opus-heavyAnfr./Tag, viel Opus
Automated cronAutomatisierter Cron	$15-60	Digests, reviews, heartbeatsZusammenfassungen, Reviews, Heartbeats

⚠️ The invisible costs:⚠️ Die unsichtbaren Kosten: Cron jobs run silently. A daily digest + weekly review + heartbeats can cost $15-45/month. Opus is 5-15× more expensive than Haiku. Context window usage scales cost linearly. Set spending alerts before you automate.Cron-Jobs laufen im Hintergrund. Eine tägliche Zusammenfassung + ein wöchentlicher Rückblick + Heartbeats können 15–45 $/Monat kosten. Opus ist 5–15-mal teurer als Haiku. Die Nutzung des Kontextfensters skaliert die Kosten linear. Richte Ausgabenwarnungen ein, bevor du automatisierst.

Sources:Quellen: Alchemic Technology (2026), Anthropic Pricing, OpenAI Pricing. As of March 2026.Stand März 2026.

Section 7Abschnitt 7Making the CaseDie Argumentation

The 30-second pitchDer 30-Sekunden-Pitch

"An AI agent that runs 24/7 costs $20-50/month (server + API). It handles research, monitoring, content drafting, and routine tasks while we sleep. The ROI is one employee-hour saved per day — at a fraction of the cost."„Ein KI-Agent, der rund um die Uhr läuft, kostet 20–50 $/Monat (Server + API). Er erledigt Recherche, Überwachung, das Entwerfen von Inhalten und Routineaufgaben, während wir schlafen. Der ROI ist eine eingesparte Mitarbeiterstunde pro Tag – zu einem Bruchteil der Kosten.“

The risk argumentDas Risiko-Argument

"Running agents on employee laptops means they stop when the laptop closes, have access to personal files, and can't be audited. A dedicated server with proper isolation is safer, more reliable, and auditable."„Wenn Agents auf Mitarbeiter-Laptops laufen, stoppen sie, wenn der Laptop geschlossen wird, haben Zugriff auf persönliche Dateien und können nicht geprüft werden. Ein dedizierter Server mit richtiger Isolation ist sicherer, zuverlässiger und prüfbar.“

	EmployeeMitarbeiter	Agent (server)Agent (Server)	Agent (laptop)Agent (Laptop)
AvailabilityVerfügbarkeit	8h/dayTag	24/7	When openWenn geöffnet
Cost/monthKosten/Monat	$5,000+	$20-50	$0 (unreliableunzuverlässig)
Audit trailPrüfpfad	Email, Slack	Git, logsProtokolle	NoneKeine
SecuritySicherheit	TrainedGeschult	SandboxedAbgeschottet	User-level accessZugriff auf Benutzerebene

This is not about replacing people. It's about giving people a reliable async teammate.Hier geht es nicht darum, Menschen zu ersetzen. Es geht darum, Menschen einen zuverlässigen asynchronen Teamkollegen zu geben.

Next: Agent Exchange →Weiter: Agent Exchange → ← Back to Kit← Zurück zum Kit