Als Site Reliability Engineer bei IONOS bist du verantwortlich für die Überwachung und Verbesserung der Cloud-Dienste, die Störungsbehebung und die Automatisierung von Prozessen.
Über IONOS
IONOS ist der führende europäische Digitalisierungs-Partner für kleine und mittlere Unternehmen mit über sechs Millionen Kunden und einer Plattform in 18 Märkten.
Deine Aufgaben
- Überwachung der Systemleistung (Betriebszeit, Latenz, Fehlerraten)
- 24/7-Störungsbehebung mit dem Ziel, 85 % der Probleme sofort zu lösen
- Planung und Durchführung von Software-/Hardware-Implementierungen über mehrere Rechenzentren
- Durchführung von Disaster-Recovery-Übungen und Verbesserung von Runbooks
- Automatisierung wiederholender Aufgaben zur Effizienzsteigerung
- Bereitstellung von Level-2-Support und direktem Kundenkontakt
Deine Qualifikationen
- Beherrschung der Linux-Systemadministration mit Fehlerbehebungskompetenz
- Erfahrung mit virtualisierten Umgebungen (Qemu/KVM, OpenStack, Proxmox, Kubernetes)
- Kenntnisse in Konfigurationsmanagement-Tools (SaltStack, Ansible) und Monitoring-Tools (Prometheus, Loki, Grafana)
- Erfahrung mit Code-Management und CI/CD
- Bevorzugt: Erfahrung mit Ceph und software-definierten Netzwerken
- Englisch und Deutsch B2+