SYSTEMD.RESOURCE-CONTROL(5)

systemd.resource-control

SYSTEMD.RESOURCE-CONTROL(5)

BEZEICHNUNG¶

systemd.resource-control - Resourcensteuerungs-Unit-Einstellungen

ÜBERSICHT¶

Scheibe.slice, Bereich.scope, Dienst.service, Socket.socket, Einhängung.mount, Swap.swap

BESCHREIBUNG¶

Unit-Konfigurationsdateien für Dienste, Scheiben, Bereiche, Sockets, Einhängepunkte und Swap-Geräte nutzen eine Teilmenge der Konfigurationsoptionen für die Ressourcensteuerung von erzeugten Prozessen gemeinsam. Intern verlässt sich dies auf das Konzept der Linux Control Groups (cgroups) des Kernels zur Organisation von Prozessen in einem hierarchischen Baum benannter Gruppen zum Zwecke der Ressourcensteuerung.

Diese Handbuchseite listet die von diesen sechs Unit-Typen gemeinsam benutzten Optionen auf. Siehe systemd.unit(5) für die gemeinsamen Optionen aller Unit-Konfigurationsdateien und systemd.slice(5), systemd.scope(5), systemd.service(5), systemd.socket(5), systemd.mount(5) und systemd.swap(5) für weitere Informationen über die speziellen Unit-Konfigurationsdateien. Die Ressourcensteuerungskonfigurationsoptionen werden in den Abschnitten [Slice], [Scope], [Service], [Socket], [Mount] oder [Swap], abhängig vom Unit-Typ, konfiguriert.

Zusätzlich werden Optionen, die die verfügbaren Ressourcen der von Systemd gestarteten Programme steuern, in systemd.exec(5) aufgeführt. Diese Optionen ergänzen die hier aufgeführten Optionen.

Controller aktivieren oder deaktivieren¶

Controller in der Cgroup-Hierarchie sind hierarchisch und die Ressourcensteuerung wird über verteilte Ressourcenzuweisungen zwischen Geschwistern in Zweigen der Cgroup-Hierarchie realisiert. Es besteht keine Notwendigkeit, einen Cgroup-Controller für eine Unit explizit zu aktivieren. systemd wird den Kernel anweisen, einen Controller für eine angegebene Unit zu aktivieren, wenn diese Unit über eine Konfiguration für einen angegebenen Controller verfügt. Wenn beispielsweise CPUWeight= gesetzt ist, wird der Controller cpu aktiviert und wenn TasksMax= gesetzt ist, wird der Controller pids aktiviert. Zusätzlich können verschiedene Controller auch über explizite Einstellungen MemoryAccounting=/TasksAccounting=/IOAccounting= aktiviert werden. Aufgrund der Arbeitsweise der Cgroup-Hierarchie werden Controller für alle Eltern-Units und für alle Geschwister-Units, beginnend bei der niedrigsten Stufe, auf der der Controller aktiviert ist, aktiviert werden. Units, für die ein Controller aktiviert ist, können der Ressourcensteuerung unterliegen, selbst falls sie selbst über keine explizite Konfiguration verfügen.

Setzen von Delegate= aktiviert alle delegierten Controller für diese Unit (siehe unten). Die Delegierten können dann nach Bedarf Controller für ihre Kinder aktivieren. Falls insbesondere der Delegierte systemd ist (in der Unit user@.service), wird er die gleiche Logik wie die Systeminstanz wiederholen und Controller für Units aktivieren, bei denen Ressourcenbeschränkungen konfiguriert wurden, sowie deren Geschwistern und Eltern und den Geschwistern der Eltern.

Controller können für Teile der Cgroup-Hierarchie mit DisableControllers= deaktiviert werden (siehe unten).

Beispiel 1. Controller aktivieren und deaktivieren



                      -.slice


                     /       \


              /-----/         \--------------\


             /                                \


      system.slice                       user.slice


        /       \                          /      \


       /         \                        /        \


      /           \              user@42.service  user@1000.service


     /             \             Delegate=        Delegate=yes
a.service       b.slice                             /        \
CPUWeight=20   DisableControllers=cpu              /          \


                 /  \                      app.slice      session.slice


                /    \                     CPUWeight=100  CPUWeight=100


               /      \


       b1.service   b2.service


                    CPUWeight=1000

In dieser Hierarchie ist der Controller cpu für alle angezeigten Units außer b1.service und b2.service aktiviert. Da es keine explizite Konfiguration für system.slice und user.slice gibt, werden die CPU-Ressourcen zwischen ihnen gleichmäßig aufgeteilt. Ähnlich werden Ressourcen zwischen den Kindern von user.slice und zwischen der Kind-Scheibe unterhalb von user@1000.service aufgeteilt. Unter der Annahme, dass es keine weitere Konfiguration der Ressourcen oder Delegationen unterhalb der Scheibe app.slice oder session.slice gibt, würde der Controller cpu nicht für Units in diesen Scheiben aktiviert und CPU-Ressourcen würden weiter mittels anderer Mechanismen, z.B. basierend auf den Nice-Stufen, zugewiesen. Der Verwalter für Benutzer 42 hat Delegation ohne Controller aktiviert, d.h. er kann seinen Unterbaum der Cgroup-Hierarchie verändern, aber ohne Ressourcensteuerung.

In der Scheibe system.slice werden die CPU-Ressourcen 1:6 auf Dienst a.service und 5:6 auf Scheibe b.slice aufgeteilt, da Scheibe b.slice den Vorgabewert von 100 für cpu.weight erhält, wenn CPUWeight= nicht gesetzt ist.

Die Einstellung CPUWeight= in b2.service wird durch DisableControllers= in Scheibe b.slice neutralisiert, so dass der Controller cpu für die Dienste b1.service und b2.service nicht aktiviert würde und CPU-Ressourcen weiter mittels anderer Mechanismen, z.B. basierend auf den Nice-Stufen, zugewiesen würden.

Ressourcensteuerungen für eine Cgroup zugehöriger Units setzen¶

Wie in systemd.unit(5) beschrieben, können die hier aufgeführten Einstellungen über die Hauptkonfigurationsdatei einer Unit und Ergänzungsschnipsel in *.d/-Verzeichnissen gesetzt werden. Die Liste der nach Ergänzungen durchsuchten Verzeichnisse enthält Namen, die durch wiederholtes Abschneiden des Units-Namens nach allen Gedankenstrichen geformt werden. Dies ist insbesondere praktisch, um Ressourcenbegrenzungen für eine Gruppe von Units mit ähnlichen Namen zu setzen.

Beispielsweise erhält jeder Benutzer seine eigene Scheibe user-nnn.slice. Ergänzungen mit lokaler Konfiguration, die Benutzer 1000 betreffen, können in /etc/systemd/system/user-1000.slice, /etc/systemd/system/user-1000.slice.d/*.conf, aber auch in /etc/systemd/system/user-.slice.d/*.conf abgelegt werden. Das letzte Verzeichnis gilt für alle Benutzer-Scheiben.

¶

Siehe die Neue Control-Gruppen-Schnittstellen[1] für eine Einführung, wie die Ressourcensteuerungs-APIs von Programmen genutzt werden können.

IMPLIZITE ABHÄNGIGKEITEN¶

Die folgenden Abhängigkeiten werden implizit hinzugefügt:

•Units mit der gesetzten Einstellung Slice= erlangen automatisch Requires=- und After=-Abhängigkeiten auf die festgelegte Scheiben-Unit.

OPTIONEN¶

Units der oben aufgeführten Typen können Einstellungen für die Ressourcensteuerungskonfiguration haben:

CPU-Buchführung und -Steuerung¶

CPUAccounting=

Schaltet die Buchführung für die CPU-Benutzung für diese Unit ein. Akzeptiert ein logisches Argument. Beachten Sie, dass das Einschalten der CPU-Buchführung in einer Unit implizit die Buchführung für alle Units in der gleichen Scheibe und für alle ihre Eltern-Scheiben und die darin enthaltenen Units einschaltet. Die Systemvorgabe für diese Einstellung kann mit DefaultCPUAccounting= in systemd-system.conf(5) gesteuert werden.

Unter der vereinigten Cgroup-Hierarchie ist die CPU-Buchführung für alle Units verfügbar und diese Einstellung hat keine Auswirkung.

Hinzugefügt in Version 208.

CPUWeight=Gewicht, StartupCPUWeight=Gewicht

Diese Einstellungen steuern den Controller cpu in der vereinigten Hierarchie.

Diese Optionen akzeptieren einen Ganzzahlwert oder die besondere Zeichenkette »idle«:

•Weist, falls auf einen Ganzzahlwert gesetzt, die festgelegte CPU-Zeitgewichtung den ausgeführten Prozessen zu, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Diese Optionen steuern das Control-Group-Attribut »cpu.weight«. Der erlaubte Bereich ist 1 bis 10000. Standardmäßig nicht gesetzt, aber die Vorgabe des Kernels ist 100. Für Details über dieses Control-Gruppen-Attribut siehe Control-Gruppen v2[2] und CFS-Auftragsplaner[3]. Die verfügbare CPU-Zeit wird zwischen allen Units innerhalb einer Scheibe relativ zu ihrer CPU-Zeitgewichtung aufgeteilt. Ein höheres Gewicht bedeutet mehr CPU-Zeit, ein geringeres Gewicht weniger.

•Falls sie auf die besondere Zeichenkette »idle« gesetzt wird, dann wird die Cgroup für »idle scheduling« (Leerlauf-Auftragsplanung) markiert. Das bedeutet, dass sie nur CPU-Ressourcen bekommt, wenn es keine Prozesse gibt, die nicht so markiert sind, die in dieser Cgroup oder seinen Geschwistern ausgeführt werden. Diese Einstellung entspricht dem Cgroup-Attribut »cpu.idle«.

Beachten Sie, dass dieser Wert nur bei Cgroup-V2 eine Auswirkung hat, bei Cgroup-V1 ist sie äquivalent zu der Minimalgewichtung.

Während StartupCPUWeight= für die Hoch- und Runterfahrphase des Systems gilt, gilt CPUWeight= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupCPUWeight= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Zusätzlich zu der durch den Controller cpu durchgeführten Ressourcenbelegung kann der Kernel automatisch Ressourcen basierend auf der Sitzungskennungsgruppierung verteilen, siehe »The autogroup feature« in sched(7). Die Auswirkung dieser Funktionalität ist ähnlich des Controllers cpu ohne explizite Konfiguration, daher sollten Benutzer vorsichtig sein, nicht beide durcheinander zu bringen.

Hinzugefügt in Version 232.

CPUQuota=

Diese Einstellung steuert den Controller cpu in der vereinigten Hierarchie.

Weist die festgelegte CPU-Zeitquote den ausgeführten Prozessen zu. Akzeptiert einen Prozentwert, dem »%« angehängt ist. Der Prozentwert gibt an, wieviel CPU-Zeit die Unit maximal erhalten soll, relativ zu der gesamten CPU-Zeit, die auf einer CPU verfügbar ist. Verwenden Sie Werte > 100%, um CPU-Zeit auf mehr als einer CPU vorzusehen. Dies steuert das Attribut »cpu.max« der vereinigten Control-Gruppenhierarchie und »cpu.max« auf der alten. Für Details über dieses Control-Gruppen-Attribut siehe Control-Gruppen v2[2] und CFS-Bandweitensteuerung[4]. Durch Setzen von CPUQuota= auf einen leeren Wert wird keine Quote gesetzt.

Beispiel: CPUQuota=20% stellt sicher, dass der ausgeführte Prozess niemals mehr als 20% CPU-Zeit auf einer CPU erhält.

Hinzugefügt in Version 213.

CPUQuotaPeriodSec=

Diese Einstellung steuert den Controller cpu in der vereinigten Hierarchie.

Weist die Dauer zu, über den die durch CPUQuota= festgelegte CPU-Zeit-Kontingent gemessen wird. Akzeptiert einen Zeitdauerwert in Sekunden mit einer optionalen Endung wie »ms« für Millisekunden (oder »s« für Sekunden). Die Voreinstellung ist 100 ms. Die Periode wird an den durch den Kernel unterstützten Bereich, der [1ms, 1000ms] ist, befestigt. Zusätzlich wird die Periode angepasst, so dass das Kontingent-Intervall auch mindestens 1 ms ist. Wird CPUQuotaPeriodSec= auf einen leeren Wert gesetzt, so wird er auf die Vorgabe zurückgesetzt.

Dies steuert das zweite Feld des Attributs »cpu.max« der vereinigten Control-Gruppenhierarchie und »cpu.cfs_period_us« auf der alten. Für Details über dieses Control-Gruppen-Attribut siehe Control-Gruppen v2[2] und CFS-Auftragsplaner[3].

Beispiel: Mit CPUQuotaPeriodSec=10ms wird erbeten, das CPU-Kontingent in Perioden von 10 ms zu messen.

Hinzugefügt in Version 242.

AllowedCPUs=, StartupAllowedCPUs=

Diese Einstellung steuert den Controller cpuset in der vereinigten Hierarchie.

Beschränkt die Ausführung von Prozessen auf bestimmte CPUs. Akzeptiert eine Liste von CPU-Indicies oder -Bereichen, getrennt durch Leerraum oder Kommata. CPU-Bereiche werden durch den unteren und oberen CPU-Index, getrennt durch einen Bindestrich, angegeben.

Setzen von AllowedCPUs= oder StartupAllowedCPUs= garantiert nicht, dass sämtliche CPUs von den Prozessen verwandt werden, da es durch Eltern-Units eingeschränkt sein könnte. Die wirksame Konfiguration wird durch EffectiveCPUs= berichtet.

Während StartupAllowedCPU= nur für die Hoch- und Runterfahrphasen des Systems gelten, gilt AllowedCPUs= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupAllowedCPUs= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Diese Einstellung wird nur mit der vereinigten Control-Gruppenhierarchie unterstützt.

Hinzugefügt in Version 244.

Speicher-Buchführung und -Steuerung¶

MemoryAccounting=

Diese Einstellung steuert den Controller memory in der vereinigten Hierarchie.

Schaltet Prozess- und Kernelspeicherbuchführung für diese Unit ein. Akzeptiert ein logisches Argument. Beachten Sie, dass das Einschalten der Speicherbuchführung in einer Unit implizit die Buchführung für alle Units in der gleichen Scheibe und für alle ihre Eltern-Scheiben und die darin enthaltenen Units einschaltet. Die Systemvorgabe für diese Einstellung kann mit DefaultMemoryAccounting= in systemd-system.conf(5) gesteuert werden.

Hinzugefügt in Version 208.

MemoryMin=Byte, MemoryLow=Byte, StartupMemoryLow=Byte, DefaultStartupMemoryLow=Byte

Diese Einstellungen steuern den Controller memory in der vereinigten Hierarchie.

Legt den Speicherverwendungsschutz für die ausgeführten Prozesse in dieser Unit fest. Wenn Speicher zurückgewonnen wird, dann wird diese Unit so behandelt, als ob sie weniger Speicher verwenden würde, was dazu führt, dass Speicher bevorzugt von nicht geschützten Units zurückgewonnen wird. Die Verwendung von MemoryLow= führt zu einem schwächeren Schutz, bei dem Speicher weiterhin zurückgewonnen werden kann, um den Aufruf des OOM-Killers zu vermeiden, falls es keinen anderen zurückgewinnbaren Speicher gibt.

Damit ein Schutz wirksam wird, ist es im Allgemeinen notwendig, die entsprechende Zuweisung für alle Vorfahren zu setzen, die dann zwischen den Kindern verteilt wird (mit der Ausnahme der Wurzel-Scheibe). Jede Zuweisung MemoryMin= oder MemoryLow=, die nicht explizit zu den festgelegten Kindern verteilt wird, wird für einen gemeinsamen Schutz für alle Kinder verwandt. Da dies ein gemeinsamer Schutz ist, konkurrieren die Kinder frei um den Speicher.

Akzeptiert eine Speichergröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Speichergröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zum installierten physischen Speicher im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird sämtlicher Speicher geschützt. Dies kann nützlich sein, um immer sämtlichen, bei den Vorgängern aufgewandten Schutz zu erben. Dies steuert das Control-Gruppen-Attribut »memory.min« oder »memory.low«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5].

Durch Angabe von DefaultMemoryMin= oder DefaultMemoryLow= (hat die gleiche Semantik wie MemoryMin= und MemoryLow=) oder DefaultStartupMemoryLow= (hat die gleiche Semantik wie StartupMemoryLow=) können Units ihren Kindern einen Vorgabewert für »memory..min« oder »memory.low« verwenden lassen. Diese Einstellung beeinflusst nicht »memory..min« oder »memory.low« in der Unit selbst. Die Verwendung zum Setzen einer Vorgabe-Zuweisung ist nur auf Kerneln vor 5.7 nützlich, die die Cgroup2-Einhängeoption »memory_recursiveprot« nicht unterstützen.

Während StartupMemoryLow= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemoryMin= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryLow= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Hinzugefügt in Version 240.

MemoryHigh=Byte, StartupMemoryHigh=Byte

Diese Einstellungen steuern den Controller memory in der vereinigten Hierarchie.

Legt die Drosselungs-Speicherverbrauchsbegrenzung der ausgeführten Prozesse in dieser Unit fest. Speicherverbrauch darf diese Begrenzung überschreiten, falls es unvermeidbar ist, aber die Prozesse werden drastisch verlangsamt und der Speicher wird in solchen Fällen aggressiv fortgenommen. Dies ist der Hauptmechanismus, um den Speicherverbrauch einer Unit zu steuern.

Akzeptiert eine Speichergröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Speichergröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zum installierten physischen Speicher im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Speicherdrosselung angewandt. Dies steuert das Control-Gruppen-Attribut »memory.high«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5]. Die wirksame Konfiguration wird als EffectiveMemoryHigh= berichtet (siehe auch EffectiveMemoryMax=).

Während StartupMemoryHigh= für die Hoch- und Runterfahrphase des Systems gilt, gilt MemoryHigh= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryHigh= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Hinzugefügt in Version 231.

MemoryMax=Byte, StartupMemoryMax=Byte

Diese Einstellungen steuern den Controller memory in der vereinigten Hierarchie.

Legt die absolute Grenze der Speicherverwendung durch den ausgeführten Prozess in dieser Unit fest. Falls der Speicherverbrauch nicht unterhalb dieser Grenze gehalten werden kann, wird der Speicherknappheits-Killer innerhalb der Unit aufgerufen. Es wird empfohlen, MemoryHigh= als Hauptsteuermechanismus und MemoryMax= als letzte Verteidigungslinie zu verwenden.

Akzeptiert eine Speichergröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Speichergröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zum installierten physischen Speicher im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Speicherbegrenzung angewandt. Dies steuert das Control-Gruppen-Attribut »memory.max«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5]. Die wirksame Konfiguration wird als EffectiveMemoryMax= berichtet (der Wert ist die strengste Beschränkung der Unit und der Eltern-Scheiben und er wird durch den physischen Speicher nach oben beschränkt).

Während StartupMemoryMax= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemoryMax= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryMax= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Hinzugefügt in Version 231.

MemorySwapMax=Byte, StartupMemorySwapMax=Byte

Diese Einstellungen steuern den Controller memory in der vereinigten Hierarchie.

Legt die absolute Begrenzung bezüglich Auslagerungsverwendung von in dieser Unit ausgeführten Prozessen fest.

Akzeptiert eine Auslagerungsgröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Auslagerungsgröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zur angegebenen Auslagerungsgröße im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Auslagerungsbegrenzung angewandt. Dies steuert das Control-Gruppen-Attribut »memory.swap.max«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5].

Während StartupMemorySwapMax= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemorySwapMax= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemorySwapMax= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Hinzugefügt in Version 232.

MemoryZSwapMax=Byte, StartupMemoryZSwapMax=Byte

Diese Einstellungen steuern den Controller memory in der vereinigten Hierarchie.

Legt die absolute Begrenzung der Verwendung von Zswap der Prozesse in dieser Unit fest. Zswap ist ein leichtgewichtiger Zwischenspeicher für Auslagerungsseiten. Es akzeptiert Seiten, die gerade ausgelagert werden sollen und versucht sie in einen dynamisch reservierten RAM-basierten Speicherbereich zu komprimieren. Falls die festgelegte Begrenzung erreicht wird, werden keine Einträge von dieser Unit mehr in dem Bereich gespeichert, bis bestehende Einträge wieder eingelesen oder auf Platte geschrieben werden. Siehe die Kerneldokumentation für Zswap[6] für weitere Details.

Akzeptiert eine Größe in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Größe in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Begrenzung angewandt. Diese Einstellungen steuern das Control-Gruppen-Attribut »memory.zswap.max«. Für Details über dieses Control-Gruppen-Attribut siehe Speicherschnittstellen-Dateien[5].

Während StartupMemoryZSwapMax= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemoryZSwapMax= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryZSwapMax= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Hinzugefügt in Version 253.

MemoryZSwapWriteback=

Diese Einstellung steuert den Controller memory in der vereinigten Hierarchie.

Akzeptiert ein logisches Argument. Wenn wahr, wird im Zswap-Zwischenspeicher gespeicherten Seiten erlaubt, auf den zugrundeliegenden Speicher geschrieben zu werden, bei falsch nicht. Standardmäßig wahr. Dies ermöglicht es, das Rückschreiben von Zwischenspeicherseiten für E/A-intensive Anwendungen zu deaktivieren, während die Mögilchkeit, komprimierte Seiten in Zswap zu speichern, beibehalten wird. Siehe die Kerneldokumentation zu Zswap[6] zu weiteren Details.

Hinzugefügt in Version 256.

AllowedMemoryNodes=, StartupAllowedMemoryNodes=

Diese Einstellungen steuern den Controller cpuset in der vereinigten Hierarchie.

Beschränkt die Ausführung von Prozessen auf bestimmte Speicher-NUMA-Knoten. Akzeptiert eine Liste von Speicher-NUMA-Knoten oder -Bereichen, getrennt durch Leerraum oder Kommata. Speicher-NUMA-Knotenbereiche werden durch den unteren und oberen NUMA-Knotenindex, getrennt durch einen Bindestrich, angegeben.

Setzen von AllowedMemoryNodes oder StartupAllowedMemoryNodes= garantiert nicht, dass sämtliche Speicher-NUMA-Knoten von den Prozessen verwandt werden, da es durch Eltern-Units eingeschränkt sein könnte. Die wirksame Konfiguration wird durch EffectiveMemoryNodes= berichtet.

Während StartupAllowedMemoryNodes= für die Hoch- und Runterfahrphasen des Systems gilt, gilt AllowedMemoryNodes= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupAllowedMemoryNodes= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.

Diese Einstellung wird nur mit der vereinigten Control-Gruppenhierarchie unterstützt.

Hinzugefügt in Version 244.

Prozess-Buchführung und -Steuerung¶

TasksAccounting=

Diese Einstellung steuert den Controller pids in der vereinigten Hierarchie.

Schaltet Prozessbuchführung für diese Unit ein. Akzeptiert ein logisches Argument. Falls aktiviert, wird der Kernel die Gesamtanzahl der Prozesse in der Unit und ihren Kindern nachverfolgen. Diese Anzahl enthält sowohl Kernel-Threads als auch Benutzerprozesse, wobei jeder Thread einzeln zählt. Beachten Sie, dass das Einschalten der Prozessbuchführung für eine Unit dies implizit auch für alle Units, die in der gleichen Scheibe enthalten sind und für alle Elternscheiben und die darin befindlichen Units einschaltet. Die Systemvorgabe für diese Einstellung kann durch DefaultTasksAccounting= in systemd-system.conf(5) gesteuert werden.

Hinzugefügt in Version 227.

TasksMax=N

Diese Einstellung steuert den Controller pids in der vereinigten Hierarchie.

Legt die maximale Anzahl an Prozessen, die in dieser Unit erstellt werden dürfen, fest. Dies stellt sicher, dass die Anzahl der Prozesse, für die die Unit buchführt (siehe oben), unterhalb einer festgelegten Begrenzung bleibt. Dies akzeptiert entweder eine absolute Anzahl an Prozessen oder einen Prozentwert, der relativ zu der konfigurierten Maximalzahl an Prozessen im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Prozessbegrenzung angewandt. Dies steuert das Control-Gruppen-Attribut »pids.max«. Für Details über dieses Control-Gruppen-Attribut siehe PIDs-Controller[7]. Die wirksame Konfiguration wird als EffectiveTasksMax= berichtet.

Die Systemvorgabe für diese Einstellung kann mit DefaultTasksMax= in systemd-system.conf(5) gesteuert werden.

Hinzugefügt in Version 227.

E/A-Buchführung und -Steuerung¶

IOAccounting=

Diese Einstellung steuert den Controller io in der vereinigten Hierarchie.

Schaltet Block-E/A-Buchführung für diese Unit ein, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert ein logisches Argument. Beachten Sie, dass das Einschalten der Block-E/A-Buchführung für eine Unit dies implizit auch für alle Units, die in der gleichen Scheibe enthalten sind und für alle Elternscheiben und die darin befindlichen Units einschaltet. Die Systemvorgabe für diese Einstellung kann durch DefaultIOAccounting= in systemd-system.conf(5) gesteuert werden.

Hinzugefügt in Version 230.

IOWeight=Gewicht, StartupIOWeight=Gewicht

Diese Einstellungen steueren den Controller io in der vereinigten Hierarchie.

Setzt die vorgegebene Gesamt-Block-E/A-Gewichtung für die ausgeführten Prozesse, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert einen einzelnen Gewichtungswert (zwischen 1 und 10000), um die vorgegebene Block-E/A-Gewichtung zu setzen. Dies steuert das Control-Gruppen-Attribut »io.weight«, das standardmäßig 100 beträgt. Für Details über dieses Control-Gruppen-Attribut, siehe E/A-Schnittstellen-Dateien[8]. Die verfügbare E/A-Bandbreite wird zwischen allen Units innerhalb einer Scheibe relativ zu ihrer Block-E/A-Gewichtung aufgeteilt. Ein höherer Wert bedeutet mehr E/A-Bandbreite, ein geringerer Wert weniger.

Während StartupIOWeight= in der Hoch- und Runterfahrphase des Systems angewandt wird, wird IOWeight= später zur Laufzeit des Systems angewandt und falls erstere nicht gesetzt ist, auch während der Hoch- und Runterfahrphasen. Dies erlaubt es, bestimmte Dienste beim Hoch- und Runterfahren anders als zur Laufzeit zu priorisieren.

Hinzugefügt in Version 230.

IODeviceWeight=Gerät Gewicht

Diese Einstellung steuert den Controller io in der vereinigten Hierarchie.

Setzt die gerätebezogene Gesamt-Block-E/A-Gewichtung für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert ein Leerzeichen-getrenntes Paar eines Dateipfades und eines Gewichtungswertes, um den gerätespezifischen Gewichtungswert zwischen 1 und 10000 festzulegen. (Beispiel: "/dev/sda 1000"). Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Dies steuert das Control-Gruppen-Attribut »io.weight«, das standardmäßig 100 ist. Verwenden Sie diese Option mehrfach, um Gewichtungen für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].

Der festgelegte Geräteknoten sollte ein Blockgerät referenzieren, der einen E/A-Scheduler zugeordnet hat, d.h. er sollte sich nicht auf eine Partition oder Loopback-Blockgeräte beziehen, sondern auf das ursprüngliche, physische Gerät. Wenn ein Pfad zu einer regulären Datei oder einem regulären Verzeichnis angegeben wird, wird versucht, das korrekte ursprüngliche, zugrundeliegende Geräte für den festgelegten Pfad zu entdecken. Dies funktioniert nur für die einfacheren Fälle korrekt, bei denen das Dateisystem direkt auf einer Partition oder einem physischen Blockgerät angelegt ist, oder bei denen einfache 1:1-Verschlüsselung mittels dm-crypt/LUKS verwandt wird. Diese Erkennung deckt komplexe Speicher und insbesondere RAID und Datenträger-Verwaltungs-Speichergeräte nicht ab.

Hinzugefügt in Version 230.

IOReadBandwidthMax=Gerät Byte, IOWriteBandwidthMax=Gerät Byte

Diese Einstellungen steueren den Controller io in der vereinigten Hierarchie.

Setzt die gerätebezogene maximale Gesamt-Block-E/A-Bandbreitenbegrenzung für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Diese Begrenzung ist nicht arbeitserhaltend und den ausgeführten Prozessen wird nicht mehr erlaubt, selbst falls das Gerät Leerlaufkapazität hat. Akzeptiert ein Leerzeichen-getrenntes Paar eines Dateipfades und eines Bandbreitenwertes (in Byte pro Sekunde), um die gerätespezifische Bandbreite festzulegen. Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Falls der Bandbreite K, M, G oder T angehängt ist, wird die Bandbreite als Kilobyte, Megabyte, Gigabyte bzw. Terabyte zu der Basis 1000 ausgewertet. (Beispiel: »/dev/disk/by-path/pci-0000:00:1f.2-scsi-0:0:0:0 5M«). Dies steuert das Control-Gruppen-Attribut »io.max«. Verwenden Sie diese Option mehrfach, um Bandbreitenbegrenzungen für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].

Ähnliche Beschränkungen für die Blockgeräte-Erkennung gelten wie bei IODeviceWeight=, siehe oben.

Hinzugefügt in Version 230.

IOReadIOPSMax=Gerät EAPS, IOWriteIOPSMax=Gerät EAPS

Diese Einstellungen steueren den Controller io in der vereinigten Hierarchie.

Setzt die gerätebezogene maximale Gesamt-Block-E/A-EA-Pro-Sekunden-Begrenzung für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Diese Begrenzung ist nicht arbeitserhaltend und den ausgeführten Prozessen wird nicht mehr als dieser Wert erlaubt, selbst falls das Gerät Leerlaufkapazität hat. Akzeptiert ein Leerzeichen-getrenntes Paar eines Dateipfades und eines EAPS-Wertes, um den gerätespezifischen EAPS festzulegen. Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Falls dem EAPS K, M, G oder T angehängt ist, wird der EAPS als KiloEAPS, MegaEAPS, GigaEAPS bzw. TeraEAPS zu der Basis 1000 ausgewertet. (Beispiel: »/dev/disk/by-path/pci-0000:00:1f.2-scsi-0:0:0:0 1K«). Dies steuert das Control-Gruppen-Attribut »io.max«. Verwenden Sie diese Option mehrfach, um EAPS-Begrenzungen für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].

Ähnliche Beschränkungen für die Blockgeräte-Erkennung gelten wie bei IODeviceWeight=, siehe oben.

Hinzugefügt in Version 230.

IODeviceLatencyTargetSec=Gerät Ziel

Diese Einstellung steuert den Controller io in der vereinigten Hierarchie.

Setzt die gerätebezogene durchschnittliche Ziel-E/A-Latenz für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert einen Dateipfad und eine Zeitspanne, getrennt durch ein Leerzeichen, um das gerätespezifische Latenzziel festzulegen. (Beispiel: "/dev/sda 25ms"). Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Dies steuert das Control-Gruppen-Attribut »io.latency«. Verwenden Sie diese Option mehrfach, um Latenzziele für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].

Impliziert »IOAccounting=yes«.

Diese Einstellungen werden nur unterstützt, falls die vereinigte Control-Gruppenhierarchie verwandt wird.

Ähnliche Beschränkungen für die Blockgeräte-Erkennung gelten wie bei IODeviceWeight=, siehe oben.

Hinzugefügt in Version 240.

Netzwerk-Buchführung und -Steuerung¶

IPAccounting=

Akzeptiert ein logisches Argument. Falls wahr, wird die IPv4- und IPv6-Netzwerkverkehrsbuchführung für Pakete, die von dieser Unit gesandt oder empfangen werden, eingeschaltet. Wenn diese Option eingeschaltet wird, erfolgt für alle von einem der Prozesse der Unit erstellten IPv4- und IPv6-Sockets die Buchführung.

Wenn diese Option in Socket-Units verwandt wird, wird sie auf alle hierzu zugeordneten IPv4- und IPv6-Socket (einschließlich der auf Anfragen wartenden und der Verbindugssockets, wo dies zutrifft) angewandt. Beachten Sie, dass für Socket-aktivierte Dienste diese Konfigurationseinstellung und die Buchuführungsdaten der Dienste-Unit und der Socket-Unit getrennt bleiben und getrennt dargestellt werden. Es erfolgt keine Weitergabe der Einstellung und der gesammelten Daten, in keine Richtung. Zudem wird sämtlicher Verkehr, der auf einem der Sockets der Socket-Unit empfangen oder gesandt wird für die Socket-Unit buchgeführt — und niemals für die Dienste-Unit, die sie aktiviert haben könnte, selbst falls der Socket von dieser verwandt wird.

Die Systemvorgabe für diese Einstellung kann mit DefaultIPAccounting= in systemd-system.conf(5) gesteuert werden.

Beachten Sie, dass diese Funktionalität derzeit nur für Systemdienste und nicht für benutzerbezogene Dienste verfügbar ist.

Hinzugefügt in Version 235.

IPAddressAllow=ADRESSE[/PRÄFIXLÄNGE]…, IPAddressDeny=ADRESSE[/PRÄFIXLÄNGE]…

Schaltet Netzwerkverkehrsfilterung für IP-Pakete, die über AF_INET- und AF_INET6-Sockets gesandt oder empfangen werden, ein. Beide Anweisungen akzeptieren eine Leerzeichen-getrennte Liste von IPv4- oder IPv6-Adressen, an jede kann optional eine Adresspräfixlänge in Bits nach einem Zeichen »/« angehängt werden. Falls die Endung entfällt, wird die Adresse als Rechneradresse betrachtet, d.h. der Filter deckt die gesamte Adresse ab (32 Bit für IPv4, 128 Bit für IPv6).

Die mit dieser Option konfigurierten Zugriffslisten werden auf allen von dieser Unit erstellten Sockets (oder im Falle von Socket-Units, allen der Unit zugeordneten) angewandt. Die Liste wird implzit mit jeder für irgendeine Elternscheibe, bei der diese Unit Mitglied sein könnte, kombiniert. Standardmäßig sind beide Zugriffslisten leer. Durch diese Einstellung wird sowohl ein- als auch ausgehender Verkehr gefiltert. Im Falle des eingehenden Verkehrs wird die Quell-IP-Adresse gegen diese Zugriffslisten geprüft, im Falle des ausgehenden Verkehrs wird die Ziel-IP-Adresse geprüft. Die folgenden Regeln werden nacheinander angewandt:

•Falls die überpüfte IP-Adresse auf einen Eintrag in der Einstellung IPAddressAllow= passt, wird der Zugriff erlaubt.

•Falls die überprüfte IP-Adresse auf einen Eintrag in der Liste IPAddressDeny= passt, wird andernfalls der Zugriff verweigert.

•Andernfalls wird der Zugriff gewährt.

Um eine IP-Firewall mit Positivliste zu implementieren, wird empfohlen, eine Einstellung IPAddressDeny=any in einer höherstufigen Scheiben-Unit (wie der Wurzel-Scheibe -.slice oder der Scheibe, die alle Systemdienste enthält, system.slice – siehe systemd.special(7) für Details über diese Scheiben-Units) zu verwenden, ergänzt um individuelle, dienstebezogene IPAddressAllow=-Zeilen, die Netzwerkzugriff auf relevante Dienste, und nur diese, erlauben.

Beachten Sie, dass für Socket-aktivierte Dienste die IP-Zugriffsliste, die in der Socket-Unit konfiguriert ist, auf alle direkt zugeordneten Sockets angewandt wird, aber nicht auf irgendein Socket, das von den dafür schließlich aktivierten Diensten erstellt wurde. Umgekehrt werden die für die Dienste konfigurierten IP-Zugriffslisten nicht auf irgendein Socket angewandt, das dem Dienst über Socket-Aktivierung weitergegeben wird. Daher ist es im Allgemeinen eine gute Idee, die IP-Zugriffsliste sowohl in der Socket- als auch der Dienste-Unit zu replizieren. Es kann sinnvoll sein, eine Liste offener und eine Liste beschränkter zu verwalten, abhängig vom Einsatzfall.

Falls diese Einstellungen mehrfach in der gleichen Unit verwandt werden, werden die angegebenen Listen kombiniert. Falls diesen Einstellungen eine leere Zeichenkette zugewiesen wird, werden die angegebenen Zugriffslisten zurückgesetzt und alle vorherigen Einstellungen aufgehoben.

Anstelle expliziter IPv4- oder IPv6-Adressen und Präfixlängenfestlegungen kann auch eine kleine Gruppe von symbolischen Namen verwandt werden. Die folgenden Namen sind definiert:

Tabelle 1. Besondere Adress-/Netzwerknamen

Symbolischer Name	Definition	Bedeutung
any	0.0.0.0/0 ::/0	jeder Rechner
localhost	127.0.0.0/8 ::1/128	alle Adressen auf dem lokalen Loopback
link-local	169.254.0.0/16 fe80::/64	alle linklokalen IP-Adressen
multicast	224.0.0.0/4 ff00::/8	alle IP-multicasting-Adressen

Beachten Sie, dass diese Einstellungen auf einigen Systemen nicht unterstützt werden könnten (beispielsweise falls eBPF-Control-Gruppen-Unterstützung nicht im unterliegenden Kernel oder Container-Verwalter aktiviert ist). Diese Einstellungen haben in diesem Fall keine Auswirkung. Falls Kompatibilität mit solchen Systemen gewünscht ist, wird daher empfohlen, sich nicht exklusiv auf sie für IP-Sicherheit zu verlassen.

Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.

Hinzugefügt in Version 235.

SocketBindAllow=Binderegel, SocketBindDeny=Binderegel

Konfiguriert Beschränkungen für die Fähigkeit von Unit-Prozessen, bind(2) auf einem Socket aufzurufen. Beide erlauben die Definition von »allow«- und »deny«-Regeln, die die Adressen, an die ein Socket gebunden werden kann, beschränken.

Binderegel beschreibt Socket-Eigenschaften wie Adressfamilie, Transportprotokoll und IP-Ports.

Binderegel := { [Adressfamilie:][Transportprotokoll:][IP-Ports] | any }

Adressfamilie := { ipv4 | ipv6 }

Transportprotokoll := { tcp | udp }

IP-Ports:= { IP-Port | IP-Port-Bereich }

Eine optionale Adressfamilie erwartet die Werte ipv4 oder ipv6. Falls nicht angegeben, passt eine Regel auf sowohl IPv4- als auch IPv6-Adressen und wird abhängig von anderen Socket-Felder angewendet, z.B. Transportprotokoll, IP-Port.

Ein optionales Transportprotokoll erwartet den Transportprotokollnamen tcp oder udp. Falls nicht festgelegt, passt eine Regel auf jedes Transportprotokoll.

Ein optionaler Wert IP-Port muss innerhalb des Intervalls 1…65535 (einschließlich) liegen, d.h. der dynamische Port 0 ist nicht erlaubt. Ein Bereich von fortlaufenden Ports wird durch IP-Port-Bereich IP-Port-niedrig-IP-Port-hoch beschrieben, wobei IP-Port-niedrig kleiner oder gleich IP-Port-hoch ist und beide innerhalb von 1…65535 (einschließlich) liegen.

Ein besonderer Wert any kann zum Anwenden einer Regel für jede Adressfamilie, jedes Transportprotokoll und jeden Port mit einem positiven Wert verwandt werden.

Um mehrere Regeln zu erlauben, weisen Sie SocketBindAllow= oder SocketBindDeny= mehrfach zu. Um eine Zuweisung zurückzusetzen, übergeben Sie eine leere Zuweisung SocketBindAllow= oder SocketBindDeny=.

Für sowohl SocketBindAllow= als auch SocketBindDeny= ist die maximale Anzahl an Zuweisungen 128.

•Anbinden an ein Socket wird erlaubt, wenn die Socket-Adresse auf einen Eintrag in der Liste SocketBindAllow= passt.

•Andernfalls wir das Anbinden verweigert, falls die Socket-Adresse auf einen Eintrag in der Liste SocketBindDeny= passt.

•Andernfalls wird das Anbinden erlaubt.

Die Funktionalität ist mit Cgroup-BPF-Hooks cgroup/bind4 und cgroup/bind6 implementiert.

Beachten Sie, dass diese Einstellungen für jeden Systemaufruf durch den Unit-Prozess von bind(2) gilt, unabhängig davon, in welchem Netzwerknamensraum er erfolgt. Oder mit anderen Worten: Das Ändern des Netzwerknamensraums ist kein geeigneter Mechanismus, um diesen Einschränkungen bei bind() zu entkommen.

Beispiele:

...
# Erlaubt das Anbinden von IPv6-Socket-Adressen mit Ports größer oder gleich 10000.
[Service]
SocketBindAllow=ipv6:10000-65535
SocketBindDeny=any
…
# Erlaubt das Anbinden von IPv4- und IPv6-Socket-Adressen mit 1234 und 4321 Ports.
[Service]
SocketBindAllow=1234
SocketBindAllow=4321
SocketBindDeny=any
…
# Verweigert das Anbinden von IPv6-Socket-Adressen.
[Service]
SocketBindDeny=ipv6
…
# Verweigert das Anbinden von IPv4- und IPv6-Socket-Adressen.
[Service]
SocketBindDeny=any
…
# Erlaubt das Anbinden nur über TCP
[Service]
SocketBindAllow=tcp
SocketBindDeny=any
…
# Erlaubt das Anbinden nur über IPv6/TCP
[Service]
SocketBindAllow=ipv6:tcp
SocketBindDeny=any
…
# Erlaubt das Anbinden von Ports innerhalb des Bereichs 10000-65535 über IPv4/UDP.
[Service]
SocketBindAllow=ipv4:udp:10000-65535
SocketBindDeny=any
…

Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.

Hinzugefügt in Version 249.

RestrictNetworkInterfaces=

Akzeptiert eine Leerzeichen-getrennte Liste von Netzwerkschnittstellennamen. Diese Option beschränkt die Netzwerkschnittstellen, die Prozesse dieser Unit verwenden können. Standardmäßig können Prozesse nur die aufgeführten Netzwerknamen verwenden (Erlaubnisliste). Falls das erste Zeichen der Regel eine »~« ist, dann wird die Auswirkung invertiert: die Prozesse können nur Netzwerkschnittstellen verwenden, die nicht aufgeführt sind (Verbotsliste).

Diese Option kann mehrfach aufauchen, dann werden die Netzwerkschnittstellennamen vereinigt. Falls die leere Zeichenkette zugewiesen wird, wird die Gruppe zurückgesetzt, alle vorherigen Zuweisungen haben keine Wirkung.

Falls Sie beide Typen dieser Option festlegen (d.h. Erlaubnisliste und Verbotsliste), wird die zuerst vorkommende Vorrang haben und die Standardaktion vorgeben (erlauben oder verbieten). Dann wird das nächste Vorkommen dieser Option die aufgeführten Netzwerkschnittstellennamen zu der Menge hinzufügen oder sie daraus entfernen, abhängig von seinem Typ und der Vorgabeaktion.

Die Loopback-Schnittstelle (»lo«) wird auf keine Weise besonders behandelt, Sie müssen sie explizit in der Unit-Datei konfigurieren.

Beispiel 1: Erlaubnisliste

RestrictNetworkInterfaces=eth1
RestrictNetworkInterfaces=eth2

Programme in dieser Unit-Datei werden nur in der Lage sein, die Netzwerkschnittstellen eth1 und eth2 zu verwenden.

Beispiel 2: Verbotsliste

RestrictNetworkInterfaces=~eth1 eth2

Programme in dieser Unit-Datei werden in der Lage sein, alle Netzwerkschnittstellen außer eth1 und eth2 zu verwenden.

Beispiel 3: gemischt

RestrictNetworkInterfaces=eth1 eth2
RestrictNetworkInterfaces=~eth1

Programme in der Unit-Datei werden nur in der Lage sein, die Netzwerkschnittstelle eth2 zu verwenden.

Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.

Hinzugefügt in Version 250.

NFTSet=Familie:Tabelle:Gruppe

Diese Einstellung stellt eine Methode zur Integration dynamischer Cgroup-, Benutzer- und Gruppenkennungen in Firewallregeln mittels NFT[9]-Gruppen bereit. Der Vorteil der Verwendung dieser Einstellung liegt darin, dass die Kennungen leicht als Auswahlmerkmal in Firewallregeln verwandt werden kann, wodurch in Folge feiner granulares Filtern ermöglicht wird. NFT-Regeln für Cgroup-Vergleiche verwenden numerische Cgroup-Kennungen, die sich bei jedem Neustart eines Dienstes ändern, wodurch sie in Systemdumgebungen andernfalls schwer zu verwenden sind. Von DynamicUser= verwandte dynamische und zufällige Kennungen können ebenfalls mit dieser Einstellung integriert werden.

Diese Option erwartet eine durch Leerraum getrennte Liste von NFT-Gruppendefinitionen. Jede Definition besteht aus einem Doppelpunkt-getrennten Tupel von Quelltyp (einer aus »cgroup«, »user«, »group«), NFT-Adressfamilie (einer aus »arp«, »bridge«, »inet«, »ip«, »ip6«, »netdev«), Tabellenname und Gruppenname. Die Namen der Tabellen und Gruppen müssen den lexikalischen Beschränkungen von NFT-Tabellennamen folgen. Der Typ des in NFT-Filtern verwandten Elements muss auf den durch die Direktive (»cgroup«, »user« oder »group«) implizierten Typ passen, wie in der nachfolgenden Tabelle gezeigt. Wenn eine Control-Gruppe oder eine Unit realisiert wird, wird die entsprechende Kennung an die NFT-Gruppen angehängt und sie wird entfernt, wenn die Control-Gruppe oder Unit entfernt wird. systemd fügt nur Elemente in die Gruppen ein (entfernt sie daraus), daher müssen die NFT-Regeln, -Tabllen und -Gruppen vorher woanders erstellt werden. Fehler beim Verwalten der Gruppen werden ignoriert.

Tabelle 2. Definierte Quelltyp-Werte

Quelltyp	Beschreibung	Entsprechender NFT-Typname
"cgroup"	Control-Gruppen-Kennung	"cgroupsv2"
"user"	Benutzerkennung	"meta skuid"
"group"	Gruppenkennung	"meta skgid"

Falls die Firewallregeln neu installiert werden, so dass die NFT-Gruppen zerstört werden, kann der Befehl systemctl daemon-reload zur Wiederbefüllung der Gruppen verwandt werden.

Beispiel:

[Unit]
NFTSet=cgroup:inet:filter:my_service user:inet:filter:serviceuser

Entsprechende NFT-Regeln:

table inet filter {


        set my_service {


                type cgroupsv2


        }


        set serviceuser {


                typeof meta skuid


        }


        chain x {


                socket cgroupv2 level 2 @my_service accept


                drop


        }


        chain y {


                meta skuid @serviceuser accept


                drop


        }
}

Diese Option ist nur für Systemdienste verfügbar und wird nicht für Dienste unterstützt, die in benutzerbezogenen Instanzen des Diensteverwalters laufen.

Hinzugefügt in Version 255.

BPF-Programme¶

IPIngressFilterPath=BPF_FS_PROGRAM_PATH, IPEgressFilterPath=BPF_FS_PROGRAM_PATH

Fügt angepasste Netzwerkverkehrsfilter hinzu, die als BPF-Programme implementiert und auf alle über AF_INET- und AF_INET6-Sockets gesandten und empfangenen IP-Pakete angewandt werden. Akzeptiert einen absoluten Pfad zu einem im virtuellen BPF-Dateisystem ((/sys/fs/bpf/) verankerten BPF-Programm.

Die mit dieser Option konfigurierten Filter werden auf allen von dieser Unit erstellten Sockets (oder im Falle von Socket-Units, allen der Unit zugeordneten) angewandt. Die Filter werden zusätzlich zu den Filter aller Eltern-Scheiben-Units, bei denen diese Unit ein Mitglied sein könnte, sowie sämtlichen IPAddressAllow=- und IPAddressDeny=-Filtern in jeden dieser Units geladen. Standardmäßig sind keine Filter festgelegt.

Falls diese Einstellungen mehrfach in der gleichen Unit verwandt werden, werden alle angegebenen Programme angehängt. Falls diesen Einstellungen eine leere Zeichenkette zugewiesen wird, wird die Programmliste zurückgesetzt und alle vorher angegebenen Programme ignoriert.

Falls der Pfad BPF_FS_PROGRAM_PATH in der Zuweisung IPIngressFilterPath= bereits durch einen Eingangs-Hook BPFProgram= gehandhabt wird, z.B. BPFProgram=ingress:BPF_FS_PROGRAM_PATH, dann wird die Zuweisung immer noch als gültig betrachtet und das Programm an eine Cgroup angehängt. Genauso für den Pfad IPEgressFilterPath= und den Hook egress.

Beachten Sie, dass für Socket-aktivierte Dienste die IP-Filterprogramme, die in der Socket-Unit konfiguriert sind, auf alle direkt zugeordneten Sockets angewandt werden, aber nicht auf irgendein Socket, das von den dafür schließlich aktivierten Diensten erstellt wurde. Umgekehrt werden die für die Dienste konfigurierten IP-Filterprogramme nicht auf irgendein Socket angewandt, das dem Dienst über Socket-Aktivierung weitergegeben wird. Daher ist es im Allgemeinen eine gute Idee, die IP-Filterprogramme sowohl in der Socket- als auch der Dienste-Unit zu replizieren, allerdings ergibt es oft Sinn, eine Konfiguration offener und eine andere beschränkter zu verwalten, abhängig vom Einsatzfall.

Beachten Sie, dass diese Einstellungen auf einigen Systemen nicht unterstützt werden könnten (beispielsweise falls eBPF-Control-Gruppen-Unterstützung nicht im unterliegenden Kernel oder Container-Verwalter aktiviert ist). Diese Einstellungen führen in diesem Fall zu einem Fehlschlag des Dienstes. Falls Kompatibilität mit solchen Systemen gewünscht ist, wird daher empfohlen, ihre Filter manuell (benötigt Delegate=yes) anzuhängen, statt diese Einstellung zu verwenden.

Hinzugefügt in Version 243.

BPFProgram=Typ:Programmpfad

BPFProgram= erlaubt das Anhängen von angepassten BPF-Programmen an die Cgroup einer Unit. (Dies verallgemeinert die mittels IPEgressFilterPath= und IPIngressFilterPath= für andere Hooks offengelegte Funktionalität.) Cgroup-bpf-Hooks in der Form von BPF-Programmen, die in das BPF-Dateisystem geladen werden, werden mit den durch die Unit ermittelten Cgroup-Bpf-Anhänge-Schaltern angehängt. Für Details über Anhänge-Typen und Schalter siehe bpf.h[10]. Schauen Sie auch in die allgemeine BPF-Dokumentation[11].

Die Spezifikation eines BPF-Programms besteht aus einem Paar aus BPF-Programmtyp und -Programmpfad im Dateisystem, wobei »:« der Trenner ist: Typ:Programmpfad.

Der BPF-Programmtyp ist äquivalent zu dem in bpftool(8) verwandten BPF-Anhängetyp. Er kann sein: egress, ingress, sock_create, sock_ops, device, bind4, bind6, connect4, connect6, post_bind4, post_bind6, sendmsg4, sendmsg6, sysctl, recvmsg4, recvmsg6, getsockopt oder setsockopt.

Der festgelegte Programmpfad muss ein absoluter Pfad sein, der eine BPF-Programm-Inode in dem bpffs-Dateisystem referenziert (dies bedeutet im Allgemeinen, dass er mit »/sys/fs/bpf/« beginnt). Falls ein festgelegtes Programm nicht existiert (d.h. es noch nicht in das BPF-Subsystem des Kernels hochgeladen wurde), wird es nicht installiert, aber mit der Unit-Aktivierung wird fortgefahren (in die Protokolle wird eine Warnung ausgegeben).

Durch Setzen von BPFProgram= auf einen leeren Wert werden vorherige Zuweisungen unwirksam.

Mehrfache Zuweisungen des gleichen Werts Programmtyp/Pfad-Paar haben die gleiche Auswirkung wie eine einzelne Zuweisung: Das Programm wird nur einmal angehängt.

Falls das auf Programmpfad befestigte BPF-egress bereits durch IPEgressFilterPath= behandelt wird, wird die Zuweisung BPFProgram= als gültig betrachtet und BPFProgram= an eine Cgroup angehängt. Ähnlich für den Hook ingress die Zuweisung IPIngressFilterPath=.

Mit BPFProgram= übergebene BPF-Programme werden an die Cgroup einer Unit mit dem BFP-Anhängeschalter multi angehängt, der weitere Anhängungen des gleichen Typs innerhalb der Cgroup-Hierarchie mit der Unit-Cgroup an der Spitze erlaubt.

Beispiele:

BPFProgram=egress:/sys/fs/bpf/egress-hook
BPFProgram=bind6:/sys/fs/bpf/sock-addr-hook

Hinzugefügt in Version 249.

Gerätezugriff¶

DeviceAllow=

Steuert Zugriff auf bestimmte Geräteknoten durch ausgeführte Prozesse. Akzeptiert zwei Leerzeichen-getrennte Zeichenketten: einen Geräteknotenkennzeichner, gefolgt von einer Kombination aus r, w, m, um das Lesen, Schreiben bzw. Erstellen von bestimmten Geräteknoten der Unit (mit mknod) zu steuern. Diese Funktionalität ist mittels eBPF-Filterung implementiert.

Wenn der Zugriff auf alle physischen Geräte verboten werden soll, kann stattdessen PrivateDevices= verwandt werden. Siehe systemd.exec(5).

Der Geräteknotenkennzeichner ist entweder ein Pfad zu einem Geräteknoten in dem Dateisystem, beginnend mit /dev/, oder eine Zeichenkette, die entweder mit »char-« oder »block-« beginnt und von einem Gerätegruppennamen, wie in /proc/devices aufgeführt, gefolgt wird. Letzteres ist nützlich, um eine Positivliste aller aktuellen und zukünftigen Geräte, die zu einer bestimmten Gerätegruppe gehören, auf einmal anzulegen. Die Gerätegruppe wird entsprechend der Dateinamen-Glob-Muster-Regeln abgeglichen, Sie können daher die Metazeichen »*« und »?« verwenden. (Beachten Sie, dass solche Glob-Metazeichen nicht für Geräteknotenpfadspezifikationen verfügbar sind) Um Geräteknoten gemäß Major-/Minor-Nummern abzugleichen, verwenden Sie Geräteknotenpfade in den Verzeichnissen /dev/char/ und /dev/block/. Allerdings wird das Abgleichen von Geräten mittels Major-/Minor-Nummer im Allgemeinen nicht empfohlen, da die Zuweisungen zwischen Systemen oder verschiedenen Kernelversionen weder stabil noch portierbar sind.

Beispiel: /dev/sda5 ist ein Pfad zu einem Geräteknoten, der sich auf ein ATA- oder SCSI-Blockgerät bezieht. »char-pts« und »char-alsa« sind Kennzeichner für alle Pseudo-TTY- bzw. alle ALSA-Sound-Geräte. »char-cpu/*« ist ein Kennzeichner, der auf alle Gerätegruppen mit CPU-Bezug passt.

Beachten Sie, dass auf diese Weise definierte Positivlisten nur Gerätegruppen referenzieren sollten, die zum Startzeitpunkt der Unit auflösbar sind. Sämtliche Geräte, die zu diesem Zeitpunkt nicht auflösbar sind, werden nicht zur Positivliste hinzugefügt. Um diese Einschränkung zu umgehen, können Sie Dienste-Units um eine Paar von After=modprobe@xyz.service- und Wants=modprobe@xyz.service-Zeilen ergänzen, die die notwendigen Kernelmodule laden, die die Gerätegruppe implementieren, falls sie fehlen. Beispiel:

...
[Unit]
Wants=modprobe@loop.service
After=modprobe@loop.service
[Service]
DeviceAllow=block-loop
DeviceAllow=/dev/loop-control
…

Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.

Hinzugefügt in Version 208.

DevicePolicy=auto|closed|strict

Steuert die Richtlinien zum Erlauben des Gerätezugriffs:

strict

bedeutet, nur Zugriffstypen zu erlauben, die explizit festgelegt wurden.

Hinzugefügt in Version 208.

closed

erlaubt zusätzlich Zugriff auf die Standard-Pseudo-Geräte einschließlich /dev/null, /dev/zero, /dev/full, /dev/random und /dev/urandom.

Hinzugefügt in Version 208.

auto

erlaubt zusätzlich Zugriff auf alle Geräte, falls kein explizites DeviceAllow= vorhanden ist. Dies ist die Vorgabe.

Hinzugefügt in Version 208.

Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.

Hinzugefügt in Version 208.

Control-Gruppen-Verwaltung¶

Slice=

Der Name der Scheiben-Unit, in die die Unit hineingelegt werden soll. Standardmäßig system.slice für alle noch nicht instanziierten Units aller Unit-Typen (außer für Scheiben-Units selbst, siehe unten). Instanzen-Units werden standardmäßig in eine Unterscheibe von system.slice gelegt, die nach dem Vorlagennamen benannt ist.

Diese Option kann zur Anordnung von Systemd-Units in einer Hierarchie von Scheiben verwandt werden, bei der bei jeder Scheibe Ressourceneinstellungen angewandt werden können.

Für Units vom Typ »Scheibe« ist der einzige für diese Einstellung akzeptierte Wert die Elternscheibe. Da der Name einer Scheiben-Unit die Elternscheibe impliziert, ist es daher immer redundant, diesen Parameter direkt für Scheiben-Units zu setzen.

Besondere Vorsicht sollten Sie walten lassen, wenn Sie sich auf die Vorgabe-Scheibenzuweisung in vorlagenbasierten Dienste-Units, die DefaultDependencies=no gesetzt haben, verlassen, siehe systemd.service(5) Abschnitt »Standardabhängigkeiten« für Details.

Hinzugefügt in Version 208.

Delegate=

Schaltet die Delegierung weiterer Ressourcensteuereinteilung auf die Prozesse der Unit ein. Units, bei denen dieses aktiviert ist, können ihre eigene private Unterhierarchie von Control-Gruppen unterhalb der Control-Gruppe der Unit selbst einrichten und verwalten. Für nicht privilegierte Dienste (d.h. solchen, die die Einstellung User= verwenden), erhält der relevante Benutzer Zugriff auf die Control-Gruppe der Unit.

Wenn dies aktiviert ist, wird der Diensteverwalter es unterlassen, die Control-Gruppen zu verändern oder Prozesse unterhalb der Control-Gruppe der Unit zu verschieben, so dass ein klares Konzept der Eigentümerschaft etabliert wird: der Control-Gruppenbaum auf der Ebene der Control-Gruppe der Unit ond oberhalb (d.h. in Richtung der Wurzel-Control-Gruppe) gehört dem Diensteverwalter des Rechners und wird von ihm verwaltet, während der Control-Gruppenbaum unterhalb der Control-Gruppe der Unit der Unit selbst gehört und von dieser verwaltet wird.

Akzeptiert entweder ein logisches Argument oder eine (möglicherweise leere) Liste von Namen von Control-Gruppen-Controllern. Falls wahr, wird die Delegierung eingeschaltet und alle für die Unit unterstützten Controller werden aktiviert, wodurch sie für die Verwaltung der Prozesse der Unit verfügbar werden. Falls falsch, wird die Delegierung komplett ausgeschaltet (und keine zusätzlichen Controller werden aktiviert). Falls auf eine Liste von Controllern gesetzt, wird die Delegierung eingeschaltet und die festgelegten Controller werden für die Unit aktiviert. Zuweisung der leeren Liste wird Delegierung aktivieren, aber die Liste der Controller zurücksetzen, und alle vorherigen Zuweisungen haben keine Auswirkung. Beachten Sie, dass andere als die festgelegten Controller auch verfügbar gemacht werden können, abhängig von der Konfiguration der enthaltenen Scheibe oder anderer, darin enthaltener Units. Standardmäßig falsch.

Beachten Sie, dass Controller-Delegation an weniger privilegierten Code nur auf der vereinigten Control-Gruppenhierarchie sicher ist. Entsprechend wird der Zugriff auf die angegebenen Controller nicht an unprivilegierte Dienste auf der veralteten Hierarchie gewährt, selbst falls dies angefragt wurde.

Die folgenden Controller-Namen können festgelegt werden: cpu, cpuacct, cpuset, io, blkio, memory, devices, pids, bpf-firewall, und bpf-devices.

Nicht alle dieser Controller sind allerdings auf allen Kerneln verfügbar und einige sind spezifisch für die vereinigte Hierarchie, während andere für die veraltete Hierarchie spezifisch sind. Beachten Sie auch, dass der Kernel weitere Controller unterstützen könnte, die hier noch nicht berücksichtigt sind, da Delegation hierfür überhaupt noch nicht unterstützt wird oder noch nicht sauber definiert ist.

Beachten Sie, dass aufgrund der hierarchischen Natur der Cgroup-Hierarchie alle delegierten Controller für die Eltern- und Geschwister-Units der Units der Delegierung aktiviert werden.

Für weitere Details über das Delegationsmodell ziehen Sie bitte Control-Gruppen-APIs und Delegierung[12] heran.

Hinzugefügt in Version 218.

DelegateSubgroup=

Legt Unit-Prozesse in die festgelegte Untergruppe der Control-Gruppe der Unit ab. Akzeptiert den Namen einer gültigen Control-Gruppe (nicht den Pfad!) als Parameter oder eine leere Zeichenkette, um diese Funktionalität abzuschalten. Standardmäßig abgeschaltet. Der Name der Control-Gruppe muss als Dateiname benutzbar sein und Konflikte mit den Control-Gruppen-Attributdateien des Kernels vermeiden (d.h. cgroup.procs kann nicht als Name akzeptiert werden, da der kernel eine native Control-Gruppen-Attributdatei mit dem Namen offenlegt). Diese Option hat nur Auswirkungen, wenn die Control-Gruppendelegation mittels Delegate= eingeschaltet ist, siehe oben. Beachten Sie, dass diese Einstellung nur für den »Haupt«-Prozess einer Unit gilt, d.h. für Dienste auf ExecStart=, aber nicht für ExecReload= und ähnliche. Falls Delegierung aktiviert ist, wird letztere immer innerhalb einer Untergruppe namens ».control« abgelegt. Die festgelegte Untergruppe wird automatisch erstellt (und möglicherweise die Eigentümerschaft an die für die Unit konfigurierten Benutzer/Gruppen abgegeben), wenn darin ein Prozess gestartet wird.

Diese Option ist nützlich, um das manuelle Verschieben des aufgerufenen Prozesses in eine Untergruppe zu vermeiden, nachdem dieser gestartet wurde. Da kein Prozess in den inneren Inodes der Control-Gruppenbaumes leben sollte, ist es fast immer notwendig, den Hauptprozess (»Überwacher«) einer Unit, bei der Delegierung eingeschaltet ist, in einer Untergruppe auszuführen.

Hinzugefügt in Version 254.

DisableControllers=

Deaktiviert Controller, so dass sie für die Kinder einer Unit nicht eingeschaltet werden können. Falls ein aufgeführter Controller bereits in seinem Unterbaum in Verwendung ist, wird der Controller aus dem Unterbaum entfernt. Damit können Sie vermeiden, dass Konfiguration in Kind-Units in die Lage versetzt wird, implizit oder explizit einen Controller einzuschalten. Standardmäßig leer.

Es können mehrere Controller durch Leerzeichen getrennt angegeben werden. Sie können auch DisableControllers= mehrfach angeben, dann wird jede neue Instanz einen anderen Controller zum Deaktivieren hinzufügen. Wird DisableControllers= selbst ohne vorhandenen Controller-Namen übergeben, dann wird die Liste der deaktivierten Controller zurückgesetzt.

Es mag nicht möglich sein, einen Controller zu deaktivieren, nachdem die Units gestartet wurden, falls die Unit oder eines der Kinder dieser Unit Controller an seine Kinder delegiert, da kein delegierter Unterbaum der Control-Gruppenhierarchie durch Systemd verwaltet wird.

Die folgenden Controller-Namen können festgelegt werden: cpu, cpuacct, cpuset, io, blkio, memory, devices, pids, bpf-firewall, und bpf-devices.

Hinzugefügt in Version 240.

Speicherdruck-Steuerung¶

ManagedOOMSwap=auto|kill, ManagedOOMMemoryPressure=auto|kill

Gibt an, wie systemd-oomd.service(8) mit den Cgroups dieser Unit umgeht. Standardmäßig auto.

Wird dies auf kill gesetzt, dann wird die Unit ein Kandidat für die Überwachung durch systemd-oomd. Falls die Cgroup die durch oomd.conf(5) oder die Unit-Konfiguration gesetzten Beschränkungen überschreitet, dann wird systemd-oomd eine Nachkommens-Cgroup auswählen und SIGKILL an alle darunter befindlichen Prozesse senden. Sie erhalten weitere Details über Kandidaten und das Tötenverhalten unter systemd-oomd.service(8) und oomd.conf(5).

Wird eine dieser Eigenschaften auf kill gesetzt, führt dies zu Abhängigkeiten After= und Wants= auf systemd-oomd.service außer DefaultDependencies=no.

Wird dies auf auto gesetzt, dann wird systemd-oomd nicht aktiv diese Cgroup-Daten zur Überwachung und Erkennung verwenden. Falls allerdings eine Vorfahr-Cgroup eine dieser Eigenschaften auf kill gesetzt hat, dann kann eine Unit mit auto weiterhin ein Kandidat für systemd-oomd zum Beenden sein.

Hinzugefügt in Version 247.

ManagedOOMMemoryPressureLimit=

Setzt die durch oomd.conf(5) für diese Unit (Cgroup) gesetzte Standard-Speicher-Belastungsgrenze außer Kraft. Akzeptiert einen Prozentwert zwischen (einschließlich) 0% und 100%. Diese Eigenschaft wird ignoriert, außer ManagedOOMMemoryPressure=kill. Standardmäßig 0%, was bedeutet, dass die in oomd.conf(5) gesetzte Vorgabe verwandt wird.

Hinzugefügt in Version 247.

ManagedOOMPreference=none|avoid|omit

Erlaubt das Herunterpriorisieren oder Überspringen der Cgroup dieser Unit als Kandidat, wenn systemd-oomd agieren muss. Benötigt Unterstützung für erweiterte Attribute (siehe xattr(7)), um avoid oder omit zu verwenden.

Bei der Berechnung von Kandidaten, um die Verwendung des Auslagerungsspeichers zu reduzieren, wird systemd-oomd diese erweiterten Attribute nur respektieren, falls die Cgroup der Unit root gehört.

Bei der Berechnung von Kandidaten, um Speicherdruck zu reduzieren, wird systemd-oomd diese erweiterten Attribute nur respektieren, falls der Eigentümer der Cgroup root ist oder falls der Eigentümber der Cgrop und der des Vorgängers identisch sind. Falls beispielsweise systemd-oomd Kandiaten für -.slice berechnet, werden die auf die Nachfahren von /user.slice/user-1000.slice/user@1000.service/ gesetzten erweiterten Attribute ignoriert, da die Nachfahren UID 1000 gehören und -.slice UID 0 gehört. Falls aber Kandidaten für /user.slice/user-1000.slice/user@1000.service/ berechnet werden, dann werden auf die Nachfahren gesetzte erweiterte Attribute respektiert.

Falls diese Eigenschaft auf avoid gesetzt ist, wird der Diensteverwalter dies systemd-oomd mitteilen, der diese Cgroup nur auswählen wird, wenn es keinen anderen brauchbaren Kandidaten gibt.

Falls diese Eigenschaft auf omit gesetzt ist, wird der Diensteverwalter dies systemd-oomd mitteilen, der diese Cgroup als Kandidat ignorieren und keinerlei Aktion auf ihr ausführen wird.

Es wird empfohlen, avoid und omit nur vereinzelt zu verwenden, da es das Kill-Verhalten von systemd-oomd negativ beeinflussen kann. Beachten Sie auch, dass diese erweiterten Attribute nicht rekursiv auf Cgroups unterhalb der Cgroup dieser Unit angewandt werden.

Standardmäßig none, was bedeutet, dass systemd-oomd die Cgroup dieser Unit wie in systemd-oomd.service(8) und oomd.conf(5) definiert einordnen wird.

Hinzugefügt in Version 248.

MemoryPressureWatch=

Steuert die Überwachung von Speicherdruck für aufgerufene Prozesse. Akzeptiert entweder »off«, »on«, »auto« oder »skip«. Falls »off«, wird dem Dienst mitgeteilt, nicht auf Speicherdruckereignisse zu beobachten, indem die Umgebungsvariable $MEMORY_PRESSURE_WATCH auf die wörtliche Zeichenkette »/dev/null« gesetzt wird. Falls »on«, wird dem Dienst mitgeteilt, auf Speicherdruckereignisse zu beobachten. Dies aktiviert die Speicherbuchführung für den Dienst und stellt sicher, dass die Cgroup-Attributdatei memory.pressure für den Benutzer des Dienstes zum Lesen und Schreiben verfügbar ist. Es setzt dann die Umgebungsvariable $MEMORY_PRESSURE_WATCH für Prozesse, die von der Unit aufgerufen werden, auf den Dateisystempfad auf diese Datei. Die mittels MemoryPressureThresholdSec= konfigurierte Schwellwertinformation wird in der Umgebungsvariable $MEMORY_PRESSURE_WRITE kodiert. Falls der Wert »auto« gesetzt ist, wird das Protokoll immer aktiviert, falls Speicherbuchführung für die Unit sowieso aktiviert ist und andernfalls deaktiviert. Falls auf »skip« gesetzt, wird die Logik weder aktiviert noch deaktiviert, und die zwei Umgebungsvariablen werden nicht gesetzt.

Beachten Sie, dass Dienste die Freiheit haben, die zwei Umgebungsvariablen zu verwenden, aber es unproblematisch ist, wenn sie sie ignorieren. Der Umgang mit Speicherdruck muss in jedem Dienst individuell implementiert werden und bedeutet normalerweise verschiedene Dinge für verschiedene Software. Weitere Details zum Umgang mit Speicherdruck finden Sie in Umgang mit Speicherdruck in Systemd[13].

Mittels sd-event(3) implementierte Dienste können sd_event_add_memory_pressure(3) verwenden, um auf Speicherdruckereignisse zu beobachten und damit umzugehen.

Falls nicht explizit gesetzt ist die Vorgabe für die Einstellung DefaultMemoryPressureWatch= in systemd-system.conf(5).

Hinzugefügt in Version 254.

MemoryPressureThresholdSec=

Setzt die Speicherdruck-Schwellwertzeit für den Speicherdruck-Überwacher, wie mittels MemoryPressureWatch= konfiguriert. Legt die maximale Belegungsverzögerung fest, bevor ein Speicherdruckereignis an den Dienst signalisiert wird, pro 2s-Fenster. Falls nicht angegeben, ist die Vorgabe die Einstellung DefaultMemoryPressureThresholdSec= in systemd-system.conf(5) (die wiederum standardmäßig 200ms ist). Der festgelegte Wert erwartet eine Zeiteinheit wie »ms« oder »µs«, siehe systemd.time(7) zu Details für die erlaubte Syntax.

Hinzugefügt in Version 254.

Speicherauszugs-Steuerung¶

CoredumpReceive=

Akzeptiert ein logisches Argument. Diese Einstellung wird zur Aktivierung der Weiterleitung von Speicherauszügen für Container verwandt, die zu der Cgroup dieser Unit gehören. Units mit CoredumpReceive=yes müssen auch mit Delegate=yes konfiguriert werden. Standardmäßig falsch.

Wenn systemd-coredump(8) einen Speicherauszug für einen Prozess aus einem Container handhabt und falls der leitende Prozess des Containers ein Nachkommen der Group mit CoredumpReceive=yes und Delegate=yes ist, dann wird systemd-coredump(8) versuchen, den Speicherauszug an systemd-coredump(8) innerhalb des Containers weiterzuleiten.

Hinzugefügt in Version 255.

GESCHICHTE¶

systemd 252

Optionen für die Steuerung der veralteten Control-Group-Hierarchie (Control-Gruppen Version 1[14]) sind jetzt vollständig veraltet: CPUShares=Gewicht, StartupCPUShares=Gewicht, MemoryLimit=Byte, BlockIOAccounting=, BlockIOWeight=Gewicht, StartupBlockIOWeight=Gewicht, BlockIODeviceWeight=Gerät Gewicht, BlockIOReadBandwidth=device Byte, BlockIOWriteBandwidth=Gerät Byte. Bitte stellen Sie auf die vereinigte Cgroup-Hierarchie um.

Hinzugefügt in Version 252.

SIEHE AUCH¶

systemd(1), systemd-system.conf(5), systemd.unit(5), systemd.service(5), systemd.slice(5), systemd.scope(5), systemd.socket(5), systemd.mount(5), systemd.swap(5), systemd.exec(5), systemd.directives(7), systemd.special(7), systemd-oomd.service(8), Die Dokumentation für Control-Gruppen und bestimmte Controller im Linux-Kernel: Control-Gruppen v2[2]

ANMERKUNGEN¶

1.: Neue Control-Gruppen-Schnittstellen

https://systemd.io/CONTROL_GROUP_INTERFACE

2.: Control-Gruppen v2

https://docs.kernel.org/admin-guide/cgroup-v2.html

3.: CFS-Scheduler

https://docs.kernel.org/scheduler/sched-design-CFS.html

4.: CFS-Bandbreitensteuerung

https://docs.kernel.org/scheduler/sched-bwc.html

5.: Speicherschnittstellen-Dateien

https://docs.kernel.org/admin-guide/cgroup-v2.html#memory-interface-files

6.: Zswap

https://docs.kernel.org/admin-guide/mm/zswap.html

7.: PIDS-Controller

https://docs.kernel.org/admin-guide/cgroup-v2.html#pid

8.: E/A-Schnittstellen-Dateien

https://docs.kernel.org/admin-guide/cgroup-v2.html#io-interface-files

9.: NFT

https://netfilter.org/projects/nftables/index.html

10.: bpf.h

https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/plain/include/uapi/linux/bpf.h

11.: BPF-Dokumentation

https://docs.kernel.org/bpf/

12.: Control-Gruppen-APIs und Delegierung

https://systemd.io/CGROUP_DELEGATION

13.: Umgang mit Speicherdruck in Systemd

https://systemd.io/MEMORY_PRESSURE

14.: Control-Gruppen Version 1

https://docs.kernel.org/admin-guide/cgroup-v1/index.html

ÜBERSETZUNG¶

Die deutsche Übersetzung dieser Handbuchseite wurde von Helge Kreutzmann <debian@helgefjell.de> erstellt.

Diese Übersetzung ist Freie Dokumentation; lesen Sie die GNU General Public License Version 3 oder neuer bezüglich der Copyright-Bedingungen. Es wird KEINE HAFTUNG übernommen.

Wenn Sie Fehler in der Übersetzung dieser Handbuchseite finden, schicken Sie bitte eine E-Mail an die Mailingliste der Übersetzer.

systemd 256.5

Source file:	systemd.resource-control.5.de.gz (from manpages-de 4.24.0-2)
Source last updated:	2024-09-21T07:19:44Z
Converted to HTML:	2024-11-08T09:04:30Z