- bookworm 4.18.1-1
- bookworm-backports 4.25.1-1~bpo12+1
- testing 4.25.1-1
- unstable 4.25.1-1
SYSTEMD.RESOURCE-CONTROL(5) | systemd.resource-control | SYSTEMD.RESOURCE-CONTROL(5) |
BEZEICHNUNG¶
systemd.resource-control - Resourcensteuerungs-Unit-Einstellungen
ÜBERSICHT¶
Scheibe.slice, Bereich.scope, Dienst.service, Socket.socket, Einhängung.mount, Swap.swap
BESCHREIBUNG¶
Unit-Konfigurationsdateien für Dienste, Scheiben, Bereiche, Sockets, Einhängepunkte und Swap-Geräte nutzen eine Teilmenge der Konfigurationsoptionen für die Ressourcensteuerung von erzeugten Prozessen gemeinsam. Intern verlässt sich dies auf das Konzept der Linux Control Groups (cgroups) des Kernels zur Organisation von Prozessen in einem hierarchischen Baum benannter Gruppen zum Zwecke der Ressourcensteuerung.
Diese Handbuchseite listet die von diesen sechs Unit-Typen gemeinsam benutzten Optionen auf. Siehe systemd.unit(5) für die gemeinsamen Optionen aller Unit-Konfigurationsdateien und systemd.slice(5), systemd.scope(5), systemd.service(5), systemd.socket(5), systemd.mount(5) und systemd.swap(5) für weitere Informationen über die speziellen Unit-Konfigurationsdateien. Die Ressourcensteuerungskonfigurationsoptionen werden in den Abschnitten [Slice], [Scope], [Service], [Socket], [Mount] oder [Swap], abhängig vom Unit-Typ, konfiguriert.
Zusätzlich werden Optionen, die die verfügbaren Ressourcen der von Systemd gestarteten Programme steuern, in systemd.exec(5) aufgeführt. Diese Optionen ergänzen die hier aufgeführten Optionen.
Controller aktivieren oder deaktivieren¶
Controller in der Cgroup-Hierarchie sind hierarchisch und die Ressourcensteuerung wird über verteilte Ressourcenzuweisungen zwischen Geschwistern in Zweigen der Cgroup-Hierarchie realisiert. Es besteht keine Notwendigkeit, einen Cgroup-Controller für eine Unit explizit zu aktivieren. systemd wird den Kernel anweisen, einen Controller für eine angegebene Unit zu aktivieren, wenn diese Unit über eine Konfiguration für einen angegebenen Controller verfügt. Wenn beispielsweise CPUWeight= gesetzt ist, wird der Controller cpu aktiviert und wenn TasksMax= gesetzt ist, wird der Controller pids aktiviert. Zusätzlich können verschiedene Controller auch über explizite Einstellungen MemoryAccounting=/TasksAccounting=/IOAccounting= aktiviert werden. Aufgrund der Arbeitsweise der Cgroup-Hierarchie werden Controller für alle Eltern-Units und für alle Geschwister-Units, beginnend bei der niedrigsten Stufe, auf der der Controller aktiviert ist, aktiviert werden. Units, für die ein Controller aktiviert ist, können der Ressourcensteuerung unterliegen, selbst falls sie selbst über keine explizite Konfiguration verfügen.
Setzen von Delegate= aktiviert alle delegierten Controller für diese Unit (siehe unten). Die Delegierten können dann nach Bedarf Controller für ihre Kinder aktivieren. Falls insbesondere der Delegierte systemd ist (in der Unit user@.service), wird er die gleiche Logik wie die Systeminstanz wiederholen und Controller für Units aktivieren, bei denen Ressourcenbeschränkungen konfiguriert wurden, sowie deren Geschwistern und Eltern und den Geschwistern der Eltern.
Controller können für Teile der Cgroup-Hierarchie mit DisableControllers= deaktiviert werden (siehe unten).
Beispiel 1. Controller aktivieren und deaktivieren
-.slice
/ \
/-----/ \--------------\
/ \
system.slice user.slice
/ \ / \
/ \ / \
/ \ user@42.service user@1000.service
/ \ Delegate= Delegate=yes a.service b.slice / \ CPUWeight=20 DisableControllers=cpu / \
/ \ app.slice session.slice
/ \ CPUWeight=100 CPUWeight=100
/ \
b1.service b2.service
CPUWeight=1000
In dieser Hierarchie ist der Controller cpu für alle angezeigten Units außer b1.service und b2.service aktiviert. Da es keine explizite Konfiguration für system.slice und user.slice gibt, werden die CPU-Ressourcen zwischen ihnen gleichmäßig aufgeteilt. Ähnlich werden Ressourcen zwischen den Kindern von user.slice und zwischen der Kind-Scheibe unterhalb von user@1000.service aufgeteilt. Unter der Annahme, dass es keine weitere Konfiguration der Ressourcen oder Delegationen unterhalb der Scheibe app.slice oder session.slice gibt, würde der Controller cpu nicht für Units in diesen Scheiben aktiviert und CPU-Ressourcen würden weiter mittels anderer Mechanismen, z.B. basierend auf den Nice-Stufen, zugewiesen. Der Verwalter für Benutzer 42 hat Delegation ohne Controller aktiviert, d.h. er kann seinen Unterbaum der Cgroup-Hierarchie verändern, aber ohne Ressourcensteuerung.
In der Scheibe system.slice werden die CPU-Ressourcen 1:6 auf Dienst a.service und 5:6 auf Scheibe b.slice aufgeteilt, da Scheibe b.slice den Vorgabewert von 100 für cpu.weight erhält, wenn CPUWeight= nicht gesetzt ist.
Die Einstellung CPUWeight= in b2.service wird durch DisableControllers= in Scheibe b.slice neutralisiert, so dass der Controller cpu für die Dienste b1.service und b2.service nicht aktiviert würde und CPU-Ressourcen weiter mittels anderer Mechanismen, z.B. basierend auf den Nice-Stufen, zugewiesen würden.
Ressourcensteuerungen für eine Cgroup zugehöriger Units setzen¶
Wie in systemd.unit(5) beschrieben, können die hier aufgeführten Einstellungen über die Hauptkonfigurationsdatei einer Unit und Ergänzungsschnipsel in *.d/-Verzeichnissen gesetzt werden. Die Liste der nach Ergänzungen durchsuchten Verzeichnisse enthält Namen, die durch wiederholtes Abschneiden des Units-Namens nach allen Gedankenstrichen geformt werden. Dies ist insbesondere praktisch, um Ressourcenbegrenzungen für eine Gruppe von Units mit ähnlichen Namen zu setzen.
Beispielsweise erhält jeder Benutzer seine eigene Scheibe user-nnn.slice. Ergänzungen mit lokaler Konfiguration, die Benutzer 1000 betreffen, können in /etc/systemd/system/user-1000.slice, /etc/systemd/system/user-1000.slice.d/*.conf, aber auch in /etc/systemd/system/user-.slice.d/*.conf abgelegt werden. Das letzte Verzeichnis gilt für alle Benutzer-Scheiben.
¶
Siehe die Neue Control-Gruppen-Schnittstellen[1] für eine Einführung, wie die Ressourcensteuerungs-APIs von Programmen genutzt werden können.
IMPLIZITE ABHÄNGIGKEITEN¶
Die folgenden Abhängigkeiten werden implizit hinzugefügt:
OPTIONEN¶
Units der oben aufgeführten Typen können Einstellungen für die Ressourcensteuerungskonfiguration haben:
CPU-Buchführung und -Steuerung¶
CPUAccounting=
Unter der vereinigten Cgroup-Hierarchie ist die CPU-Buchführung für alle Units verfügbar und diese Einstellung hat keine Auswirkung.
Hinzugefügt in Version 208.
CPUWeight=Gewicht, StartupCPUWeight=Gewicht
Diese Optionen akzeptieren einen Ganzzahlwert oder die besondere Zeichenkette »idle«:
Beachten Sie, dass dieser Wert nur bei Cgroup-V2 eine Auswirkung hat, bei Cgroup-V1 ist sie äquivalent zu der Minimalgewichtung.
Während StartupCPUWeight= für die Hoch- und Runterfahrphase des Systems gilt, gilt CPUWeight= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupCPUWeight= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Zusätzlich zu der durch den Controller cpu durchgeführten Ressourcenbelegung kann der Kernel automatisch Ressourcen basierend auf der Sitzungskennungsgruppierung verteilen, siehe »The autogroup feature« in sched(7). Die Auswirkung dieser Funktionalität ist ähnlich des Controllers cpu ohne explizite Konfiguration, daher sollten Benutzer vorsichtig sein, nicht beide durcheinander zu bringen.
Hinzugefügt in Version 232.
CPUQuota=
Weist die festgelegte CPU-Zeitquote den ausgeführten Prozessen zu. Akzeptiert einen Prozentwert, dem »%« angehängt ist. Der Prozentwert gibt an, wieviel CPU-Zeit die Unit maximal erhalten soll, relativ zu der gesamten CPU-Zeit, die auf einer CPU verfügbar ist. Verwenden Sie Werte > 100%, um CPU-Zeit auf mehr als einer CPU vorzusehen. Dies steuert das Attribut »cpu.max« der vereinigten Control-Gruppenhierarchie und »cpu.max« auf der alten. Für Details über dieses Control-Gruppen-Attribut siehe Control-Gruppen v2[2] und CFS-Bandweitensteuerung[4]. Durch Setzen von CPUQuota= auf einen leeren Wert wird keine Quote gesetzt.
Beispiel: CPUQuota=20% stellt sicher, dass der ausgeführte Prozess niemals mehr als 20% CPU-Zeit auf einer CPU erhält.
Hinzugefügt in Version 213.
CPUQuotaPeriodSec=
Weist die Dauer zu, über den die durch CPUQuota= festgelegte CPU-Zeit-Kontingent gemessen wird. Akzeptiert einen Zeitdauerwert in Sekunden mit einer optionalen Endung wie »ms« für Millisekunden (oder »s« für Sekunden). Die Voreinstellung ist 100 ms. Die Periode wird an den durch den Kernel unterstützten Bereich, der [1ms, 1000ms] ist, befestigt. Zusätzlich wird die Periode angepasst, so dass das Kontingent-Intervall auch mindestens 1 ms ist. Wird CPUQuotaPeriodSec= auf einen leeren Wert gesetzt, so wird er auf die Vorgabe zurückgesetzt.
Dies steuert das zweite Feld des Attributs »cpu.max« der vereinigten Control-Gruppenhierarchie und »cpu.cfs_period_us« auf der alten. Für Details über dieses Control-Gruppen-Attribut siehe Control-Gruppen v2[2] und CFS-Auftragsplaner[3].
Beispiel: Mit CPUQuotaPeriodSec=10ms wird erbeten, das CPU-Kontingent in Perioden von 10 ms zu messen.
Hinzugefügt in Version 242.
AllowedCPUs=, StartupAllowedCPUs=
Beschränkt die Ausführung von Prozessen auf bestimmte CPUs. Akzeptiert eine Liste von CPU-Indicies oder -Bereichen, getrennt durch Leerraum oder Kommata. CPU-Bereiche werden durch den unteren und oberen CPU-Index, getrennt durch einen Bindestrich, angegeben.
Setzen von AllowedCPUs= oder StartupAllowedCPUs= garantiert nicht, dass sämtliche CPUs von den Prozessen verwandt werden, da es durch Eltern-Units eingeschränkt sein könnte. Die wirksame Konfiguration wird durch EffectiveCPUs= berichtet.
Während StartupAllowedCPU= nur für die Hoch- und Runterfahrphasen des Systems gelten, gilt AllowedCPUs= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupAllowedCPUs= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Diese Einstellung wird nur mit der vereinigten Control-Gruppenhierarchie unterstützt.
Hinzugefügt in Version 244.
Speicher-Buchführung und -Steuerung¶
MemoryAccounting=
Schaltet Prozess- und Kernelspeicherbuchführung für diese Unit ein. Akzeptiert ein logisches Argument. Beachten Sie, dass das Einschalten der Speicherbuchführung in einer Unit implizit die Buchführung für alle Units in der gleichen Scheibe und für alle ihre Eltern-Scheiben und die darin enthaltenen Units einschaltet. Die Systemvorgabe für diese Einstellung kann mit DefaultMemoryAccounting= in systemd-system.conf(5) gesteuert werden.
Hinzugefügt in Version 208.
MemoryMin=Byte, MemoryLow=Byte, StartupMemoryLow=Byte, DefaultStartupMemoryLow=Byte
Legt den Speicherverwendungsschutz für die ausgeführten Prozesse in dieser Unit fest. Wenn Speicher zurückgewonnen wird, dann wird diese Unit so behandelt, als ob sie weniger Speicher verwenden würde, was dazu führt, dass Speicher bevorzugt von nicht geschützten Units zurückgewonnen wird. Die Verwendung von MemoryLow= führt zu einem schwächeren Schutz, bei dem Speicher weiterhin zurückgewonnen werden kann, um den Aufruf des OOM-Killers zu vermeiden, falls es keinen anderen zurückgewinnbaren Speicher gibt.
Damit ein Schutz wirksam wird, ist es im Allgemeinen notwendig, die entsprechende Zuweisung für alle Vorfahren zu setzen, die dann zwischen den Kindern verteilt wird (mit der Ausnahme der Wurzel-Scheibe). Jede Zuweisung MemoryMin= oder MemoryLow=, die nicht explizit zu den festgelegten Kindern verteilt wird, wird für einen gemeinsamen Schutz für alle Kinder verwandt. Da dies ein gemeinsamer Schutz ist, konkurrieren die Kinder frei um den Speicher.
Akzeptiert eine Speichergröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Speichergröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zum installierten physischen Speicher im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird sämtlicher Speicher geschützt. Dies kann nützlich sein, um immer sämtlichen, bei den Vorgängern aufgewandten Schutz zu erben. Dies steuert das Control-Gruppen-Attribut »memory.min« oder »memory.low«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5].
Durch Angabe von DefaultMemoryMin= oder DefaultMemoryLow= (hat die gleiche Semantik wie MemoryMin= und MemoryLow=) oder DefaultStartupMemoryLow= (hat die gleiche Semantik wie StartupMemoryLow=) können Units ihren Kindern einen Vorgabewert für »memory..min« oder »memory.low« verwenden lassen. Diese Einstellung beeinflusst nicht »memory..min« oder »memory.low« in der Unit selbst. Die Verwendung zum Setzen einer Vorgabe-Zuweisung ist nur auf Kerneln vor 5.7 nützlich, die die Cgroup2-Einhängeoption »memory_recursiveprot« nicht unterstützen.
Während StartupMemoryLow= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemoryMin= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryLow= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Hinzugefügt in Version 240.
MemoryHigh=Byte, StartupMemoryHigh=Byte
Legt die Drosselungs-Speicherverbrauchsbegrenzung der ausgeführten Prozesse in dieser Unit fest. Speicherverbrauch darf diese Begrenzung überschreiten, falls es unvermeidbar ist, aber die Prozesse werden drastisch verlangsamt und der Speicher wird in solchen Fällen aggressiv fortgenommen. Dies ist der Hauptmechanismus, um den Speicherverbrauch einer Unit zu steuern.
Akzeptiert eine Speichergröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Speichergröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zum installierten physischen Speicher im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Speicherdrosselung angewandt. Dies steuert das Control-Gruppen-Attribut »memory.high«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5]. Die wirksame Konfiguration wird als EffectiveMemoryHigh= berichtet (siehe auch EffectiveMemoryMax=).
Während StartupMemoryHigh= für die Hoch- und Runterfahrphase des Systems gilt, gilt MemoryHigh= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryHigh= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Hinzugefügt in Version 231.
MemoryMax=Byte, StartupMemoryMax=Byte
Legt die absolute Grenze der Speicherverwendung durch den ausgeführten Prozess in dieser Unit fest. Falls der Speicherverbrauch nicht unterhalb dieser Grenze gehalten werden kann, wird der Speicherknappheits-Killer innerhalb der Unit aufgerufen. Es wird empfohlen, MemoryHigh= als Hauptsteuermechanismus und MemoryMax= als letzte Verteidigungslinie zu verwenden.
Akzeptiert eine Speichergröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Speichergröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zum installierten physischen Speicher im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Speicherbegrenzung angewandt. Dies steuert das Control-Gruppen-Attribut »memory.max«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5]. Die wirksame Konfiguration wird als EffectiveMemoryMax= berichtet (der Wert ist die strengste Beschränkung der Unit und der Eltern-Scheiben und er wird durch den physischen Speicher nach oben beschränkt).
Während StartupMemoryMax= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemoryMax= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryMax= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Hinzugefügt in Version 231.
MemorySwapMax=Byte, StartupMemorySwapMax=Byte
Legt die absolute Begrenzung bezüglich Auslagerungsverwendung von in dieser Unit ausgeführten Prozessen fest.
Akzeptiert eine Auslagerungsgröße in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Auslagerungsgröße in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Alternativ kann ein Prozentwert festgelegt werden, der relativ zur angegebenen Auslagerungsgröße im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Auslagerungsbegrenzung angewandt. Dies steuert das Control-Gruppen-Attribut »memory.swap.max«. Für Details über dieses Control-Gruppen-Attribut, siehe Speicherschnittstellen-Dateien[5].
Während StartupMemorySwapMax= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemorySwapMax= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemorySwapMax= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Hinzugefügt in Version 232.
MemoryZSwapMax=Byte, StartupMemoryZSwapMax=Byte
Legt die absolute Begrenzung der Verwendung von Zswap der Prozesse in dieser Unit fest. Zswap ist ein leichtgewichtiger Zwischenspeicher für Auslagerungsseiten. Es akzeptiert Seiten, die gerade ausgelagert werden sollen und versucht sie in einen dynamisch reservierten RAM-basierten Speicherbereich zu komprimieren. Falls die festgelegte Begrenzung erreicht wird, werden keine Einträge von dieser Unit mehr in dem Bereich gespeichert, bis bestehende Einträge wieder eingelesen oder auf Platte geschrieben werden. Siehe die Kerneldokumentation für Zswap[6] für weitere Details.
Akzeptiert eine Größe in Byte. Falls dem Wert K, M, G oder T angehängt wird, wird die angegebene Größe in Kilobyte, Megabyte, Gigabyte bzw. Terabyte (zur Basis 1024) ausgewertet. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Begrenzung angewandt. Diese Einstellungen steuern das Control-Gruppen-Attribut »memory.zswap.max«. Für Details über dieses Control-Gruppen-Attribut siehe Speicherschnittstellen-Dateien[5].
Während StartupMemoryZSwapMax= für die Hoch- und Runterfahrphasen des Systems gilt, gilt MemoryZSwapMax= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupMemoryZSwapMax= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Hinzugefügt in Version 253.
MemoryZSwapWriteback=
Akzeptiert ein logisches Argument. Wenn true, wird im Zswap-Zwischenspeicher gespeicherten Seiten erlaubt, auf den zugrundeliegenden Speicher geschrieben zu werden, bei false nicht. Standardmäßig true. Dies ermöglicht es, das Rückschreiben von Zwischenspeicherseiten für E/A-intensive Anwendungen zu deaktivieren, während die Mögilchkeit, komprimierte Seiten in Zswap zu speichern, beibehalten wird. Siehe die Kerneldokumentation zu Zswap[6] zu weiteren Details.
Hinzugefügt in Version 256.
AllowedMemoryNodes=, StartupAllowedMemoryNodes=
Beschränkt die Ausführung von Prozessen auf bestimmte Speicher-NUMA-Knoten. Akzeptiert eine Liste von Speicher-NUMA-Knoten oder -Bereichen, getrennt durch Leerraum oder Kommata. Speicher-NUMA-Knotenbereiche werden durch den unteren und oberen NUMA-Knotenindex, getrennt durch einen Bindestrich, angegeben.
Setzen von AllowedMemoryNodes oder StartupAllowedMemoryNodes= garantiert nicht, dass sämtliche Speicher-NUMA-Knoten von den Prozessen verwandt werden, da es durch Eltern-Units eingeschränkt sein könnte. Die wirksame Konfiguration wird durch EffectiveMemoryNodes= berichtet.
Während StartupAllowedMemoryNodes= für die Hoch- und Runterfahrphasen des Systems gilt, gilt AllowedMemoryNodes= während der normalen Laufzeit des Systems und falls ersteres nicht gesetzt ist, auch für die Hoch- und Runterfahrphasen. Durch Verwendung von StartupAllowedMemoryNodes= ist eine abweichende Priorisierung bestimmter Dienste während des Hoch- und Runterfahrens des Systems im Vergleich zur normalen Laufzeit möglich.
Diese Einstellung wird nur mit der vereinigten Control-Gruppenhierarchie unterstützt.
Hinzugefügt in Version 244.
Prozess-Buchführung und -Steuerung¶
TasksAccounting=
Schaltet Prozessbuchführung für diese Unit ein. Akzeptiert ein logisches Argument. Falls aktiviert, wird der Kernel die Gesamtanzahl der Prozesse in der Unit und ihren Kindern nachverfolgen. Diese Anzahl enthält sowohl Kernel-Threads als auch Benutzerprozesse, wobei jeder Thread einzeln zählt. Beachten Sie, dass das Einschalten der Prozessbuchführung für eine Unit dies implizit auch für alle Units, die in der gleichen Scheibe enthalten sind und für alle Elternscheiben und die darin befindlichen Units einschaltet. Die Systemvorgabe für diese Einstellung kann durch DefaultTasksAccounting= in systemd-system.conf(5) gesteuert werden.
Hinzugefügt in Version 227.
TasksMax=N
Legt die maximale Anzahl an Prozessen, die in dieser Unit erstellt werden dürfen, fest. Dies stellt sicher, dass die Anzahl der Prozesse, für die die Unit buchführt (siehe oben), unterhalb einer festgelegten Begrenzung bleibt. Dies akzeptiert entweder eine absolute Anzahl an Prozessen oder einen Prozentwert, der relativ zu der konfigurierten Maximalzahl an Prozessen im System ist. Falls der besondere Wert »infinity« zugewiesen wird, wird keine Prozessbegrenzung angewandt. Dies steuert das Control-Gruppen-Attribut »pids.max«. Für Details über dieses Control-Gruppen-Attribut siehe PIDs-Controller[7]. Die wirksame Konfiguration wird als EffectiveTasksMax= berichtet.
Die Systemvorgabe für diese Einstellung kann mit DefaultTasksMax= in systemd-system.conf(5) gesteuert werden.
Hinzugefügt in Version 227.
E/A-Buchführung und -Steuerung¶
IOAccounting=
Schaltet Block-E/A-Buchführung für diese Unit ein, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert ein logisches Argument. Beachten Sie, dass das Einschalten der Block-E/A-Buchführung für eine Unit dies implizit auch für alle Units, die in der gleichen Scheibe enthalten sind und für alle Elternscheiben und die darin befindlichen Units einschaltet. Die Systemvorgabe für diese Einstellung kann durch DefaultIOAccounting= in systemd-system.conf(5) gesteuert werden.
Hinzugefügt in Version 230.
IOWeight=Gewicht, StartupIOWeight=Gewicht
Setzt die vorgegebene Gesamt-Block-E/A-Gewichtung für die ausgeführten Prozesse, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert einen einzelnen Gewichtungswert (zwischen 1 und 10000), um die vorgegebene Block-E/A-Gewichtung zu setzen. Dies steuert das Control-Gruppen-Attribut »io.weight«, das standardmäßig 100 beträgt. Für Details über dieses Control-Gruppen-Attribut, siehe E/A-Schnittstellen-Dateien[8]. Die verfügbare E/A-Bandbreite wird zwischen allen Units innerhalb einer Scheibe relativ zu ihrer Block-E/A-Gewichtung aufgeteilt. Ein höherer Wert bedeutet mehr E/A-Bandbreite, ein geringerer Wert weniger.
Während StartupIOWeight= in der Hoch- und Runterfahrphase des Systems angewandt wird, wird IOWeight= später zur Laufzeit des Systems angewandt und falls erstere nicht gesetzt ist, auch während der Hoch- und Runterfahrphasen. Dies erlaubt es, bestimmte Dienste beim Hoch- und Runterfahren anders als zur Laufzeit zu priorisieren.
Hinzugefügt in Version 230.
IODeviceWeight=Gerät Gewicht
Setzt die gerätebezogene Gesamt-Block-E/A-Gewichtung für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert ein Leerzeichen-getrenntes Paar eines Dateipfades und eines Gewichtungswertes, um den gerätespezifischen Gewichtungswert zwischen 1 und 10000 festzulegen. (Beispiel: "/dev/sda 1000"). Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Dies steuert das Control-Gruppen-Attribut »io.weight«, das standardmäßig 100 ist. Verwenden Sie diese Option mehrfach, um Gewichtungen für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].
Der festgelegte Geräteknoten sollte ein Blockgerät referenzieren, der einen E/A-Scheduler zugeordnet hat, d.h. er sollte sich nicht auf eine Partition oder Loopback-Blockgeräte beziehen, sondern auf das ursprüngliche, physische Gerät. Wenn ein Pfad zu einer regulären Datei oder einem regulären Verzeichnis angegeben wird, wird versucht, das korrekte ursprüngliche, zugrundeliegende Geräte für den festgelegten Pfad zu entdecken. Dies funktioniert nur für die einfacheren Fälle korrekt, bei denen das Dateisystem direkt auf einer Partition oder einem physischen Blockgerät angelegt ist, oder bei denen einfache 1:1-Verschlüsselung mittels dm-crypt/LUKS verwandt wird. Diese Erkennung deckt komplexe Speicher und insbesondere RAID und Datenträger-Verwaltungs-Speichergeräte nicht ab.
Hinzugefügt in Version 230.
IOReadBandwidthMax=Gerät Byte, IOWriteBandwidthMax=Gerät Byte
Setzt die gerätebezogene maximale Gesamt-Block-E/A-Bandbreitenbegrenzung für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Diese Begrenzung ist nicht arbeitserhaltend und den ausgeführten Prozessen wird nicht mehr erlaubt, selbst falls das Gerät Leerlaufkapazität hat. Akzeptiert ein Leerzeichen-getrenntes Paar eines Dateipfades und eines Bandbreitenwertes (in Byte pro Sekunde), um die gerätespezifische Bandbreite festzulegen. Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Falls der Bandbreite K, M, G oder T angehängt ist, wird die Bandbreite als Kilobyte, Megabyte, Gigabyte bzw. Terabyte zu der Basis 1000 ausgewertet. (Beispiel: »/dev/disk/by-path/pci-0000:00:1f.2-scsi-0:0:0:0 5M«). Dies steuert das Control-Gruppen-Attribut »io.max«. Verwenden Sie diese Option mehrfach, um Bandbreitenbegrenzungen für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].
Ähnliche Beschränkungen für die Blockgeräte-Erkennung gelten wie bei IODeviceWeight=, siehe oben.
Hinzugefügt in Version 230.
IOReadIOPSMax=Gerät EAPS, IOWriteIOPSMax=Gerät EAPS
Setzt die gerätebezogene maximale Gesamt-Block-E/A-EA-Pro-Sekunden-Begrenzung für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Diese Begrenzung ist nicht arbeitserhaltend und den ausgeführten Prozessen wird nicht mehr als dieser Wert erlaubt, selbst falls das Gerät Leerlaufkapazität hat. Akzeptiert ein Leerzeichen-getrenntes Paar eines Dateipfades und eines EAPS-Wertes, um den gerätespezifischen EAPS festzulegen. Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Falls dem EAPS K, M, G oder T angehängt ist, wird der EAPS als KiloEAPS, MegaEAPS, GigaEAPS bzw. TeraEAPS zu der Basis 1000 ausgewertet. (Beispiel: »/dev/disk/by-path/pci-0000:00:1f.2-scsi-0:0:0:0 1K«). Dies steuert das Control-Gruppen-Attribut »io.max«. Verwenden Sie diese Option mehrfach, um EAPS-Begrenzungen für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].
Ähnliche Beschränkungen für die Blockgeräte-Erkennung gelten wie bei IODeviceWeight=, siehe oben.
Hinzugefügt in Version 230.
IODeviceLatencyTargetSec=Gerät Ziel
Setzt die gerätebezogene durchschnittliche Ziel-E/A-Latenz für den ausgeführten Prozess, falls die vereinigte Control-Gruppenhierarchie auf dem System verwandt wird. Akzeptiert einen Dateipfad und eine Zeitspanne, getrennt durch ein Leerzeichen, um das gerätespezifische Latenzziel festzulegen. (Beispiel: "/dev/sda 25ms"). Der Dateipfad kann als Pfad zu einem Blockgeräteknoten oder zu einer anderen Datei angegeben werden. In letzterem Fall wird das zugrundeliegende Blockgerät des Dateisystems der Datei bestimmt. Dies steuert das Control-Gruppen-Attribut »io.latency«. Verwenden Sie diese Option mehrfach, um Latenzziele für mehrere Geräte zu setzen. Für Details über dieses Control-Gruppen-Attribut siehe E/A-Schnittstellen-Dateien[8].
Impliziert »IOAccounting=yes«.
Diese Einstellungen werden nur unterstützt, falls die vereinigte Control-Gruppenhierarchie verwandt wird.
Ähnliche Beschränkungen für die Blockgeräte-Erkennung gelten wie bei IODeviceWeight=, siehe oben.
Hinzugefügt in Version 240.
Netzwerk-Buchführung und -Steuerung¶
IPAccounting=
Wenn diese Option in Socket-Units verwandt wird, wird sie auf alle hierzu zugeordneten IPv4- und IPv6-Socket (einschließlich der auf Anfragen wartenden und der Verbindugssockets, wo dies zutrifft) angewandt. Beachten Sie, dass für Socket-aktivierte Dienste diese Konfigurationseinstellung und die Buchuführungsdaten der Dienste-Unit und der Socket-Unit getrennt bleiben und getrennt dargestellt werden. Es erfolgt keine Weitergabe der Einstellung und der gesammelten Daten, in keine Richtung. Zudem wird sämtlicher Verkehr, der auf einem der Sockets der Socket-Unit empfangen oder gesandt wird für die Socket-Unit buchgeführt — und niemals für die Dienste-Unit, die sie aktiviert haben könnte, selbst falls der Socket von dieser verwandt wird.
Die Systemvorgabe für diese Einstellung kann mit DefaultIPAccounting= in systemd-system.conf(5) gesteuert werden.
Beachten Sie, dass diese Funktionalität derzeit nur für Systemdienste und nicht für benutzerbezogene Dienste verfügbar ist.
Hinzugefügt in Version 235.
IPAddressAllow=ADRESSE[/PRÄFIXLÄNGE]…, IPAddressDeny=ADRESSE[/PRÄFIXLÄNGE]…
Die mit dieser Option konfigurierten Zugriffslisten werden auf allen von dieser Unit erstellten Sockets (oder im Falle von Socket-Units, allen der Unit zugeordneten) angewandt. Die Liste wird implzit mit jeder für irgendeine Elternscheibe, bei der diese Unit Mitglied sein könnte, kombiniert. Standardmäßig sind beide Zugriffslisten leer. Durch diese Einstellung wird sowohl ein- als auch ausgehender Verkehr gefiltert. Im Falle des eingehenden Verkehrs wird die Quell-IP-Adresse gegen diese Zugriffslisten geprüft, im Falle des ausgehenden Verkehrs wird die Ziel-IP-Adresse geprüft. Die folgenden Regeln werden nacheinander angewandt:
Um eine IP-Firewall mit Positivliste zu implementieren, wird empfohlen, eine Einstellung IPAddressDeny=any in einer höherstufigen Scheiben-Unit (wie der Wurzel-Scheibe -.slice oder der Scheibe, die alle Systemdienste enthält, system.slice – siehe systemd.special(7) für Details über diese Scheiben-Units) zu verwenden, ergänzt um individuelle, dienstebezogene IPAddressAllow=-Zeilen, die Netzwerkzugriff auf relevante Dienste, und nur diese, erlauben.
Beachten Sie, dass für Socket-aktivierte Dienste die IP-Zugriffsliste, die in der Socket-Unit konfiguriert ist, auf alle direkt zugeordneten Sockets angewandt wird, aber nicht auf irgendein Socket, das von den dafür schließlich aktivierten Diensten erstellt wurde. Umgekehrt werden die für die Dienste konfigurierten IP-Zugriffslisten nicht auf irgendein Socket angewandt, das dem Dienst über Socket-Aktivierung weitergegeben wird. Daher ist es im Allgemeinen eine gute Idee, die IP-Zugriffsliste sowohl in der Socket- als auch der Dienste-Unit zu replizieren. Es kann sinnvoll sein, eine Liste offener und eine Liste beschränkter zu verwalten, abhängig vom Einsatzfall.
Falls diese Einstellungen mehrfach in der gleichen Unit verwandt werden, werden die angegebenen Listen kombiniert. Falls diesen Einstellungen eine leere Zeichenkette zugewiesen wird, werden die angegebenen Zugriffslisten zurückgesetzt und alle vorherigen Einstellungen aufgehoben.
Anstelle expliziter IPv4- oder IPv6-Adressen und Präfixlängenfestlegungen kann auch eine kleine Gruppe von symbolischen Namen verwandt werden. Die folgenden Namen sind definiert:
Tabelle 1. Besondere Adress-/Netzwerknamen
Symbolischer Name | Definition | Bedeutung |
any | 0.0.0.0/0 ::/0 | jeder Rechner |
localhost | 127.0.0.0/8 ::1/128 | alle Adressen auf dem lokalen Loopback |
link-local | 169.254.0.0/16 fe80::/64 | alle linklokalen IP-Adressen |
multicast | 224.0.0.0/4 ff00::/8 | alle IP-multicasting-Adressen |
Beachten Sie, dass diese Einstellungen auf einigen Systemen nicht unterstützt werden könnten (beispielsweise falls eBPF-Control-Gruppen-Unterstützung nicht im unterliegenden Kernel oder Container-Verwalter aktiviert ist). Diese Einstellungen haben in diesem Fall keine Auswirkung. Falls Kompatibilität mit solchen Systemen gewünscht ist, wird daher empfohlen, sich nicht exklusiv auf sie für IP-Sicherheit zu verlassen.
Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.
Hinzugefügt in Version 235.
SocketBindAllow=Binderegel, SocketBindDeny=Binderegel
Binderegel beschreibt Socket-Eigenschaften wie Adressfamilie, Transportprotokoll und IP-Ports.
Binderegel := { [Adressfamilie:][Transportprotokoll:][IP-Ports] | any }
Adressfamilie := { ipv4 | ipv6 }
Transportprotokoll := { tcp | udp }
IP-Ports:= { IP-Port | IP-Port-Bereich }
Eine optionale Adressfamilie erwartet die Werte ipv4 oder ipv6. Falls nicht angegeben, passt eine Regel auf sowohl IPv4- als auch IPv6-Adressen und wird abhängig von anderen Socket-Felder angewendet, z.B. Transportprotokoll, IP-Port.
Ein optionales Transportprotokoll erwartet den Transportprotokollnamen tcp oder udp. Falls nicht festgelegt, passt eine Regel auf jedes Transportprotokoll.
Ein optionaler Wert IP-Port muss innerhalb des Intervalls 1…65535 (einschließlich) liegen, d.h. der dynamische Port 0 ist nicht erlaubt. Ein Bereich von fortlaufenden Ports wird durch IP-Port-Bereich IP-Port-niedrig-IP-Port-hoch beschrieben, wobei IP-Port-niedrig kleiner oder gleich IP-Port-hoch ist und beide innerhalb von 1…65535 (einschließlich) liegen.
Ein besonderer Wert any kann zum Anwenden einer Regel für jede Adressfamilie, jedes Transportprotokoll und jeden Port mit einem positiven Wert verwandt werden.
Um mehrere Regeln zu erlauben, weisen Sie SocketBindAllow= oder SocketBindDeny= mehrfach zu. Um eine Zuweisung zurückzusetzen, übergeben Sie eine leere Zuweisung SocketBindAllow= oder SocketBindDeny=.
Für sowohl SocketBindAllow= als auch SocketBindDeny= ist die maximale Anzahl an Zuweisungen 128.
Die Funktionalität ist mit Cgroup-BPF-Hooks cgroup/bind4 und cgroup/bind6 implementiert.
Beachten Sie, dass diese Einstellungen für jeden Systemaufruf durch den Unit-Prozess von bind(2) gilt, unabhängig davon, in welchem Netzwerknamensraum er erfolgt. Oder mit anderen Worten: Das Ändern des Netzwerknamensraums ist kein geeigneter Mechanismus, um diesen Einschränkungen bei bind() zu entkommen.
Beispiele:
... # Erlaubt das Anbinden von IPv6-Socket-Adressen mit Ports größer oder gleich 10000. [Service] SocketBindAllow=ipv6:10000-65535 SocketBindDeny=any … # Erlaubt das Anbinden von IPv4- und IPv6-Socket-Adressen mit 1234 und 4321 Ports. [Service] SocketBindAllow=1234 SocketBindAllow=4321 SocketBindDeny=any … # Verweigert das Anbinden von IPv6-Socket-Adressen. [Service] SocketBindDeny=ipv6 … # Verweigert das Anbinden von IPv4- und IPv6-Socket-Adressen. [Service] SocketBindDeny=any … # Erlaubt das Anbinden nur über TCP [Service] SocketBindAllow=tcp SocketBindDeny=any … # Erlaubt das Anbinden nur über IPv6/TCP [Service] SocketBindAllow=ipv6:tcp SocketBindDeny=any … # Erlaubt das Anbinden von Ports innerhalb des Bereichs 10000-65535 über IPv4/UDP. [Service] SocketBindAllow=ipv4:udp:10000-65535 SocketBindDeny=any …
Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.
Hinzugefügt in Version 249.
RestrictNetworkInterfaces=
Diese Option kann mehrfach aufauchen, dann werden die Netzwerkschnittstellennamen vereinigt. Falls die leere Zeichenkette zugewiesen wird, wird die Gruppe zurückgesetzt, alle vorherigen Zuweisungen haben keine Wirkung.
Falls Sie beide Typen dieser Option festlegen (d.h. Erlaubnisliste und Verbotsliste), wird die zuerst vorkommende Vorrang haben und die Standardaktion vorgeben (erlauben oder verbieten). Dann wird das nächste Vorkommen dieser Option die aufgeführten Netzwerkschnittstellennamen zu der Menge hinzufügen oder sie daraus entfernen, abhängig von seinem Typ und der Vorgabeaktion.
Die Loopback-Schnittstelle (»lo«) wird auf keine Weise besonders behandelt, Sie müssen sie explizit in der Unit-Datei konfigurieren.
Beispiel 1: Erlaubnisliste
RestrictNetworkInterfaces=eth1 RestrictNetworkInterfaces=eth2
Programme in dieser Unit-Datei werden nur in der Lage sein, die Netzwerkschnittstellen eth1 und eth2 zu verwenden.
Beispiel 2: Verbotsliste
RestrictNetworkInterfaces=~eth1 eth2
Programme in dieser Unit-Datei werden in der Lage sein, alle Netzwerkschnittstellen außer eth1 und eth2 zu verwenden.
Beispiel 3: gemischt
RestrictNetworkInterfaces=eth1 eth2 RestrictNetworkInterfaces=~eth1
Programme in der Unit-Datei werden nur in der Lage sein, die Netzwerkschnittstelle eth2 zu verwenden.
Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.
Hinzugefügt in Version 250.
NFTSet=Familie:Tabelle:Gruppe
Diese Option erwartet eine durch Leerraum getrennte Liste von NFT-Gruppendefinitionen. Jede Definition besteht aus einem Doppelpunkt-getrennten Tupel von Quelltyp (einer aus »cgroup«, »user«, »group«), NFT-Adressfamilie (einer aus »arp«, »bridge«, »inet«, »ip«, »ip6«, »netdev«), Tabellenname und Gruppenname. Die Namen der Tabellen und Gruppen müssen den lexikalischen Beschränkungen von NFT-Tabellennamen folgen. Der Typ des in NFT-Filtern verwandten Elements muss auf den durch die Direktive (»cgroup«, »user« oder »group«) implizierten Typ passen, wie in der nachfolgenden Tabelle gezeigt. Wenn eine Control-Gruppe oder eine Unit realisiert wird, wird die entsprechende Kennung an die NFT-Gruppen angehängt und sie wird entfernt, wenn die Control-Gruppe oder Unit entfernt wird. systemd fügt nur Elemente in die Gruppen ein (entfernt sie daraus), daher müssen die NFT-Regeln, -Tabllen und -Gruppen vorher woanders erstellt werden. Fehler beim Verwalten der Gruppen werden ignoriert.
Tabelle 2. Definierte Quelltyp-Werte
Quelltyp | Beschreibung | Entsprechender NFT-Typname |
"cgroup" | Control-Gruppen-Kennung | "cgroupsv2" |
"user" | Benutzerkennung | "meta skuid" |
"group" | Gruppenkennung | "meta skgid" |
Falls die Firewallregeln neu installiert werden, so dass die NFT-Gruppen zerstört werden, kann der Befehl systemctl daemon-reload zur Wiederbefüllung der Gruppen verwandt werden.
Beispiel:
[Unit] NFTSet=cgroup:inet:filter:my_service user:inet:filter:serviceuser
Entsprechende NFT-Regeln:
table inet filter {
set my_service {
type cgroupsv2
}
set serviceuser {
typeof meta skuid
}
chain x {
socket cgroupv2 level 2 @my_service accept
drop
}
chain y {
meta skuid @serviceuser accept
drop
} }
Diese Option ist nur für Systemdienste verfügbar und wird nicht für Dienste unterstützt, die in benutzerbezogenen Instanzen des Diensteverwalters laufen.
Hinzugefügt in Version 255.
BPF-Programme¶
IPIngressFilterPath=BPF_FS_PROGRAM_PATH, IPEgressFilterPath=BPF_FS_PROGRAM_PATH
Die mit dieser Option konfigurierten Filter werden auf allen von dieser Unit erstellten Sockets (oder im Falle von Socket-Units, allen der Unit zugeordneten) angewandt. Die Filter werden zusätzlich zu den Filter aller Eltern-Scheiben-Units, bei denen diese Unit ein Mitglied sein könnte, sowie sämtlichen IPAddressAllow=- und IPAddressDeny=-Filtern in jeden dieser Units geladen. Standardmäßig sind keine Filter festgelegt.
Falls diese Einstellungen mehrfach in der gleichen Unit verwandt werden, werden alle angegebenen Programme angehängt. Falls diesen Einstellungen eine leere Zeichenkette zugewiesen wird, wird die Programmliste zurückgesetzt und alle vorher angegebenen Programme ignoriert.
Falls der Pfad BPF_FS_PROGRAM_PATH in der Zuweisung IPIngressFilterPath= bereits durch einen Eingangs-Hook BPFProgram= gehandhabt wird, z.B. BPFProgram=ingress:BPF_FS_PROGRAM_PATH, dann wird die Zuweisung immer noch als gültig betrachtet und das Programm an eine Cgroup angehängt. Genauso für den Pfad IPEgressFilterPath= und den Hook egress.
Beachten Sie, dass für Socket-aktivierte Dienste die IP-Filterprogramme, die in der Socket-Unit konfiguriert sind, auf alle direkt zugeordneten Sockets angewandt werden, aber nicht auf irgendein Socket, das von den dafür schließlich aktivierten Diensten erstellt wurde. Umgekehrt werden die für die Dienste konfigurierten IP-Filterprogramme nicht auf irgendein Socket angewandt, das dem Dienst über Socket-Aktivierung weitergegeben wird. Daher ist es im Allgemeinen eine gute Idee, die IP-Filterprogramme sowohl in der Socket- als auch der Dienste-Unit zu replizieren, allerdings ergibt es oft Sinn, eine Konfiguration offener und eine andere beschränkter zu verwalten, abhängig vom Einsatzfall.
Beachten Sie, dass diese Einstellungen auf einigen Systemen nicht unterstützt werden könnten (beispielsweise falls eBPF-Control-Gruppen-Unterstützung nicht im unterliegenden Kernel oder Container-Verwalter aktiviert ist). Diese Einstellungen führen in diesem Fall zu einem Fehlschlag des Dienstes. Falls Kompatibilität mit solchen Systemen gewünscht ist, wird daher empfohlen, ihre Filter manuell (benötigt Delegate=yes) anzuhängen, statt diese Einstellung zu verwenden.
Hinzugefügt in Version 243.
BPFProgram=Typ:Programmpfad
Die Spezifikation eines BPF-Programms besteht aus einem Paar aus BPF-Programmtyp und -Programmpfad im Dateisystem, wobei »:« der Trenner ist: Typ:Programmpfad.
Der BPF-Programmtyp ist äquivalent zu dem in bpftool(8) verwandten BPF-Anhängetyp. Er kann sein: egress, ingress, sock_create, sock_ops, device, bind4, bind6, connect4, connect6, post_bind4, post_bind6, sendmsg4, sendmsg6, sysctl, recvmsg4, recvmsg6, getsockopt oder setsockopt.
Der festgelegte Programmpfad muss ein absoluter Pfad sein, der eine BPF-Programm-Inode in dem bpffs-Dateisystem referenziert (dies bedeutet im Allgemeinen, dass er mit »/sys/fs/bpf/« beginnt). Falls ein festgelegtes Programm nicht existiert (d.h. es noch nicht in das BPF-Subsystem des Kernels hochgeladen wurde), wird es nicht installiert, aber mit der Unit-Aktivierung wird fortgefahren (in die Protokolle wird eine Warnung ausgegeben).
Durch Setzen von BPFProgram= auf einen leeren Wert werden vorherige Zuweisungen unwirksam.
Mehrfache Zuweisungen des gleichen Werts Programmtyp/Pfad-Paar haben die gleiche Auswirkung wie eine einzelne Zuweisung: Das Programm wird nur einmal angehängt.
Falls das auf Programmpfad befestigte BPF-egress bereits durch IPEgressFilterPath= behandelt wird, wird die Zuweisung BPFProgram= als gültig betrachtet und BPFProgram= an eine Cgroup angehängt. Ähnlich für den Hook ingress die Zuweisung IPIngressFilterPath=.
Mit BPFProgram= übergebene BPF-Programme werden an die Cgroup einer Unit mit dem BFP-Anhängeschalter multi angehängt, der weitere Anhängungen des gleichen Typs innerhalb der Cgroup-Hierarchie mit der Unit-Cgroup an der Spitze erlaubt.
Beispiele:
BPFProgram=egress:/sys/fs/bpf/egress-hook BPFProgram=bind6:/sys/fs/bpf/sock-addr-hook
Hinzugefügt in Version 249.
Gerätezugriff¶
DeviceAllow=
Wenn der Zugriff auf alle physischen Geräte verboten werden soll, kann stattdessen PrivateDevices= verwandt werden. Siehe systemd.exec(5).
Der Geräteknotenkennzeichner ist entweder ein Pfad zu einem Geräteknoten in dem Dateisystem, beginnend mit /dev/, oder eine Zeichenkette, die entweder mit »char-« oder »block-« beginnt und von einem Gerätegruppennamen, wie in /proc/devices aufgeführt, gefolgt wird. Letzteres ist nützlich, um eine Positivliste aller aktuellen und zukünftigen Geräte, die zu einer bestimmten Gerätegruppe gehören, auf einmal anzulegen. Die Gerätegruppe wird entsprechend der Dateinamen-Glob-Muster-Regeln abgeglichen, Sie können daher die Metazeichen »*« und »?« verwenden. (Beachten Sie, dass solche Glob-Metazeichen nicht für Geräteknotenpfadspezifikationen verfügbar sind) Um Geräteknoten gemäß Major-/Minor-Nummern abzugleichen, verwenden Sie Geräteknotenpfade in den Verzeichnissen /dev/char/ und /dev/block/. Allerdings wird das Abgleichen von Geräten mittels Major-/Minor-Nummer im Allgemeinen nicht empfohlen, da die Zuweisungen zwischen Systemen oder verschiedenen Kernelversionen weder stabil noch portierbar sind.
Beispiel: /dev/sda5 ist ein Pfad zu einem Geräteknoten, der sich auf ein ATA- oder SCSI-Blockgerät bezieht. »char-pts« und »char-alsa« sind Kennzeichner für alle Pseudo-TTY- bzw. alle ALSA-Sound-Geräte. »char-cpu/*« ist ein Kennzeichner, der auf alle Gerätegruppen mit CPU-Bezug passt.
Beachten Sie, dass auf diese Weise definierte Positivlisten nur Gerätegruppen referenzieren sollten, die zum Startzeitpunkt der Unit auflösbar sind. Sämtliche Geräte, die zu diesem Zeitpunkt nicht auflösbar sind, werden nicht zur Positivliste hinzugefügt. Um diese Einschränkung zu umgehen, können Sie Dienste-Units um eine Paar von After=modprobe@xyz.service- und Wants=modprobe@xyz.service-Zeilen ergänzen, die die notwendigen Kernelmodule laden, die die Gerätegruppe implementieren, falls sie fehlen. Beispiel:
... [Unit] Wants=modprobe@loop.service After=modprobe@loop.service [Service] DeviceAllow=block-loop DeviceAllow=/dev/loop-control …
Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.
Hinzugefügt in Version 208.
DevicePolicy=auto|closed|strict
strict
Hinzugefügt in Version 208.
closed
Hinzugefügt in Version 208.
auto
Hinzugefügt in Version 208.
Diese Option kann nicht durch Voranstellen von »+« vor den Ausführungspfad in der Dienste-Unit umgangen werden, da sie für die gesamte Control-Gruppe gilt.
Hinzugefügt in Version 208.
Control-Gruppen-Verwaltung¶
Slice=
Diese Option kann zur Anordnung von Systemd-Units in einer Hierarchie von Scheiben verwandt werden, bei der bei jeder Scheibe Ressourceneinstellungen angewandt werden können.
Für Units vom Typ »Scheibe« ist der einzige für diese Einstellung akzeptierte Wert die Elternscheibe. Da der Name einer Scheiben-Unit die Elternscheibe impliziert, ist es daher immer redundant, diesen Parameter direkt für Scheiben-Units zu setzen.
Besondere Vorsicht sollten Sie walten lassen, wenn Sie sich auf die Vorgabe-Scheibenzuweisung in vorlagenbasierten Dienste-Units, die DefaultDependencies=no gesetzt haben, verlassen, siehe systemd.service(5) Abschnitt »Standardabhängigkeiten« für Details.
Hinzugefügt in Version 208.
Delegate=
Wenn dies aktiviert ist, wird der Diensteverwalter es unterlassen, die Control-Gruppen zu verändern oder Prozesse unterhalb der Control-Gruppe der Unit zu verschieben, so dass ein klares Konzept der Eigentümerschaft etabliert wird: der Control-Gruppenbaum auf der Ebene der Control-Gruppe der Unit ond oberhalb (d.h. in Richtung der Wurzel-Control-Gruppe) gehört dem Diensteverwalter des Rechners und wird von ihm verwaltet, während der Control-Gruppenbaum unterhalb der Control-Gruppe der Unit der Unit selbst gehört und von dieser verwaltet wird.
Akzeptiert entweder ein logisches Argument oder eine (möglicherweise leere) Liste von Namen von Control-Gruppen-Controllern. Falls true, wird die Delegierung eingeschaltet und alle für die Unit unterstützten Controller werden aktiviert, wodurch sie für die Verwaltung der Prozesse der Unit verfügbar werden. Falls false, wird die Delegierung komplett ausgeschaltet (und keine zusätzlichen Controller werden aktiviert). Falls auf eine Liste von Controllern gesetzt, wird die Delegierung eingeschaltet und die festgelegten Controller werden für die Unit aktiviert. Zuweisung der leeren Liste wird Delegierung aktivieren, aber die Liste der Controller zurücksetzen, und alle vorherigen Zuweisungen haben keine Auswirkung. Beachten Sie, dass andere als die festgelegten Controller auch verfügbar gemacht werden können, abhängig von der Konfiguration der enthaltenen Scheibe oder anderer, darin enthaltener Units. Standardmäßig false.
Beachten Sie, dass Controller-Delegation an weniger privilegierten Code nur auf der vereinigten Control-Gruppenhierarchie sicher ist. Entsprechend wird der Zugriff auf die angegebenen Controller nicht an unprivilegierte Dienste auf der veralteten Hierarchie gewährt, selbst falls dies angefragt wurde.
Die folgenden Controller-Namen können festgelegt werden: cpu, cpuacct, cpuset, io, blkio, memory, devices, pids, bpf-firewall, und bpf-devices.
Nicht alle dieser Controller sind allerdings auf allen Kerneln verfügbar und einige sind spezifisch für die vereinigte Hierarchie, während andere für die veraltete Hierarchie spezifisch sind. Beachten Sie auch, dass der Kernel weitere Controller unterstützen könnte, die hier noch nicht berücksichtigt sind, da Delegation hierfür überhaupt noch nicht unterstützt wird oder noch nicht sauber definiert ist.
Beachten Sie, dass aufgrund der hierarchischen Natur der Cgroup-Hierarchie alle delegierten Controller für die Eltern- und Geschwister-Units der Units der Delegierung aktiviert werden.
Für weitere Details über das Delegationsmodell ziehen Sie bitte Control-Gruppen-APIs und Delegierung[12] heran.
Hinzugefügt in Version 218.
DelegateSubgroup=
Diese Option ist nützlich, um das manuelle Verschieben des aufgerufenen Prozesses in eine Untergruppe zu vermeiden, nachdem dieser gestartet wurde. Da kein Prozess in den inneren Inodes der Control-Gruppenbaumes leben sollte, ist es fast immer notwendig, den Hauptprozess (»Überwacher«) einer Unit, bei der Delegierung eingeschaltet ist, in einer Untergruppe auszuführen.
Hinzugefügt in Version 254.
DisableControllers=
Es können mehrere Controller durch Leerzeichen getrennt angegeben werden. Sie können auch DisableControllers= mehrfach angeben, dann wird jede neue Instanz einen anderen Controller zum Deaktivieren hinzufügen. Wird DisableControllers= selbst ohne vorhandenen Controller-Namen übergeben, dann wird die Liste der deaktivierten Controller zurückgesetzt.
Es mag nicht möglich sein, einen Controller zu deaktivieren, nachdem die Units gestartet wurden, falls die Unit oder eines der Kinder dieser Unit Controller an seine Kinder delegiert, da kein delegierter Unterbaum der Control-Gruppenhierarchie durch Systemd verwaltet wird.
Die folgenden Controller-Namen können festgelegt werden: cpu, cpuacct, cpuset, io, blkio, memory, devices, pids, bpf-firewall, und bpf-devices.
Hinzugefügt in Version 240.
Speicherdruck-Steuerung¶
ManagedOOMSwap=auto|kill, ManagedOOMMemoryPressure=auto|kill
Wird dies auf kill gesetzt, dann wird die Unit ein Kandidat für die Überwachung durch systemd-oomd. Falls die Cgroup die durch oomd.conf(5) oder die Unit-Konfiguration gesetzten Beschränkungen überschreitet, dann wird systemd-oomd eine Nachkommens-Cgroup auswählen und SIGKILL an alle darunter befindlichen Prozesse senden. Sie erhalten weitere Details über Kandidaten und das Tötenverhalten unter systemd-oomd.service(8) und oomd.conf(5).
Wird eine dieser Eigenschaften auf kill gesetzt, führt dies zu Abhängigkeiten After= und Wants= auf systemd-oomd.service außer DefaultDependencies=no.
Wird dies auf auto gesetzt, dann wird systemd-oomd nicht aktiv diese Cgroup-Daten zur Überwachung und Erkennung verwenden. Falls allerdings eine Vorfahr-Cgroup eine dieser Eigenschaften auf kill gesetzt hat, dann kann eine Unit mit auto weiterhin ein Kandidat für systemd-oomd zum Beenden sein.
Hinzugefügt in Version 247.
ManagedOOMMemoryPressureLimit=
Hinzugefügt in Version 247.
ManagedOOMMemoryPressureDurationSec=
Hinzugefügt in Version 257.
ManagedOOMPreference=none|avoid|omit
Bei der Berechnung von Kandidaten, um die Verwendung des Auslagerungsspeichers zu reduzieren, wird systemd-oomd diese erweiterten Attribute nur respektieren, falls die Cgroup der Unit root gehört.
Bei der Berechnung von Kandidaten, um Speicherdruck zu reduzieren, wird systemd-oomd diese erweiterten Attribute nur respektieren, falls der Eigentümer der Cgroup root ist oder falls der Eigentümber der Cgrop und der des Vorgängers identisch sind. Falls beispielsweise systemd-oomd Kandiaten für -.slice berechnet, werden die auf die Nachfahren von /user.slice/user-1000.slice/user@1000.service/ gesetzten erweiterten Attribute ignoriert, da die Nachfahren UID 1000 gehören und -.slice UID 0 gehört. Falls aber Kandidaten für /user.slice/user-1000.slice/user@1000.service/ berechnet werden, dann werden auf die Nachfahren gesetzte erweiterte Attribute respektiert.
Falls diese Eigenschaft auf avoid gesetzt ist, wird der Diensteverwalter dies systemd-oomd mitteilen, der diese Cgroup nur auswählen wird, wenn es keinen anderen brauchbaren Kandidaten gibt.
Falls diese Eigenschaft auf omit gesetzt ist, wird der Diensteverwalter dies systemd-oomd mitteilen, der diese Cgroup als Kandidat ignorieren und keinerlei Aktion auf ihr ausführen wird.
Es wird empfohlen, avoid und omit nur vereinzelt zu verwenden, da es das Kill-Verhalten von systemd-oomd negativ beeinflussen kann. Beachten Sie auch, dass diese erweiterten Attribute nicht rekursiv auf Cgroups unterhalb der Cgroup dieser Unit angewandt werden.
Standardmäßig none, was bedeutet, dass systemd-oomd die Cgroup dieser Unit wie in systemd-oomd.service(8) und oomd.conf(5) definiert einordnen wird.
Hinzugefügt in Version 248.
MemoryPressureWatch=
Beachten Sie, dass Dienste die Freiheit haben, die zwei Umgebungsvariablen zu verwenden, aber es unproblematisch ist, wenn sie sie ignorieren. Der Umgang mit Speicherdruck muss in jedem Dienst individuell implementiert werden und bedeutet normalerweise verschiedene Dinge für verschiedene Software. Weitere Details zum Umgang mit Speicherdruck finden Sie in Umgang mit Speicherdruck in Systemd[13].
Mittels sd-event(3) implementierte Dienste können sd_event_add_memory_pressure(3) verwenden, um auf Speicherdruckereignisse zu beobachten und damit umzugehen.
Falls nicht explizit gesetzt ist die Vorgabe für die Einstellung DefaultMemoryPressureWatch= in systemd-system.conf(5).
Hinzugefügt in Version 254.
MemoryPressureThresholdSec=
Hinzugefügt in Version 254.
Speicherauszugs-Steuerung¶
CoredumpReceive=
Wenn systemd-coredump(8) einen Speicherauszug für einen Prozess aus einem Container handhabt und falls der leitende Prozess des Containers ein Nachkommen der Group mit CoredumpReceive=yes und Delegate=yes ist, dann wird systemd-coredump(8) versuchen, den Speicherauszug an systemd-coredump(8) innerhalb des Containers weiterzuleiten. Siehe auch systemd-coredump(8).
Hinzugefügt in Version 255.
GESCHICHTE¶
systemd 252
Hinzugefügt in Version 252.
SIEHE AUCH¶
systemd(1), systemd-system.conf(5), systemd.unit(5), systemd.service(5), systemd.slice(5), systemd.scope(5), systemd.socket(5), systemd.mount(5), systemd.swap(5), systemd.exec(5), systemd.directives(7), systemd.special(7), systemd-oomd.service(8), Die Dokumentation für Control-Gruppen und bestimmte Controller im Linux-Kernel: Control-Gruppen v2[2]
ANMERKUNGEN¶
- 1.
- Neue Control-Gruppen-Schnittstellen
- 2.
- Control-Gruppen v2
- 3.
- CFS-Scheduler
- 4.
- CFS-Bandbreitensteuerung
- 5.
- Speicherschnittstellen-Dateien
- 6.
- Zswap
- 7.
- PIDS-Controller
- 8.
- E/A-Schnittstellen-Dateien
- 9.
- NFT
- 10.
- bpf.h
- 11.
- BPF-Dokumentation
- 12.
- Control-Gruppen-APIs und Delegierung
- 13.
- Umgang mit Speicherdruck in Systemd
- 14.
- Control-Gruppen Version 1
ÜBERSETZUNG¶
Die deutsche Übersetzung dieser Handbuchseite wurde von Helge Kreutzmann <debian@helgefjell.de> erstellt.
Diese Übersetzung ist Freie Dokumentation; lesen Sie die GNU General Public License Version 3 oder neuer bezüglich der Copyright-Bedingungen. Es wird KEINE HAFTUNG übernommen.
Wenn Sie Fehler in der Übersetzung dieser Handbuchseite finden, schicken Sie bitte eine E-Mail an die Mailingliste der Übersetzer.
systemd 257.1 |