systemed 进程守护

2020-08-17/2021-12-03
0 评论 134 浏览

参考文献:

CentOS7使用systemctl添加自定义服务

史上最全的 Systemd 服务管理中文教程

systemctl自定义systemd.service服务设置守护进程

Linux06-服务、守护进程和systemd

systemctl可以实现nginx进程挂了之后自动重新启动

1. 简介

Centos7开机第一个程序从init完全换成了systemd这种启动方式,同centos 5 6已经是实质差别。systemd是靠管理unit的方式来控制开机服务,开机级别等功能。

/usr/lib/systemd/system 目录下包含了各种 unit 文件,有 .service 后缀的服务unit,有 .target 后缀的开机级别 unit 等,这里介绍关于 .service 后缀的文件。因为 systemd 在开机要想执行自启动,都是通过这些 .service 的unit控制的。

/usr/lib/systemd/system/ (软件包安装的单元)

/etc/systemd/system/(系统管理员安装的单元, 优先级更高)

2. 实例

以 cloudreve 进程为例

1# 编辑配置文件
2vim /usr/lib/systemd/system/cloudreve.service

将下文 PATH_TO_CLOUDREVE 更换为程序所在目录:

 1[Unit]
 2# 当前服务的简单描述
 3Description=Cloudreve
 4# 在 network.target 之后启动
 5After=network.target
 6# 表示弱依赖关系,network.target 启动失败也不影响继续执行
 7Wants=network.target
 8
 9[Service]
10# 可选,指定服务的工作目录,一般不带
11WorkingDirectory=/PATH_TO_CLOUDREVE
12# 启动当前服务的命令
13ExecStart=/PATH_TO_CLOUDREVE/cloudreve
14# 非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
15Restart=on-failure
16# 重启服务前等待的秒数
17RestartSec=5s
18
19[Install]
20WantedBy=multi-user.target
1# 更新配置
2systemctl daemon-reload
3
4# 启动服务
5systemctl start cloudreve
6
7# 设置开机启动
8systemctl enable cloudreve

管理命令:

 1# 启动服务
 2systemctl start cloudreve
 3
 4# 停止服务
 5systemctl stop cloudreve
 6
 7# 重启服务
 8systemctl restart cloudreve
 9
10# 查看状态
11systemctl status cloudreve

3. 解释

Systemd 默认从目录 /etc/systemd/system/ 读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录 /usr/lib/systemd/system/,真正的配置文件存放在那个目录。

systemctl enable 命令用于在上面两个目录之间,建立符号链接关系。

1sudo systemctl enable nginx.service
2# 等同于
3sudo ln -s '/usr/lib/systemd/system/nginx.service' '/etc/systemd/system/multi-user.target.wants/nginx.service'

如果配置文件里面设置了开机启动,systemctl enable命令相当于激活开机启动。

与之对应的,systemctl disable命令用于在两个目录之间,撤销符号链接关系,相当于撤销开机启动。

配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket。如果省略,Systemd 默认后缀名为.service,所以sshd会被理解成sshd.service

  1. [Unit]
    主要是对这个服务的说明,内容, 文档介绍以及对一些依赖服务定义
  2. [Service]
    服务的主体定义,主要定义服务的一些运行参数,及操作动作
  3. [Install]
    服务安装的相关设置,一般可设置为多用户的

4. Unit 段

  • Description:描述这个 Unit 文件的信息
  • Documentation:指定服务的文档,可以是一个或多个文档的 URL 路径
  • Requires:依赖的其它 Unit 列表,列在其中的 Unit 模板会在这个服务启动时的同时被启动。并且,如果其中任意一个服务启动失败,这个服务也会被终止
  • Wants:与 Requires 相似,但只是在被配置的这个 Unit 启动时,触发启动列出的每个 Unit 模块,而不去考虑这些模板启动是否成功
  • After:与 Requires 相似,但是在后面列出的所有模块全部启动完成以后,才会启动当前的服务
  • Before:与 After 相反,在启动指定的任务一个模块之间,都会首先确证当前服务已经运行
  • Binds To:与 Requires 相似,失败时失败,成功时成功,但是在这些模板中有任意一个出现意外结束或重启时,这个服务也会跟着终止或重启
  • Part Of:一个 Bind To 作用的子集,仅在列出的任务模块失败或重启时,终止或重启当前服务,而不会随列出模板的启动而启动
  • OnFailure:当这个模板启动失败时,就会自动启动列出的每个模块
  • Conflicts:与这个模块有冲突的模块,如果列出的模块中有已经在运行的,这个服务就不能启动,反之亦然

5. Service 段

用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段分为服务生命周期服务上下文配置两个方面。

  1. 服务生命周期控制相关
  • Type:定义启动时的进程行为,它有以下几种值:
    • Type=simple:默认值,执行ExecStart指定的命令,启动主进程
    • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
    • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
    • Type=dbus:当前服务通过D-Bus启动
    • Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
    • Type=idle:若有其他任务执行完毕,当前服务才会运行
  • RemainAfterExit:值为 true 或 false(默认)。当配置为 true 时,Systemd 只会负责启动服务进程,之后即便服务进程退出了,Systemd 也仍然会认为这个服务还在运行中。这个配置主要是提供给一些并非常驻内存,而是启动注册后立即退出,然后等待消息按需启动的特殊类型服务使用的。
  • ExecStart:启动当前服务的命令
  • ExecStartPre:启动当前服务之前执行的命令
  • ExecStartPos:启动当前服务之后执行的命令
  • ExecReload:重启当前服务时执行的命令
  • ExecStop:停止当前服务时执行的命令
  • ExecStopPost:停止当其服务之后执行的命令
  • RestartSec:自动重启当前服务间隔的秒数
  • Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括 always(总是重启)、on-success、on-failure、on-abnormal、on-abort、on-watchdog,推荐设为on-failure,对于那些允许发生错误退出的服务,可以设为on-abnormal
  • TimeoutStartSec:启动服务时等待的秒数,这一配置对于使用 Docker 容器而言显得尤为重要,因其第一次运行时可能需要下载镜像,严重延时会容易被 Systemd 误判为启动失败杀死。通常,对于这种服务,将此值指定为 0,从而关闭超时检测
  • TimeoutStopSec:停止服务时的等待秒数,如果超过这个时间仍然没有停止,Systemd 会使用 SIGKILL 信号强行杀死服务的进程
  1. 服务上下文配置相关
  • Environment:为服务指定环境变量
  • EnvironmentFile:指定加载一个包含服务所需的环境变量的列表的文件,文件中的每一行都是一个环境变量的定义
  • Nice:服务的进程优先级,值越小优先级越高,默认为 0。其中 -20 为最高优先级,19 为最低优先级
  • WorkingDirectory:指定服务的工作目录
  • RootDirectory:指定服务进程的根目录(/ 目录)。如果配置了这个参数,服务将无法访问指定目录以外的任何文件
  • User:指定运行服务的用户
  • Group:指定运行服务的用户组
  • MountFlags:服务的 Mount Namespace 配置,会影响进程上下文中挂载点的信息,即服务是否会继承主机上已有挂载点,以及如果服务运行执行了挂载或卸载设备的操作,是否会真实地在主机上产生效果。可选值为 shared、slaved 或 private
    • shared:服务与主机共用一个 Mount Namespace,继承主机挂载点,且服务挂载或卸载设备会真实地反映到主机上
    • slave:服务使用独立的 Mount Namespace,它会继承主机挂载点,但服务对挂载点的操作只有在自己的 Namespace 内生效,不会反映到主机上
    • private:服务使用独立的 Mount Namespace,它在启动时没有任何任何挂载点,服务对挂载点的操作也不会反映到主机上
  • LimitCPU / LimitSTACK / LimitNOFILE / LimitNPROC 等:限制特定服务的系统资源量,例如 CPU、程序堆栈、文件句柄数量、子进程数量等

注意:如果在 ExecStart、ExecStop 等属性中使用了 Linux 命令,则必须要写出完整的绝对路径。对于 ExecStartPre 和 ExecStartPost 辅助命令,若前面有个 “-” 符号,表示忽略这些命令的出错。因为有些 “辅助” 命令本来就不一定成功,比如尝试清空一个文件,但文件可能不存在。

6. Install 段

这部分配置的目标模块通常是特定运行目标的 .target 文件,用来使得服务在系统启动时自动运行。这个区段可以包含三种启动约束:

  • WantedBy:和 Unit 段的 Wants 作用相似,只有后面列出的不是服务所依赖的模块,而是依赖当前服务的模块。它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入 /etc/systemd/system 目录下面以 <Target 名> + .wants 后缀构成的子目录中,如 “/etc/systemd/system/multi-user.target.wants/“
 1# find /etc/systemd/system/* -type d
 2/etc/systemd/system/default.target.wants
 3/etc/systemd/system/getty.target.wants
 4/etc/systemd/system/graphical.target.wants
 5/etc/systemd/system/multi-user.target.wants
 6/etc/systemd/system/network-online.target.wants
 7/etc/systemd/system/paths.target.wants
 8/etc/systemd/system/shutdown.target.wants
 9/etc/systemd/system/sockets.target.wants
10/etc/systemd/system/sysinit.target.wants
11/etc/systemd/system/timers.target.wants
  • RequiredBy:和 Unit 段的 Wants 作用相似,只有后面列出的不是服务所依赖的模块,而是依赖当前服务的模块。它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入 /etc/systemd/system 目录下面以 <Target 名> + .required 后缀构成的子目录中
  • Also:当前 Unit enable/disable 时,同时 enable/disable 的其他 Unit
  • Alias:当前 Unit 可用于启动的别名

7. Unit 管理

Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。

Unit 一共分成12种。

  • Service unit:系统服务
  • Target unit:多个 Unit 构成的一个组
  • Device Unit:硬件设备
  • Mount Unit:文件系统的挂载点
  • Automount Unit:自动挂载点
  • Path Unit:文件或路径
  • Scope Unit:不是由 Systemd 启动的外部进程
  • Slice Unit:进程组
  • Snapshot Unit:Systemd 快照,可以切回某个快照
  • Socket Unit:进程间通信的 socket
  • Swap Unit:swap 文件
  • Timer Unit:定时器
 1# 列出正在运行的 Unit
 2systemctl list-units
 3
 4# 列出所有Unit,包括没有找到配置文件的或者启动失败的
 5systemctl list-units --all
 6
 7# 列出所有没有运行的 Unit
 8systemctl list-units --all --state=inactive
 9
10# 列出所有加载失败的 Unit
11systemctl list-units --failed
12
13# 列出所有正在运行的、类型为 service 的 Unit
14systemctl list-units --type=service
15
16# 设置开机启动,先开机重启,再启动
17systemctl enable apache
18
19# 设置开机不启动
20systemctl disable apache
21
22# 立即启动一个服务
23systemctl start apache
24
25# 显示单个 Unit 的状态
26systemctl status apache
27
28# 立即停止一个服务
29systemctl stop apache
30
31# 重启一个服务
32systemctl restart apache
33
34# 杀死一个服务的所有子进程
35systemctl kill apache
36
37# 重新加载一个服务的配置文件
38systemctl reload apache
39
40# 重载所有修改过的配置文件
41systemctl daemon-reload

status 的几种状态

loaded 系统服务已经初始化完成,加载过配置
actvie(running) 正常运行
actvie(exited) 正常结束的服务
active(waitting) 正在执行当中, 等待其他的事件才继续处理
inactive 服务关闭
enabled 服务开机启动
disabled 服务开机不自启
static 服务开机启动项不可被管理
falied 系统配置错误

依赖关系

Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。

systemctl list-dependencies命令列出一个 Unit 的所有依赖。

1systemctl list-dependencies nginx.service

上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如果要展开 Target,就需要使用--all参数。

1systemctl list-dependencies --all nginx.service

8. 系统管理

Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。

8.1 systemctl

systemctl是 Systemd 的主命令,用于管理系统。

 1# 重启系统
 2sudo systemctl reboot
 3
 4# 关闭系统,切断电源
 5sudo systemctl poweroff
 6
 7# CPU停止工作
 8sudo systemctl halt
 9
10# 暂停系统
11sudo systemctl suspend
12
13# 让系统进入冬眠状态
14sudo systemctl hibernate
15
16# 让系统进入交互式休眠状态
17sudo systemctl hybrid-sleep
18
19# 启动进入救援状态(单用户状态)
20sudo systemctl rescue

8.2 systemd-analyze

systemd-analyze命令用于查看启动耗时。

 1# 查看启动耗时
 2systemd-analyze                                                                                       
 3
 4# 查看每个服务的启动耗时
 5systemd-analyze blame
 6
 7# 显示瀑布状的启动过程流
 8systemd-analyze critical-chain
 9
10# 显示指定服务的启动流
11systemd-analyze critical-chain atd.service

8.3 hostnamectl

hostnamectl命令用于查看当前主机的信息。

1# 显示当前主机的信息
2hostnamectl
3
4# 设置主机名。
5sudo hostnamectl set-hostname rhel7

8.4 localectl

localectl命令用于查看本地化设置。

1# 查看本地化设置
2localectl
3
4# 设置本地化参数。
5sudo localectl set-locale LANG=en_GB.utf8
6sudo localectl set-keymap en_GB

8.5 timedatectl

timedatectl命令用于查看当前时区设置。

 1# 查看当前时区设置
 2timedatectl
 3
 4# 显示所有可用的时区
 5timedatectl list-timezones                                                                                   
 6
 7# 设置当前时区
 8sudo timedatectl set-timezone America/New_York
 9sudo timedatectl set-time YYYY-MM-DD
10sudo timedatectl set-time HH:MM:SS

8.6 loginctl

loginctl命令用于查看当前登录的用户。

1# 列出当前session
2loginctl list-sessions
3
4# 列出当前登录用户
5loginctl list-users
6
7# 列出显示指定用户的信息
8loginctl show-user ruanyf

9. 日志管理

Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用 journalctl 一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是 /etc/systemd/journald.conf

journalctl 功能强大,用法非常多。

 1# 查看所有日志(默认情况下 ,只保存本次启动的日志)
 2journalctl
 3
 4# 查看内核日志(不显示应用日志)
 5journalctl -k
 6
 7# 查看系统本次启动的日志
 8journalctl -b
 9journalctl -b -0
10
11# 查看上一次启动的日志(需更改设置)
12journalctl -b -1
13
14# 查看指定时间的日志
15journalctl --since="2012-10-30 18:17:16"
16journalctl --since "20 min ago"
17journalctl --since yesterday
18journalctl --since "2015-01-10" --until "2015-01-11 03:00"
19journalctl --since 09:00 --until "1 hour ago"
20
21# 显示尾部的最新10行日志
22journalctl -n
23
24# 显示尾部指定行数的日志
25journalctl -n 20
26
27# 实时滚动显示最新日志
28journalctl -f
29
30# 查看指定服务的日志
31journalctl /usr/lib/systemd/systemd
32
33# 查看指定进程的日志
34journalctl _PID=1
35
36# 查看某个路径的脚本的日志
37journalctl /usr/bin/bash
38
39# 查看指定用户的日志
40journalctl _UID=33 --since today
41
42# 查看某个 Unit 的日志
43journalctl -u nginx.service
44journalctl -u nginx.service --since today
45
46# 实时滚动显示某个 Unit 的最新日志
47journalctl -u nginx.service -f
48
49# 合并显示多个 Unit 的日志
50$ journalctl -u nginx.service -u php-fpm.service --since today
51
52# 查看指定优先级(及其以上级别)的日志,共有8级
53# 0: emerg
54# 1: alert
55# 2: crit
56# 3: err
57# 4: warning
58# 5: notice
59# 6: info
60# 7: debug
61journalctl -p err -b
62
63# 日志默认分页输出,--no-pager 改为正常的标准输出
64journalctl --no-pager
65
66# 以 JSON 格式(单行)输出
67journalctl -b -u nginx.service -o json
68
69# 以 JSON 格式(多行)输出,可读性更好
70journalctl -b -u nginx.serviceqq
71 -o json-pretty
72
73# 显示日志占据的硬盘空间
74journalctl --disk-usage
75
76# 指定日志文件占据的最大空间
77journalctl --vacuum-size=1G
78
79# 指定日志文件保存多久
80journalctl --vacuum-time=1years

标题:systemed 进程守护
作者:Rainsheep
地址:https://www.rainsheep.cn/articles/2020/08/17/1597678629939.html

评论
发表评论
       
       
取消