Linux 借用 ansible 来生成 linux 巡检报告

lework · 2019年11月04日 · 最后由 ndmizuki 回复于 2021年04月19日 · 1032 次阅读
本帖已被设为精华帖!

一直想做个关于资源巡检的功能,其需求就是通过邮件的形式来查看 linux 资源的使用情况,超出一定的阈值时高亮显示出来。也有人说啦,这个需求通过监控zabbix, prometheus都能做呀,何必自己重复造轮子做这些啊。我就是瞎折腾呗,只能说巡检报告是一总主动探测系统资源的一种手段,一般公司监控,外部都不能直接访问的,需要拨通 vpn 才可以,有些情况我们是无法连接到监控平台,比如放假游玩,不想打开电脑...这些情况下通过每天的巡检报告可以随时的了解系统资源的情况。

使用 task 方式获取报告

统计的系统资源

  • Hostname
  • Main IP
  • OS
  • CPU Used
  • CPU LoadAvg
  • Mem Used
  • Swap Used
  • Disk Size Used
  • Disk Inode Used
  • Tcp Connection Used
  • Timestamp

克隆 git 仓库

git clone https://github.com/lework/Ansible-roles.git /etc/ansible/roles/
mv /etc/ansible/roles/filter_plugins /etc/ansible/

这里我们只用到了filter_plugins, os-check role

在使用 role 之前,一定要查看 role 的README.md

定义主机

#/etc/ansible/hosts
[node2]
192.168.77.130 ansible_ssh_pass=123456

编写 playbook

#/etc/ansible/os-check.yaml
---
- hosts: all
  gather_facts: false
  vars:
    check_report_path: /tmp
    check_mail_host: "smtp.lework.com"
    check_mail_port: "465"
    check_mail_username: "ops@lework.com"
    check_mail_password: "le123456"
    check_mail_to: ["ops@lework.com"] 
  roles:
    - os-check

执行 playbook

ansible-playbook /etc/ansible/os-check.yaml

执行结果

报告文件存放在/tmp目录下

邮件中也能看到报告内容了

执行流程

简要的说下执行流程

  1. 使用脚本files\check_linux.sh在远端执行获取资源数据,并以 json 结构体返回。
  2. 使用jinja2模板将获取的数据渲染到模板文件中templates\report-cssinline.html,生成的文件存放在指定的目录中。
    • report-cssinline.html 是将 css 设置以inline的方式存储的 html 文件,report.html才是源模板文件,修改完源模板文件后,使用Responsive Email CSS Inliner进行转换下,才能更好的兼容邮件显示。
    • 其中模板中使用的get_check_data过滤器是从hostvars中获取每台主机的脚本执行结果,进行分析整理传递给模板,使用传递回来的数据进行渲染。
  3. 获取生成的模板文件内容,并通过 smtp 发送给接收人。

使用 fact 数据方式获取报告

上面的操作是我们通过自己写脚本获取系统数据,这种方式有执行速度快,自定义强的优点,也有兼容性差的问题,对各个系统支持的不全面。使用 fact 数据则是相反。

那下面我们就使用 ansible 的 fact 数据来生成巡检报告

统计的系统资源

  • Hostname
  • Main IP
  • OS
  • Mem Used
  • Swap Used
  • Disk Size Used
  • Disk Inode Used
  • Timestamp

配置脚本

将下列链接中的文件下载到ansible控制机上

https://github.com/lework/script/tree/master/python/facts_os_check

ansible.py 中我们配置 fact 目录和 smtp 信息

# 设置fact目录
fact_dirs = [os.path.join(current_path, 'facts')]


# 发送邮件
subject = 'System Check Report [%s]' % now_date
to_list = ['lework@ops.com']

mail_config = {
    'mail_host': 'smtp.lework.com',
    'mail_port': '465',
    'mail_user': 'ops@lework.com',
    'mail_pass': '123123'
}

执行脚本

使用 python3 环境

# 安装依赖
pip3 install jinja2

# 创建依赖目录
[ ! -d ./report ] && mkdir ./report
[ ! -d ./facts ] && mkdir ./facts

# 删除facts的生成目录
rm -rf ./facts

# 获取fact的数据
ansible all -m setup --tree ./facts

# 通过脚本对fact数据整理,并生成数据
python3 ansible.py

在每次生成 fact 文件时,需要对其目录进行清空操作,避免历史数据干扰。

巡检报告文件以日期命名的方式存放在当前的report目录下

lework 将本帖设为了精华贴 11月04日 13:23

找 ansible 无意看到这里,学习了

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册