:trollface: Self-hosted, lightweight server and website monitoring and O&M tool
Go to file
2021-09-27 21:18:09 +08:00
.github/workflows update ci 2021-09-04 12:51:02 +08:00
cmd 🔖 dashboard v0.10.0 2021-09-27 21:18:09 +08:00
model 🔖 dashboard v0.10.0 2021-09-27 21:18:09 +08:00
pkg gosec 2021-09-04 12:42:51 +08:00
proto [0.9.19] 进程数/连接数/负载 监控报警 2021-08-15 16:38:05 +08:00
resource dashboard: 服务监控请求时间间隔 2021-09-02 23:45:21 +08:00
script fix 2021-08-19 19:49:04 +08:00
service 🔖 dashboard v0.10.0 2021-09-27 21:18:09 +08:00
.gitattributes 💄 UI: 前端优化调整 2021-01-30 11:22:59 +08:00
.gitignore v0.9.22 WebSSH 2021-08-18 17:42:26 +08:00
.goreleaser.yml 📦 为 MT7621 系列路由添加 mipsle-softfloat 编译 close #128 2021-05-28 18:22:39 +08:00
Dockerfile 🔊 v0.3.0 计划任务(定期备份等场景) 2021-01-19 09:59:04 +08:00
go.mod ️ agent: SSL证书校验优化 2021-08-29 14:41:00 +08:00
go.sum ️ agent: SSL证书校验优化 2021-08-29 14:41:00 +08:00
LICENSE Create LICENSE 2021-03-22 17:41:38 +08:00
README.md 🔖 dashboard v0.10.0 2021-09-27 21:18:09 +08:00



LOGO designed by 熊大 .

   

:trollface: 哪吒监控 一站式轻监控轻运维系统。支持系统状态、HTTP(SSL 证书变更、即将到期、到期)、TCP、Ping 监控报警,命令批量执行和计划任务。

>> QQ 交流群872069346 加群要求:已搭建好哪吒监控 & 有 2+ 服务器

>> 我们的用户 (Google)

默认主题 DayNight @JackieSung hotaru
首页截图1

安装脚本

推荐配置: 安装前准备 两个域名,一个可以 接入 CDN 作为 公开访问,比如 (status.nai.ba);另外一个解析到面板服务器作为 Agent 连接 Dashboard 使用,不能接入 CDN 直接暴露面板主机 IP比如ip-to-dashboard.nai.ba

curl -L https://raw.githubusercontent.com/naiba/nezha/master/script/install.sh  -o nezha.sh && chmod +x nezha.sh
sudo ./nezha.sh

国内镜像加速:

curl -L https://cdn.jsdelivr.net/gh/naiba/nezha@master/script/install.sh -o nezha.sh && chmod +x nezha.sh
CN=true sudo ./nezha.sh

* 使用 WatchTower 可以自动更新面板Windows 终端可以使用 nssm 配置自启动(见尾部教程)

特殊技能

编辑 /etc/systemd/system/nezha-agent.service,在 ExecStart= 这一行的末尾加上

  • --skip-conn 不监控连接数,机场/连接密集型机器推荐设置不然比较占CPU(shirou/gopsutil/issues#220)
  • --disable-auto-update 禁止 Agent 自动更新

功能说明

计划任务:备份脚本、服务重启,等定期运维任务。

使用此功能可以定期结合 restic、rclone 给服务器备份,或者定期某项重启服务来重置网络连接。

报警通知负载、CPU、内存、硬盘、带宽、流量、月流量、进程数、连接数实时监控。

灵活通知方式

#NEZHA# 是面板消息占位符,面板触发通知时会自动替换占位符到实际消息

Body 内容是JSON 格式的:当请求类型为 FORM 时,值为 key:value 的形式,value 里面可放置占位符,通知时会自动替换。当请求类型为 JSON 时 只会简进行字符串替换后直接提交到URL

URL 里面也可放置占位符,请求时会进行简单的字符串替换。

参考下方的示例,非常灵活。

  1. 添加通知方式

    • server 酱示例

    • wxpusher 示例,需要关注你的应用

    • telegram 示例 @haitau 贡献

      • 名称telegram 机器人消息通知
      • URLhttps://api.telegram.org/botXXXXXX/sendMessage?chat_id=YYYYYY&text=#NEZHA#
      • 请求方式: GET
      • 请求类型: 默认
      • Body: 空
      • URL 参数获取说明botXXXXXX 中的 XXXXXX 是在 telegram 中关注官方 @Botfather ,输入/newbot 创建新的机器人bot会提供的 token在提示 Use this token to access the HTTP API:后面一行)这里 'bot' 三个字母不可少。创建 bot 后,需要先在 telegram 中与 BOT 进行对话(随便发个消息),然后才可用 API 发送消息。YYYYYY 是 telegram 用户的数字 ID。与机器人@userinfobot 对话可获得。
  2. 添加一个离线报警

    • 名称:离线通知
    • 规则:[{"Type":"offline","Duration":10}]
    • 启用:√
  3. 添加一个监控 CPU 持续 10s 超过 50% 内存持续 20s 占用低于 20% 的报警

    • 名称CPU+内存
    • 规则:[{"Type":"cpu","Min":0,"Max":50,"Duration":10},{"Type":"memory","Min":20,"Max":0,"Duration":20}]
    • 启用:√

报警规则说明

基本规则
  • type
    • cpumemoryswapdisk
    • net_in_speed 入站网速、net_out_speed 出站网速、net_all_speed 双向网速、transfer_in 入站流量、transfer_out 出站流量、transfer_all 双向流量
    • offline 离线监控
    • load1load5load15 负载
    • process_count 进程数 目前取线程数占用资源太多,暂时不支持
    • tcp_conn_countudp_conn_count 连接数
  • duration持续秒数秒数内采样记录 30% 以上触发阈值才会报警(防数据插针)
  • min/max
    • 流量、网速类数值 为字节1KB=1024B1MB = 1024*1024B
    • 内存、硬盘、CPU 为占用百分比
    • 离线监控无需设置
  • cover [{"type":"offline","duration":10, "cover":0, "ignore":{"5": true}}]
    • 0 监控所有,通过 ignore 忽略特定服务器
    • 1 忽略所有,通过 ignore 监控特定服务器
  • ignore: {"1": true, "2":false} 特定服务器,搭配 cover 使用
特殊:任意周期流量报警

可以用作月流量报警

  • type
    • transfer_in_cycle 周期内的入站流量
    • transfer_out_cycle 周期内的出站流量
    • transfer_all_cycle 周期内双向流量和
  • cycle_start 周期开始日期(可以是你机器计费周期的开始日期)
  • cycle_interval 小时(可以设为 1 月30*24
  • min/max、cover、ignore 参考基本规则配置
  • 示例: 3 号机器的每月 15 号计费的出站月流量 1T 报警 [{"type":"transfer_out_cycle","max":1000000000000,"cycle_start":"2021-07-15T08:00:00Z","cycle_interval":720,"cover":1,"ignore":{"3":true}}]
服务监控HTTP、SSL证书、ping、TCP 端口等。

进入 /monitor 页面点击新建监控即可,表单下面有相关说明。

自定义代码改LOGO、改色调、加统计代码等。
  • 默认主题更改进度条颜色示例

    <style>
    .ui.fine.progress> .bar {
        background-color: pink !important;
    }
    </style>
    
  • DayNight 主题更改进度条颜色示例(来自 @hyt-allen-xu

    <style>
    .ui.fine.progress> .progress-bar {
      background-color: #00a7d0 !important;
    }
    </style>
    
  • 默认主题修改 LOGO、移除版权示例来自 @iLay1678

    <style>
    .right.menu>a{
    visibility: hidden;
    }
    .footer .is-size-7{
    visibility: hidden;
    }
    .item img{
    visibility: hidden;
    }
    </style>
    <script>
    window.onload = function(){
    var avatar=document.querySelector(".item img")
    var footer=document.querySelector("div.is-size-7")
    footer.innerHTML="Powered by 你的名字"
    footer.style.visibility="visible"
    avatar.src="你的方形logo地址"
    avatar.style.visibility="visible"
    }
    </script>
    
  • DayNight 移除版权示例(来自 @hyt-allen-xu

    <script>
    window.onload = function(){
    var footer=document.querySelector("div.footer-container")
    footer.innerHTML="©2021 你的名字 & Powered by 你的名字"
    footer.style.visibility="visible"
    }
    </script>
    
  • hotaru 主题更改背景图片示例

    <style>
    .hotaru-cover {
       background: url(https://s3.ax1x.com/2020/12/08/DzHv6A.jpg) center;
    }
    </style>
    

常见问题

如何进行数据迁移、备份恢复?

数据储存在 /opt/nezha 文件夹中,迁移数据时打包这个文件夹,到新环境解压。然后执行一键脚本安装即可

Agent 不断重启/无法启动
  1. 直接执行 /opt/nezha/agent/nezha-agent -s 面板IP或非CDN域名:面板RPC端口 -p Agent密钥 -d 查看日志是否是 DNS 问题。
  2. nc -v 域名/IP 面板RPC端口 或者 telnet 域名/IP 面板RPC端口 检验是否是网络问题,检查本机与面板服务器出入站防火墙,如果单机无法判断可借助 https://port.ping.pe/ 提供的端口检查工具进行检测。
  3. 如果上面步骤检测正常Agent 正常上线,尝试关闭 SELinux如何关闭 SELinux
如何使 OpenWrt/LEDE 自启动?来自 @艾斯德斯

首先在 release 下载对应的二进制解压 tar.gz 包后放置到 /root,然后 chmod +x /root/nezha-agent 赋予执行权限,然后创建 /etc/init.d/nezha-service

#!/bin/sh /etc/rc.common

START=99
USE_PROCD=1

start_service() {
 procd_open_instance
 procd_set_param command /root/nezha-agent -s 面板网址:接收端口 -p 唯一秘钥 -d
 procd_set_param respawn
 procd_close_instance
}

stop_service() {
    killall nezha-agent
}

restart() {
 stop
 sleep 2
 start
}

赋予执行权限 chmod +x /etc/init.d/nezha-service 然后启动服务 /etc/init.d/nezha-service enable && /etc/init.d/nezha-service start

实时通道断开/终端连接失败 使用反向代理时需要针对 `/ws` 路径的 WebSocket 进行特别配置以支持实时更新服务器状态。
  • Nginx(宝塔):在你的 nginx 配置文件中加入以下代码

    server{
    
        #原有的一些配置
        #server_name blablabla...
    
        location ~ ^/(ws|terminal/.+)$  {
            proxy_pass http://ip:站点访问端口;
            proxy_http_version 1.1;
            proxy_set_header Upgrade $http_upgrade;
            proxy_set_header Connection "Upgrade";
            proxy_set_header Host $host;
        }
    
        #其他的 location blablabla...
    }
    
  • CaddyServer v1v2 无需特别配置)

    proxy /ws http://ip:8008 {
        websocket
    }
    proxy /terminal/* http://ip:8008 {
        websocket
    }
    

社区文章

SEO 云探针、多服务器探针、云监控、多服务器云监控