仅靠机器本身的监控指标(如 CPU 使用率、内存使用率等)并不足以准确衡量服务器的真实状态,还需要对进程的异常情况进行专项监控,包括过载、卡顿、内存泄露、crash 等。