1. 概述与适用范围
1) 本手册适用于部署在
越南CN2或类似优质国际骨干线路上的物理服务器与VPS(云主机)。
2) 涵盖日常备份、操作系统与应用更新、监控告警、DDoS防御以及应急响应流程。
3) 目标读者为运维工程师、站长与托管服务提供者,提供可落地的操作与示例数据。
4) 强调兼顾可用性(SLA)、数据完整性(备份与快照)、以及安全性(补丁与防护)。
5) 假定网络出口优先使用CN2线路,并与国内/国际CDN、抗DDoS服务配合以保证访问稳定性。
2. 日常备份策略(原则与流程)
1) 备份分类:数据库(全量+增量)、应用代码(Git+文件快照)、静态文件(对象存储或rsync)。
2) 调度安排:每日增量备份于02:00执行,周日全量备份并异地复制,保留增量14天、全量保留30天。
3) 备份工具示例:使用mysqldump或xtrabackup做数据库备份,rsync或rclone同步到异地存储,Borg/Restic做加密去重备份。
4) 校验与恢复演练:每周随机恢复至少一套站点到测试环境,验证备份可用性并记录恢复时间RTT/RTS。
5) 安全与加密:备份传输使用SFTP/HTTPS,备份存储开启服务器端加密(AES-256),并对存储访问使用最小权限策略。
3. 更新与补丁管理(流程、频率与回滚)
1) 更新分级:安全补丁(Critical/High)48小时内上线;功能更新/内核在周中灰度后周末全量部署。
2) 自动化工具:使用Ansible/Chef/Puppet管理补丁与配置,变更前在预生产环境做完整回归。
3) 回滚策略:每次更新前创建系统快照(支持0-15分钟内回滚的虚拟化/云平台),并记录变更清单。
4) 变更窗口:非重大更新可在2:00-05:00低峰期执行,更新后监控72小时为重点期。
5) 兼容性验证:数据库迁移、PHP/Python版本升级需先在容器或测试服验证并记录性能基线(如QPS和响应时间)。
4. 监控、告警与容量规划
1) 监控项:CPU、内存、磁盘使用率、磁盘IO、网络进出流量、连接数(如nginx/DB连接)、应用错误率。
2) 告警阈值示例:CPU>80%持续5分钟触发;磁盘使用>85%触发;网络入流量>200Mbps或PPS急增触发DDoS警报。
3) 工具栈建议:Prometheus+Grafana做时序监控,Alertmanager推送告警到钉钉/Slack/邮件,Zabbix做主机级监控也可选用。
4) 日志与审计:集中式日志(ELK/EFK)保存至少30天,关键操作开启审计日志并定期检查异常登录/IP。
5) 容量规划:每季度评估资源使用曲线,预留20%-30%弹性以应对突发流量或备份峰值(例如流量翻倍时确保带宽与IO裕度)。
5. DDoS防御与应急预案步骤
1) 防御分层:边缘CDN+WAF、供应商网络端清洗(抗DDoS)、主机层限速(iptables/nftables)、应用层限流。
2) 阈值与自动化:当流量超过基线的3倍且PPS突增,自动切换到流量清洗或将域名切换至CDN回源经过清洗。
3) 应急步骤(示例):发现攻击→通知站长与网络供应商→开启流量清洗→启用紧急限流策略→逐步恢复服务并记日志。
4) 具体防护策略:TCP SYN限制、连接追踪最大数、nginx限制请求速率、Cloudflare/Alibaba/腾讯云等供应商的Spectrum或云防护。
5) 演练与复盘:每半年模拟一次攻击演练,记录响应时间、误杀比与业务损失,形成改进清单并修订SOP。
6. 真实案例(脱敏)与服务器配置示例
1) 脱敏案例:某越南电商(化名A店)在促销期间遭遇SYN+HTTP流量混合攻击,入站流量峰值达500Mbps、PPS峰值约400k。
2) 应对经过:启动CDN全站缓存+供应商清洗,切换后台到只读模式并启用限速,30分钟内回稳,恢复后进行日志分析并拉黑攻击IP段。
3) 教训与改进:提前配置好流量清洗余量、设置自动化切换DNS以及定期更新WAF规则能显著缩短恢复时间。
4) 推荐标准服务器配置示例(适用于中等业务):见下表(示例配置及带宽/费用参考)。
| 项目 | 配置 / 数值 | 说明 |
| CPU | 8 cores (Intel Xeon) | 适合高并发应用 |
| 内存 | 16 GB | 数据库缓存与PHP进程 |
| 磁盘 | 500 GB NVMe | 系统与热数据 |
| 带宽 | 100 Mbps 保底,突发上限 1 Gbps | 配合CDN与清洗服务 |
| IP | 1 IPv4(公网) + IPv6 | 建议预留额外弹性IP |
5) 示例恢复命令与要点:常见备份恢复命令如rsync -a --delete /backup/www/ /var/www/(请在测试环境先验证),恢复后校验文件完整性与数据库一致性。
来源:越南cn2服务器维护手册包含日常备份、更新与应急预案示例