1.
交接与初始核验(第一天必须完成)
交接清单:列出域名、服务器IP、SSH账号、控制面板(cPanel/DirectAdmin/宝塔等)、数据库账号、FTP/SFTP信息、DNS提供商与恒创科技支持渠道。
操作步骤:1) 使用SSH登录:ssh root@IP(要求恒创提供密钥或临时口令);2) 执行uname -a && lsb_release -a核验系统;3) 列出站点目录:ls -la /var/www 或 /home/wwwroot/;4) 确认数据库:mysql -u root -p -e "SHOW DATABASES;"。
注意点:所有密码和密钥建议立即变更并记录到企业密码管理器(例如1Password/Bitwarden)。
2.
完整备份与恢复演练(必须自动化)
备份策略:每日数据库热备、每晚文件增量、每周全量异地备份(香港->国内或海外S3)。
实操命令示例:数据库备份:mysqldump -u root -p'密码' --single-transaction --databases site_db > /backup/site_db_$(date +%F).sql;文件同步:rsync -az --delete /var/www/ s3bucket:/sitefiles/;全自动脚本:创建 /usr/local/bin/backup_site.sh 并加入 crontab:0 2 * * * /usr/local/bin/backup_site.sh。
恢复演练:每月在测试环境恢复一次:mysql -u root -p site_db < /backup/site_db_xxx.sql;rsync --progress s3bucket:/sitefiles/ /var/www/,验证站点能正常访问并记录耗时。
3.
监控与告警配置(小时级响应)
建议工具:Prometheus+Grafana 或 Zabbix,外加 UptimeRobot/StatusCake 简单可用性监控;日志聚合推荐 ELK 或者 Grafana Loki。
配置示例:安装 node_exporter 监控主机:systemctl enable --now node_exporter;Prometheus scrape 配置增加目标 IP:9100;在 Grafana 创建仪表盘监控 CPU、内存、磁盘、95% 响应时间。
告警设置:当 5 分钟内 HTTP 失败率 > 3 次或磁盘使用 > 85% 时触发钉钉/企业微信/邮件告警,并规定响应SLA(例如:接单30分钟内、解决4小时内)。
4.
SSL/证书管理与自动续期(确保HTTPS全天候)
证书类型与策略:优先使用 Let’s Encrypt 免费证书或由恒创提供商业证书;对多域名站群使用通配符或每域单证书。
自动续期实操:安装 certbot:apt-get install certbot;申请命令:certbot certonly --webroot -w /var/www/site -d example.com -d www.example.com;续期测试:certbot renew --dry-run;crontab 添加:0 3 * * * certbot renew --post-hook "systemctl reload nginx"。
异常处理:若续期失败,登录 /var/log/letsencrypt/ 查找错误并临时手动续期或上传商业证书到 /etc/letsencrypt/live/ 替换。
5.
DNS、CDN 与 IP 管理(降低被封风控风险)
DNS规范:使用恒创建议的DNS或主流云解析(Cloudflare/DNSPod),所有站群记录统一管理并开启DNSSEC(如支持)。
CDN与缓存:推荐使用 Cloudflare 或恒创合作的CDN节点,配置缓存规则、页面规则、缓存预热和PURGE接口。
IP与反作弊:保持IP池多样化,避免单出口大量站群请求。对外公布 WhoIs 信息时注意隐私保护,必要时使用独立IP或IP段分配给不同站群以降低关联风险。
6.
安全加固与应急处置(降低被攻击与入侵影响)
基础加固:关闭不必要端口(iptables/ufw)、禁用root直接登录(修改 /etc/ssh/sshd_config PermitRootLogin no)、安装 Fail2Ban 阻止暴力登录。
WAF与扫描:部署 Web 应用防火墙(ModSecurity、云端WAF)并定期用 Nikto/OWASP ZAP 扫描。
应急流程:发现被挂马或被列入黑名单,第一时间隔离受影响站点(nginx 配置返回 503),导出日志并进行 Forensic:cp /var/log/nginx/access.log /tmp/;使用 maldet 或 rkhunter 检查后恢复到最近可信备份,提交工单给恒创请求网络封锁或IP变更。
7.
性能优化与SEO友好设置(直接影响收录与排名)
前端优化:开启 gzip/brotli、配置正确的 Cache-Control、用 nginx 配置 expires,启用图片 WebP/懒加载并使用 CDN。
SEO配置信息:每个站点应有正确的 canonical、hreflang(多语言时)、sitemap.xml、robots.txt、结构化数据(JSON-LD)。把 sitemap 放到站点根并在 Google Search Console/Bing Webmaster/Baidu站长平台提交。
爬虫与抓取策略:控制抓取速率(robots 中或 Search Console 的 crawl-delay),对站群使用不同子域或独立域名分散抓取,避免短期内大量并发导致被搜索引擎临时降权。
8.
版本管理与发布流程(避免线上直接改动)
建议工具链:使用 Git 管理代码,采用分支策略(master/staging/dev),每次发布通过 CI(Jenkins/GitLab CI)执行自动化测试与部署。
部署步骤(示例):1) 开发分支合并到 staging;2) CI 构建并推送到测试服务器;3) 测试通过后在生产执行:git pull && composer install && php artisan migrate --force && systemctl reload php-fpm && nginx -s reload。
回滚机制:保持至少3个历史发布包,使用 rsync 或 tar 快速回滚:tar -xzvf release_20260301.tar.gz -C /var/www/;并运行回滚后的健康检查脚本。
9.
日常巡检与月度报告(确保长期稳定)
巡检清单(每天/每周/月):每天检查站点可用性、磁盘、证书到期;每周检查日志异常、慢查询;每月做安全扫描、备份恢复演练及SEO收录统计。
报告内容:包含可用率、主要告警、备份状态、流量趋势、Top慢请求、索引与爬取情况,提交给业务方与恒创技术支持并记录到运维日志系统。
SLA与联系人:明确恒创提供的支持级别(电话/邮件/工单响应时间、节假日支持),并在公司内设置值班表。
10.
常见故障处理快速手册(便于现场应对)
网站502/504:检查后端服务(php-fpm/nginx/upstream)状态:systemctl status php-fpm;查看 nginx 错误日志 /var/log/nginx/error.log;重启后端服务并观察连接数。
流量突增/被CC:临时启用 CDN 的“我在路上”或 WAF 限制,并在 nginx 添加 rate_limit 配置:limit_req_zone $binary_remote_addr zone=one:10m rate=1r/s;封堵可疑IP。
搜索降权:检查是否有大规模重复内容、被黑、robots误配置或服务器返回大量5xx,修复后提交重新索引申请并保留沟通记录。
11.
问:选择恒创科技的香港站群后,日常备份如何设置最安全?
答:建议采用“本地快照+异地冷备+云端长久存储”的三层备份策略:每天用脚本做数据库热备(mysqldump 或 xtrabackup),文件增量用 rsync 同步到异地S3或对象存储,并每周打包一次全量备份到第三方冷存(如阿里OSS/亚马逊S3),同时在服务器上保留最近7天的本地快照。所有备份脚本放入 crontab,并在每次备份后执行 md5 校验与失败告警。
12.
问:万一站群被搜索引擎集体降权,我该如何快速定位原因并恢复?
答:先从三方面排查:1) 内容与技术:检查是否被挂马、是否大量重复内容或 robots/sitemap 被误改;2) 服务器:查看是否出现长期5xx或响应过慢导致抓取失败;3) 外链与算法:是否存在垃圾外链或近期做了大量SEO黑帽操作。定位后,先修复安全问题并恢复备份,提交网站安全与索引复审(Google/Baidu),在此期间减少大规模内容和结构调整,逐步恢复并通过日志证据向搜索引擎申诉。
来源:选择香港站群 恒创科技后运维注意事项详解