应用部署相关问题排障

本文用于介绍对虚拟机部署组或实例执行部署、启动、停止等操作出现非预期状况时的排障步骤

  1. 向用户问询APPID(在控制台的账号信息页面有显示),所使用的地域(仅公有云或TCE需要),及出现问题的部署组ID或实例ID

  2. 进入相应地域的运营端页面,【资源运营】-【应用服务器管理】,输入部署组ID或实例ID再点【查询】,在返回的列表中查看实例的「Agent状态」,并记下「Agent版本」,若为「异常」则让用户检查其虚拟机健康状态,否则进入下一步

图片描述

  1. 如果是公有云,可以进入上帝之眼,输入APPID找到部署组关联的应用ID,到【应用管理】页面找到它,点进应用详情,切到【变更记录】,找到相应的操作任务,记下它的「任务ID」,点小箭头展开任务详情,检查「任务状态」以及成功数、失败数、变更中的实例数;如果是私有云,则指导售后或用户执行以上步骤

图片描述

  1. 指导用户或售后SSH到变更失败的实例上,将/root/tsf-agent/agent/log/agent.log(小于1.12的版本为dsgp_agent.log,步骤2中「Agent版本」为空即为小于1.12的版本)文件中任务下发时间附近的日志,以及/root/tsf-agent/agent/task/<任务ID>全部内容截取出来,粘贴给研发检查

results matching ""

    No results matching ""