Exchange Server 白手起家系列 Down 机了怎么办 ?.


62 views
Uploaded on:
Category: General / Misc
Description
Exchange Server 白手起家系列 Down 机了怎么办 ?. 喻 勇 , PMP/MCSE 微软最有价值专家,特约讲师 yy@yuyong.net 讲义下载: www.yuyong.net. 系列课程内容. 万事开头难 进行企业 IT 架构评估 做一个 Exchange 管理员必须掌握的技术 - 软件篇 做一个 Exchange 管理员必须掌握的技术 - 硬件篇 邮件系统设计和选型的原则 如何执行压力测试? 软件安装和服务器管理的规范化 用户和系统迁移过程中的注意事项 大规模的用户帐号管理、组管理中采用的常见策略 客户端部署和管理
Transcripts
Slide 1

Trade Server 白手起家系列 Down 机了怎么办 ? 喻 勇 , PMP/MCSE 微软最有价值专家,特约讲师 yy@yuyong.net 讲义下载: www.yuyong.net

Slide 2

系列课程内容 万事开头难 进行企业 IT 架构评估 做一个 Exchange 管理员必须掌握的技术 - 软件篇 做一个 Exchange 管理员必须掌握的技术 - 硬件篇 邮件系统设计和选型的原则 如何执行压力测试? 软件安装和服务器管理的规范化 用户和系统迁移过程中的注意事项 大规模的用户帐号管理、组管理中采用的常见策略 客户端部署和管理 邮件系统日常维护的要点 系统 SLA 和监控流程 邮件安全、反病毒和反垃圾邮件 存储备份策略 你的系统可靠性有几个 9 ? Down 机了怎么办? 常见问题汇总和答疑

Slide 3

今日议程 本讲主要讨论如何制定针对系统突发事件和问题的解决对策,通过案例分析的形式,来讨论在制定应急预案时需要注意的问题以及如何贮备有助于快速解决问题的关键资源。 案例分析 经验总结

Slide 4

案例情景 XYZ 的公司邮件服务器在深夜发生故障,我们通过回顾两位工程师 Tom 和 Jerry 解决问题的不同经过和途径,来分析在系统发生灾难性故障时,应该如何从容应对 本故事纯属虚构,如果雷同,实属巧合 Tom and Jerry 动画形象版权归其公司所有

Slide 5

Tom 的故事

Slide 6

Tom 的故事 ( 续 )

Slide 7

Tom 的故事 ( 续 )

Slide 8

Tom 的故事 ( 续 )

Slide 9

Tom 案例数据汇总 从发生问题到发现问题:六个半小时 从发现问题到定位问题原因:一个半小时 从定位问题到恢复故障:两个小时零 15 分钟 从恢复故障到恢复数据:五个半小时 故障共持续:十五个半小时 直接经济损失:公司的千万订单 间接经济损失: 公司的声誉 Tom 的工作

Slide 10

Jerry 的故事

Slide 11

Jerry 的故事 ( 续 )

Slide 12

Jerry 的故事 ( 续 )

Slide 13

Jerry 案例数据汇总 从发生问题到发现问题: 3 分钟 从发现问题到定位问题原因: 7 分钟 从定位问题到恢复故障: 55 分钟 从恢复故障到恢复数据:两个小时 故障共持续:三个小时 直接经济损失:无 间接经济损失:无

Slide 14

数据比对

Slide 15

服务器故障时间的组成部分 Mean Time to Repair ( MTTR ) " 总的停机时间 " 故障发生 检测到问题 诊断 修复 恢复服务 问题解决 下一次故障 检测时间 修复时间 Time Between Failures ( MTBF ) 响应时间 恢复时间 Time Between System Incidents ( MTBSI )

Slide 16

Mean Time to Repair ( MTTR ) " 总的停机时间 " 故障发生 3:00 检测到问题 9:30 诊断 11:00 修复 13:15 恢复服务 18:30 问题解决 18:30 故障发生 3:00 检测到问题 3:02 诊断 3:!5 修复 4:05 恢复服务 6:10 问题解决 6:10 Tom/Jerry 的技术统计分析

Slide 17

Tom/Jerry 的技术统计分析

Slide 18

如何缩短停机故障时间 (down 机之前 ) 训练有素的 IT 人员 保障有力的厂商支持服务 服务器参数和相关技术维护信息的可获得性 切实有效的灾难恢复预案和准确的预案实施

Slide 19

如何缩短停机故障时间 (down 机之后 ) 沉着应对,避免二次故障 全面的判断故障的状况和受影响的范围 在必需时,及时进行技术提升 (Escalation) 理性的估算故障可能持续的时间 决定服务优先还是数据优先 对 IT 内部和用户的有效沟通 故障期间的平行任务 (Fast Tracking) 在短时间无法恢复的情况下,为特定用户或服务启用备用方案

Slide 20

TechNet 是什么 ? 只需轻轻点击,答案就在您的指尖 对于 IT 专业人员来说, TechNet 是一个知识的宝库,你可以找到关于如何规划,部署和管理微软产品的的技术资源 订阅 TechNet 每月发放包含最新信息的 DVD 或者 CD 这是最权威的资源,可以帮助你评估、配置和维护微软产品。 TechNet 网站 可以访问该站点 www.microsoft.com/china/technet 在线资源和社区 订户 - 仅仅提供在线服务 TechNet 中文电子快报 两周发放一次的中文电子快报 安全更新 , 新的资源等等 TechNet 活动 和网站消息 有关最新微软产品介绍和技术的简报 上机试验 , " 如何操作"等信息 中文社区 用户群 可管理的新闻组

Slide 21

我们从哪里可以了解到 TechNet? 访问 TechNet 的官方网站 www.microsoft.com/China/technet 注册 TechNet 快报 www.microsoft.com/china/technet/abouttn/memberships/flash.mspx 加入到中文在线论坛 http://www.microsoft.com/china/group/成为 TechNet 的订户 www.microsoft.com/china/technet 参与到更多的 TechNet 活动中或者在线了解 www.microsoft.com/china/technet

Recommended
View more...