2015-12-19 21:39:12
来 源
中存储
容灾
一个灾备项目遇到很多问题,1、不能通讯。一开始怀疑是链路衰减,后来经过 测试发现不是,2、RAID 降级 B 地的管理服务器(安装 SANtricity 软件)启动时报错,出现 degraded 字样,进 RAID 卡调试发现做的 RAID1,强行进入系统,没有问题。

总结下最近做的一个灾备项目,期间遇到很多问题,不过最后还是成功解决了。

1、光纤模块 将 A 地的数据灾备到 B 地,中间相隔 40 公里左右,两端各有一个光纤交换机,A 地是 HP 的,B 地是 Brocade 的。不过 HP 的那个是 OEM Brocade 的。从一个厂商那买了几个单模 的光模块,各插在两端的交换机上。结果发现不能通讯。一开始怀疑是链路衰减,后来经过 测试发现不是,再怀疑是模块的问题,可是模块厂家过来换了 2 次,还是不通,结果模块厂 商坚持认为是链路衰减的问题。后来就拖啊拖了 1 个多月(期间正好过年)。最后同事从北京 公司换了个模块,问题成功解决。看来问题还是出在模块身上。

2、RAID 降级 B 地的管理服务器(安装 SANtricity 软件)启动时报错,出现 degraded 字样,进 RAID 卡调试发现做的 RAID1,强行进入系统,没有问题。

3、HBA 卡 在管理服务器上用 SANtricity 软件指定一个卷,并将这个卷映射给主机后,发现主机 不能识别,后来将光纤插到另一个 HBA 卡上即可,原先那个 HBA 卡是坏的。

4、双控、多路径 由于存储是双控制器,并且两控制器都启用,因此主机连接存储的一个卷时默认会发现 两个硬盘,在主机层配置多路径即可。如果存储厂商不提供多路径软件,主机使用开源或免 费的即可。

5、HBA 卡驱动 主机通过光纤连接存储,走 FC 协议,因此需配置 HBA 卡,并且在主机上安装 HBA 卡的 驱动

6、集群文件系统 A 地主机实现 Oracle 双机,使用同一个存储卷,走 FC 协议,结果主机方面的集成商说 以前从未遇到过,只会做 NAS 方式的。我推荐他们用 OCFS 实现卷共享,他们说不安全。。。。 我无语了,继续推荐他们用其他集群文件系统。后来涉及到费用问题,他们还是乖乖的用 OCFS 了。

7、NAS 机头 还是上面那个问题,客户的技术人员说既然无法实现卷共享,那就在存储前面加一个 NAS 机头。但是 NAS 机头价格比集群文件系统软件贵,而且用于数据库环境性能会变差。

8、镜像卷及切换 A 地的 A 卷和 B 地的 B 卷做镜像关系,当 A 卷发生改变时,能立即反应到 B 卷。这样万 一 A 卷故障,即可先停止他们的镜像关系,然后将 B 卷挂载即可。

9、Solaris B 地的主机是 Solaris,集成商不太懂,现场用手机各种查啊,比如查看 HBA 卡的 WWN 号,对磁盘格式化分区,多路径配置等等。

10、项目验收 客户提出需要找第三方公司做 A 地同步到 B 地的性能测试,Oh my God。。。

总结:

(1)、项目中遇到多次是硬件设备的故障,例如光纤和 HBA 卡,当出现问题时,千万不 能一根筋,要从各个方面去排查,大胆尝试,小心求证。

(2)、事先要准备好相关的实施资料,包括设备驱动、用到的软件、相关系统和设备的 使用手册,不怕一万就怕万一。

(3)、做售前或售后,不要求你像研发那样精通到底层协议,但是要涉及的知识面要广, 从主机到应用再到存储都要懂。

(4)、该你做的你就做,不该你做的你可以帮助,提供建议或文档,但是不要自己去动 手做,不然出了问题就头大了。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。