硬盘故障硬盘故障是指硬盘发生故障,导致计算机无法访问其所存储的信息。 硬盘在正常运行过程中就有可能会偶然发生故障,也有可能是火灾、浸水、强磁、撞擊或污染(可能会引起磁头划碰)之类的外因。 此外,数据损坏、MBR损坏,又或是恶意软件,虽然不是硬盘本身的故障,但也表现为计算机无法正常访问硬盘。 原因硬盘故障的原因有很多种,例如说:人为原因、硬件损坏、固件损坏、介质损坏、高温、浸水、电源问题,甚至是单纯的巧合[1]。硬盘的制造商通常会列明平均故障间隔时间(MTBF)或年化故障率(AFR),这些是总体的统计数据,并不能够预测某一个体的故障[2]。这些数据的计算方式是抽取硬盘样本,在短时间内不断运行样本,分析其物理组件的磨损,借此对其使用寿命进行合理推算。硬盘故障往往遵循浴缸曲線[3],也就是说如果生产的过程中存在问题,那在短时间内就应该开始出现故障。如果硬盘在开始使用后的几个月内是可靠的,那么它接下去一直保持可靠的可能性要大得多。即使经过长年累月的频繁使用,硬盘也不太会表现出明显的磨损迹象。但即使如此,硬盘随时都可能突然发生故障。 硬盘故障最主要的直接原因是磁头划碰。硬盘内部的读写磁头通常悬浮在盘片表面上方,一旦磁头接触到盘片,或是划伤数据存储的磁性表面,就会导致严重的数据丢失。在这种情况下,由于硬盘内部已经受损,数据恢复必须由专业人士通过适当的设备进行,否则还可能造成进一步的损坏。硬盘的盘片上涂有一层极薄的非静电润滑剂,所以在发生碰撞时,磁头可能只是单纯从盘片表面掠过。然而,磁头平时就在距离盘片表面仅仅几纳米的地方,划碰仍然是一个众所周知的风险。 另一个可能的故障原因是空气过滤器故障。现代硬盘上配备有空气过滤器,可以平衡盘内外之间的气压和湿度。当过滤器不能滤清空气时,灰尘就有可能落在盘片上,一旦磁头扫过,就造成了磁头划碰。在碰撞发生后,损坏的盘片和磁头飞溅出的的颗粒还可能进一步导致坏道。这些再加上盘片本身的损坏,会使硬盘很快报废。 硬盘里除了盘片还有控制器等电子设备,这些设备偶尔也会发生故障。不过在这种情况下,只需更换控制器板,即可恢复所有数据。 故障现象硬盘故障可能是灾难性的,也可能是渐进性的。灾难性的故障表现为主板BIOS无法检测到硬盘,或者硬盘无法通过POST自检 ,此时操作系统完全无法感知到硬盘的存在。渐进性的故障相对难以诊断,因为其症状,例如偶尔的数据损坏,或者电脑变得卡顿(这是坏道需要反复尝试读取所致),不能明确指向硬盘故障,而可能是由许多其他原因引起的,例如恶意软件。坏道数量不断增加是硬盘可能出现故障的迹象。不过,硬盘自动将坏道添加到自己的重映射表中[4],这些迹象对ScanDisk这类检查程序来说不是很明显,而只有对能在硬盘自身之前发现的检查程序来说才有可能暴露这些问题。一旦硬盘内部的缺陷管理系统保留的备份扇区用尽,故障将会彻底发生。磁头寻道的重复模式,例如反复出现快速或较慢的寻道结束噪音(咔哒声)可能表明硬盘存在问题。[5] 硬盘故障的现象不仅限于硬盘,还适用于其他类型的磁介质。艾美加在1990年代末发布的Zip驱动器中所使用的100MB“Zip磁盘”,就受到“死亡咔嗒声”的影响,这么称呼是因为这种磁盘在发生故障时驱动器会不停发出咔哒声。3.5英寸软盘也可能会发生类似的故障,如果驱动器或磁介质受污染,用户在尝试访问驱动器时会遇到“死亡嗡嗡声”。 磁头停靠技术正常运行时,硬盘的磁头在盘片上空飞行,为了避免断电或者其他故障发生时磁头直接撞上数据区,现代硬盘通常会进行“着陆”或者“卸载”操作。接触式启停的硬盘将磁头停靠在盘片上一块不用于存储数据的区域,称为“着陆”。斜坡加载技术的硬盘将磁头移动到盘外的磁头架上,并通过机械结构锁定,使磁头远离盘片,称为“卸载”。一些早期的硬盘没有在突然断电时安全着陆的能力,导致磁头错误降落在数据区上。还有一些早期硬盘需要由用户手动执行着陆。 接触式启停接触式启停的硬盘在盘片接近中心的地方有一块无数据区域,称为“着陆区”。现代设计会将主电机暂时充当发电机为磁头致动器供能,利用盘片的惯性在断电时将磁头推到着陆区。而较早的设计则依赖弹簧。 磁头臂上的弹簧将磁头滑块推向盘片,当盘片开始旋转后,磁头由气垫悬浮支撑,不会与盘片接触或磨损。接触式启停硬盘的磁头滑块设计上可以多次接触盘片表面,但长期的微观磨损最终还是会造成损坏。大部分厂商设计的磁头滑块在损坏率超过50%之前至少可以容忍50000次启停。不过由于使用时间较长的硬盘磁头滑块要在盘片上拖行一段时间才能建立气垫,老硬盘每次启动都有比新硬盘更高的损坏概率,所以磨损率并不是线性的。厂商一般会在测试后发布相关的可靠性数据,例如,希捷酷鱼7200.10系列机械硬盘的可靠性评级具有50000次的启停次数,也就是说在测试中至少50000次启停后并没有发现与磁头表面接触相关的故障。[6] IBM在1995年左右率先推出了一项使用激光毛化工艺(LZT)对着陆区进行处理的技术,在硬盘的着陆区上加工出纳米级的粗糙表面[7]以增强摩擦力并提高耐久。这项技术沿用至今,现在大多只用于低容量的希捷桌面级硬盘[8]。在小尺寸(2.5寸)、大容量、NAS专用以及企业级硬盘中已经被斜坡加载技术逐步淘汰。总的来说,使用接触式启停技术的硬盘会受到更大的环境影响,例如高湿环境可能导致磁头粘滞在盘片上,由此产生过高的摩擦,对盘片、滑块和电机造成物理损坏。 斜坡加载技术加载卸载技术将磁头从盘片上举起并移动到安全区域,既能减少磨损,同时又避开了接触式启停的粘滞风险。世界上第一块硬盘RAMAC以及大多数同时代的早期硬盘都是使用了类似技术,但在当时还是一种非常复杂的机制。现代硬盘使用的则是Memorex在1967年发明的“斜坡加载技术”[9],在盘片外有一块塑料磁盘架,当硬盘不用时,磁头会沿坡道移动到固定位置保存,这个过程称为“卸载”。刚开始仅有用于笔记本的小尺寸硬盘为了抗冲击而选择使用,后来为大多数桌面级硬盘所广泛使用。 为了进一步提升抗冲击性能,IBM为ThinkPad笔记本电脑产品线还推出了配备有“主动保护系统”的硬盘。当电脑内置的加速度传感器检测到突然的剧烈运动时,硬盘会自动卸载磁头,以减轻数据丢失和硬盘划伤的风险。苹果后来也为PowerBook、iBook、MacBook Pro和MacBook产品线推出了类似的技术,称为突发运动传感器。索尼[10]、惠普的“HP 3D DriveGuard”[11]以及东芝[12]等等,各大厂商后来都在他们的笔记本电脑产品线应用类似的技术。 故障症状硬盘有多种故障的症状,有可能是突发的、逐渐恶化的或者自限的。可能会导致全部或部分数据丢失,或者没有影响。 早期的硬盘在出厂时、以及在使用中很容易出现坏道,只要不是短时间内突然出现大量坏道,在当时是正常现象。可以使用“重映射”功能来屏蔽这些扇区,从而保证硬盘的正常运行。有的早期硬盘甚至还在出厂时附有一张表格,指示用户手动进行重映射[13]。后来硬盘都可以无需用户的介入自动重映射坏道。重映射后,硬盘仍可以继续使用,但磁头在遇到坏道时必须移动到重映射后的扇区才能完成存取,导致性能受到影响。S.M.A.R.T.功能可以提供关于重映射的日志和统计数据。现代的硬盘出厂时已屏蔽坏道,重映射计数正常情况下是0,任何增加的重映射扇区都可能是硬盘即将故障的征兆。 还有一些其他类型的故障,可能是逐渐恶化的,也可能是自限的。但无论如何,一旦这些症状出现,就应该立刻考虑更换硬盘,数据损失的风险往往要远远大于更换硬盘节省的钱。反复出现的读写错误、严重的噪音以及发热等等都是可能会出现的症状。
引用
引用错误:在 <references> 标签中name属性为“AutoMK-92”的参考文献没有在文中使用其他条目外部链接
Information related to 硬盘故障 |