LSI MegaRAID实战:从零配置硬RAID到系统挂载

1. 认识LSI MegaRAID控制器

第一次接触服务器硬RAID的朋友可能会被各种专业术语吓到,但别担心,LSI MegaRAID控制器其实就像个"硬盘管家"。它通过专门的芯片处理数据冗余和性能优化,比操作系统自带的软RAID更稳定高效。我经手过的几十台服务器里,只要看到这个蓝色LOGO的RAID卡,基本都能放心大胆地做存储配置。

常见的MegaRAID型号包括9361-8i、9440-8i等,尾部数字代表接口数量。比如手头这台服务器配备的是9460-16i,意味着能接16块硬盘。关键点在于:一定要在开机自检时记住进入配置界面的快捷键(通常是Ctrl+H),这个画面往往一闪而过,建议录像或多次尝试。

2. 进入配置界面的正确姿势

开机听到"滴"声后立即狂按Ctrl+H,直到出现蓝底白字的配置界面。这里有个血泪教训:某些服务器可能需要先按F8进入启动菜单,再选择RAID配置入口。如果连续尝试三次都没成功,建议检查键盘连接或查阅服务器手册。

成功进入后你会看到几个关键菜单:

  • Configuration Management:阵列配置核心区域
  • Controller Management:查看卡状态和固件版本
  • Virtual Drive Management:管理已创建的虚拟磁盘
  • Drive Management:查看物理硬盘状态

新手最容易犯的错误是直接插拔硬盘。重要提示:任何硬盘操作前,务必先在Drive Management里确认所有磁盘状态显示为"Unconfigured Good"(未配置的良好状态),如果看到"Foreign"标识,需要先执行清除配置操作。

3. 创建RAID阵列的实战步骤

3.1 选择RAID级别

在Configuration Management中选择"Create Virtual Drive",这时要面对第一个重要选择:RAID级别。根据我的经验:

  • RAID5:3块盘起配,兼顾安全性和容量,适合普通文件存储
  • RAID6:4块盘起配,双冗余更安全但写入性能较低
  • RAID10:4块盘起配,读写性能最强但容量折半

如果是存放数据库等重要数据,我强烈建议用RAID10。曾经有个客户坚持用RAID5存财务系统,结果两块盘相继故障导致数据全丢。输入选择时注意:要用空格键选中硬盘,回车键确认选择。

3.2 高级参数设置

创建界面有几个容易忽略但关键的高级选项:

  • Strip Size:条带大小,数据库选64KB,视频编辑选1MB
  • Read Policy:总是保持"Adaptive Read Ahead"
  • Write Policy:有BBU选"Write Back",否则选"Write Through"
  • Initialize:选择"Fast Init"能节省数小时等待时间

设置完成后别急着退出,一定要到"Virtual Drive Management"里确认新建的阵列状态显示为"Optimal"。有次我赶时间跳过检查,结果发现有个硬盘没被正确识别,导致阵列降级运行。

4. 操作系统层面的配置技巧

4.1 磁盘识别与格式化

在Linux系统中,用lsblk命令查看刚创建的虚拟磁盘(通常显示为sda、sdb等)。有个实用技巧:如果没立即看到新磁盘,可以执行以下命令强制刷新:

echo "- - -" > /sys/class/scsi_host/host0/scan

格式化建议使用ext4文件系统,命令如下:

mkfs.ext4 -O ^has_journal /dev/sda

去掉日志功能可以提升约15%的写入性能,特别适合日志类应用。但要注意:这样会增加意外断电时数据损坏的风险,重要数据存储不建议使用。

4.2 自动化挂载配置

编辑/etc/fstab文件时,建议使用UUID而非设备名,因为/dev/sda可能在重启后变化。获取UUID的命令:

blkid /dev/sda

fstab添加如下行(以挂载到/storage为例):

UUID=你的UUID /storage ext4 defaults,noatime,nodiratime 0 2

参数说明:

  • noatime:减少元数据写入
  • nodiratime:禁用目录访问时间记录
  • 0 2:表示不备份且开机检查

最后执行mount -a测试配置是否正确。我在客户现场见过太多因为fstab配置错误导致系统无法启动的案例,建议先在测试环境验证。

5. 常见故障排查指南

当RAID状态异常时,首先通过MegaRAID管理界面查看具体报警信息。有个快速判断硬盘故障的方法:听声音。正常硬盘运转是平稳的"嗡嗡"声,而即将损坏的硬盘会发出有节奏的"咔嗒"声。

对于突然掉线的硬盘,可以尝试以下恢复步骤:

  1. 物理检查硬盘供电和数据线
  2. 在Drive Management中选择"Make Offline"再"Make Online"
  3. 如果显示为"Foreign"状态,导入外部配置

如果遇到阵列降级(Degraded),千万不要直接重建!先做好数据备份。有次我遇到一块硬盘间歇性故障,重建过程中又坏了一块,导致数据无法恢复。现在我的习惯是:重要数据阵列永远保持热备盘(Hot Spare)。