Công ty sao lưu mang đến góc nhìn độc đáo và có căn cứ về tỷ lệ lỗi HDD.
Backblaze là một công ty sao lưu và lưu trữ đám mây đã theo dõi tỷ lệ lỗi hàng năm (AFR) của các ổ cứng trong trung tâm dữ liệu của mình từ năm 2013. Như bạn có thể tưởng tượng, điều đó đã mang lại cho công ty rất nhiều dữ liệu. Và dữ liệu đó đã khiến công ty kết luận rằng HDD "đang bền hơn" và hiển thị ít lỗi hơn.
Kết luận đó đến từ một bài đăng blog tuần này của Stephanie Doyle, nhà văn và chuyên gia vận hành blog của Backblaze, và Pat Patterson, nhà truyền bá kỹ thuật trưởng của Backblaze. Các tác giả so sánh AFR cho khoảng 317.230 ổ đĩa trong trung tâm dữ liệu của Backblaze với AFR mà công ty ghi nhận khi kiểm tra 21.195 ổ đĩa mà họ có vào năm 2013 và 206.928 ổ đĩa vào năm 2021. Doyle và Patterson cho biết họ đã xác định "một sự sai lệch khá vững chắc trong cả tuổi thọ lỗi ổ đĩa và điểm cao của AFR so với hai lần cuối chúng tôi chạy phân tích."

Như Doyle và Patterson viết, đỉnh tỷ lệ lỗi cao của các ổ đĩa được thử nghiệm năm nay là 4,25% ở 10 năm và ba tháng, so với 13,73% ở khoảng ba năm và ba tháng vào năm 2013 và 14,24% ở bảy năm và chín tháng vào năm 2021.
"Đó không chỉ là một cải thiện đáng kể về tuổi thọ ổ đĩa, mà còn là lần đầu tiên chúng tôi thấy tỷ lệ lỗi ổ đĩa đỉnh ở cuối khó khăn của đường cong ổ đĩa. Và, nó chỉ bằng khoảng một phần ba của mỗi đỉnh lỗi khác," Doyle và Patterson viết.
Bạn có thể xem bài đăng blog tháng 8 của Paterson và Doyle để biết thêm thông tin về các ổ đĩa họ phân tích năm nay. Các ổ đĩa đến từ HGST, Seagate, Toshiba và WDC, và chúng có tuổi trung bình từ 3,7 tháng đến 103,9 tháng (khoảng 8,7 năm). Các ổ đĩa có dung lượng từ 4TB đến 24TB. Vào năm 2021, mẫu của Backblaze có ổ đĩa từ cùng các nhà cung cấp, và các ổ đĩa được thử nghiệm cho mỗi mẫu có tuổi trung bình từ 3,57 đến 80,85 tháng (khoảng 6,7 năm). Các ổ đĩa có dung lượng từ 4TB đến 16TB.
Như Backblaze đã làm trong quá khứ, Doyle và Paterson so sánh hành vi của các HDD trung tâm dữ liệu của Backblaze với đường cong bồn tắm, một nguyên lý kỹ thuật nói rằng tỷ lệ lỗi linh kiện có xu hướng theo hình chữ U theo thời gian, với nhiều lỗi xảy ra sớm trong đời sống trước khi tỷ lệ giảm, ổn định, và sau đó tăng lên trở lại khi linh kiện già đi.
Nhưng như thấy trong biểu đồ của Backblaze ở trên, các HDD của công ty không tuân theo nguyên lý đó. Các tác giả blog lưu ý rằng vào năm 2021 và 2025, các ổ đĩa của Backblaze có "tỷ lệ lỗi khá đều qua phần lớn đáng kể cuộc đời của ổ đĩa, sau đó là một đỉnh khá dốc khi chúng ta vào vùng lỗi ổ đĩa."
Blog tiếp tục:
Điều đó có nghĩa là gì? Chà, ổ đĩa đang trở nên tốt hơn và bền hơn. Và, cho rằng các đường xu hướng của chúng tôi có hình dạng gần giống nhau từ 2021 đến 2025, chúng ta có lẽ nên kiểm tra lại khi năm 2029 đến để xem liệu đỉnh lỗi của chúng ta có đẩy ra xa hơn nữa không.
Nói chuyện với Ars Technica, Doyle cho biết phân tích của Backblaze là tin tốt cho các cá nhân mua sắm ổ cứng lớn hơn vì các thiết bị "sẽ bền hơn."
Cô ấy thêm:
Theo nhiều cách, bạn có thể nghĩ về việc sử dụng ổ cứng của trung tâm dữ liệu như bài kiểm tra cuối cùng cho ổ cứng—bạn đang giữ ổ cứng bật và quay trong số giờ tối đa, và thường số lần bạn đọc/ghi tệp vượt xa những gì bạn từng thấy như một người tiêu dùng. Xu hướng ngành, ổ đĩa đang trở nên lớn hơn, có nghĩa là thường thì mọi người mua ít hơn. Báo cáo về cách các ổ đĩa này hoạt động trong môi trường trung tâm dữ liệu, sau đó, có thể cho bạn thêm tự tin rằng bất kỳ ổ đĩa nào bạn mua là một khoản đầu tư tốt. Tuổi thọ của HDD cũng là một lý do khác để người mua sắm vẫn xem xét HDD thay vì SSD nhanh hơn, đắt hơn.
"Đó là một ý tưởng hay để quyết định việc cải thiện độ trễ có được biện minh như thế nào," Doyle nói.
Doyle và Paterson không muốn vứt đường cong bồn tắm ra ngoài cùng với nước tắm. Họ không gợi ý rằng đường cong bồn tắm không áp dụng cho HDD, mà là nó bỏ qua các yếu tố bổ sung ảnh hưởng đến tỷ lệ lỗi HDD, bao gồm "khối lượng công việc, biến đổi sản xuất, cập nhật firmware và churn hoạt động." Nguyên lý cũng đưa ra các giả định rằng, theo các tác giả:
- Thiết bị giống hệt nhau và hoạt động trong cùng điều kiện
- Lỗi xảy ra độc lập, chủ yếu được thúc đẩy bởi thời gian
- Môi trường ở ổn định qua cuộc đời sản phẩm
Trong khi những điều kiện này có thể phần lớn được đáp ứng trong môi trường trung tâm dữ liệu, "điều kiện không bao giờ có thể hoàn hảo," Doyle và Patterson lưu ý. Khi xem xét tỷ lệ lỗi của HDD theo thời gian, khôn ngoan khi xem xét cả đường cong bồn tắm và cách bạn sử dụng linh kiện.








