Get in touch
or send us a question?
CONTACT

Hỏa hoạn thiêu rụi trung tâm dữ liệu Alibaba ở Singapore, làm sập máy chủ trên toàn thế giới

Vào ngày 10 tháng 9 vụ nổ pin lithium tại trung tâm dữ liệu của Alibaba Cloud ở Singapore dẫn tới cháy nổ. Kết quả là mạng và cloud của Alibaba tại Khu C của khu vực nói trên không hoạt động bình thường cho đến khi lực lượng cứu hỏa đến dập tắt sự việc.

Lính cứu hỏa đã dập tắt đám cháy khoảng 4 giờ sau khi phát hiện dấu hiệu đầu tiên. Tuy nhiên trung tâm dữ liệu vẫn có nhiệt độ cao. Hoạt động của lực lượng cứu hỏa khiến nước tích tụ trong trung tâm dữ liệu và gây rò rỉ và có thể ảnh hưởng đến hoạt động của hệ thống điện tử.

Vào ngày 11/9, Alibaba Cloud thông báo hầu hết các hệ thống đám mây bị ảnh hưởng đã trở lại hoạt động bình thường. Chỉ những máy chủ bị hư hỏng vật lý mới đang chờ khôi phục. Trong khi đó, các kỹ sư vẫn chưa được phép quay lại làm việc do những rủi ro vật lý đối với tòa nhà. Các máy chủ còn lại chưa thể tự động chuyển dữ liệu do phải đợi nhiệt độ hạ nhiệt trước.

Ảnh hưởng

Alibaba Cloud có thị phần đám mây lớn thứ 4 thế giới với khách hàng doanh nghiệp sử dụng dịch vụ đám mây của Alibaba Cloud bao gồm hơn 11.000 công ty trên toàn thế giới ,cả ở Trung Quốc và các nước khác. Sự việc vì thế đã ảnh hưởng đến nhiều hoạt động kinh doanh của các công ty khách hàng.

Tất nhiên, những khách hàng lớn như ByteDance và Lazada đã lên tiếng chỉ ra tác động mà việc này gây ra. ByteDance-công ty mẹ của TikTok- do sự cố này, nhiều người dùng đã không thể sử dụng dịch vụ trong một thời gian.

Trong trường hợp của Lazada, đội ngũ CNTT và người bán trên nền tảng này không thể truy cập vào hệ thống để xem đơn hàng, hoặc nếu truy cập được cũng gặp phải những thiếu sót nghiêm trọng. Nhưng phía Lazada khẳng định chắc chắn khách hàng sẽ nhận được sản phẩm.

Vậy khách hàng nên làm gì?

Nhiều doanh nghiệp hiện đang chuyển dữ liệu của họ lên đám mây. Để giảm chi phí lưu trữ lượng dữ liệu khổng lồ đang ngày càng được lưu trữ trên các thiết bị trong văn phòng. Việc lưu trữ dữ liệu trên đám mây cũng giúp giảm rủi ro vận hành trong trường hợp thiết bị lưu trữ bị hư hỏng. Nhưng phải làm gì nếu đám mây mà chúng ta đang sử dụng đột nhiên gặp sự cố? Giống như trường hợp xảy ra một vụ hỏa hoạn. Điều này ảnh hưởng rất lớn đến niềm tin của doanh nghiệp và khách hàng.

Các doanh nghiệp nên phân loại dữ liệu theo tầm quan trọng. Xem xét tầm quan trọng của thông tin đối với mục tiêu hoạt động kinh doanh. Nếu thông tin rất quan trọng, bạn nên sao lưu dữ liệu của mình thường xuyên trên thiết bị lưu trữ. Nhưng nếu ít quan trọng hoặc không quan trọng chút nào, bạn có thể không cần phải sao lưu.
Cần có một thiết bị lưu trữ ngoài đám mây hoặc On-Premises Storage lưu trữ dữ liệu quan trọng như đã chia ở trên.

Hybrid Cloud và Multi-Cloud

  • Bạn nên chọn lưu trữ đám mây (Hybrid Cloud), trong đó dữ liệu của bạn được lưu trữ bên ngoài đám mây kết nối với nternet. Đồng thời, bạn phải chừa lại một khoảng trống cho sao lưu dữ liệu.
  • Khi chọn nhà cung cấp dịch vụ đám mây, nên thiết kế một cơ sở hạ tầng đa đám mây (Multi-cloud), sử dụng đám mây từ nhiều nhà cung cấp để ngăn chặn sự gián đoạn của đám mây. Phải có hệ thống đồng bộ dữ liệu từ mọi đám mây. Điều này có thể được thực hiện thông qua nền tảng quản lý đám mây hoặc bạn có thể tự tạo nó. Và cần có những cài đặt để di chuyển cloud ngay lập tức khi có sự cố- được gọi là Failover.

SLA

  • Bạn cũng nên Cam kết chất lượng dịch vụ (Service Level Agreement – SLA) với nhà cung cấp dịch vụ đám mây ở cấp độ cao để đảm bảo rằng nhà cung cấp dịch vụ đám mây cung cấp các dịch vụ liền mạch.
  • Chiến lược sao lưu và phục hồi nên được thiết lập trên các thiết bị nằm ngoài đám mây. Điều đó đảm bảo rằng dữ liệu quan trọng được sao lưu thường xuyên. Có nhiều loại thiết bị lưu trữ và dữ liệu có thể được truy xuất kịp thời nếu đám mây gặp sự cố. Điều quan trọng là phải có quy trình thử nghiệm các chiến lược đã được thiết lập.
  • Cần có một hệ thống cảnh báo có thể phát hiện kịp thời các lỗi của đám mây để giải quyết vấn đề kịp thời.

Khi cloud gặp sự

  • Trong quá trình xử lý trường hợp cloud bị lỗi, điều quan trọng là đảm bảo rằng trục trặc của hệ thống thực sự là do cloud gây ra. Có nhiều cách để kiểm tra, cả từ hệ thống thông báo hoặc các dịch vụ trực tuyến như Down Detector và IsItDownRightNow ao gồm cả việc xem trang web của nhà cung cấp dịch vụ. Trong trường hợp của Alibaba, hãy truy cập Alibaba Cloud Health Status.
  • Nếu chắc chắn rằng cloud đã ngừng hoạt động, bạn nên liên hệ ngay với nhà cung cấp dịch vụ đám mây để nhận được sự điều chỉnh. Nếu SLA được đặt ở mức cao, sẽ có cơ hội nhận được dịch vụ ưu tiên.

Tuy nhiên, ngay cả sau khi thực hiện tất cả những điều này, bạn không được quên rằng có những mối đe dọa khác có thể ảnh hưởng đến dữ liệu. Cả các mối đe dọa trên mạng, mối đe dọa từ người nội bộ và các loại thiệt hại khác đều nên chuẩn bị nhiều biện pháp phòng ngừa khác nhau.

(Theo จตุรวิทย์ เครือวาณิชกิจ, เพลิงไหม้ศูนย์ข้อมูล Alibaba ในสิงคโปร์ทำเซิร์ฟล่มทั่วโลก แล้วจะป้องกันได้อย่างไร . Truy cập từ https://www.beartai.com/tech/it-news/1424290)