Chuyển đến nội dung chính

Hiểu thêm về RAID - PHẦN 1

Trong vài năm trở lại đây , RAID đã trở nên vô cùng đại chúng . RAID có mặt trên những Mainboard bằng những Chip điều khiển tích hợp ngay trên đó mà không cần những Card RAID cồng kềnh trước kia

Nguyên nhân của RAID được phổ biến rộng rãi như vậy là do tăng tốc độ truy cập dữ liệu , tăng độ tin cậy của dữ liệu hoặc đơn giản để khoe khoang với người khác .
RAID được viết tắt từ Redundant Array of Inexpensive Disks hoặc Redundant Array of Independent Disks . Tên ban đầu của nó liên quan tới kỹ thuật sử dụng một loạt ổ cứng mà không phải sử dụng một ổ cứng .
RAID là cách đã được dùng để tăng hiệu suất và sửa chữa những lỗi trong quá trình làm việc của ổ cứng . Có nhiều kiểu RAID khác nhau , mỗi kiểu có thể mạnh riêng và hạn chế riêng , không một mức RAID nào được cho là tốt nhất và mỗi mức RAID được sử dụng theo những giải pháp riêng biệt được lựa chọn .
Những kiểu RAID khác nhau sẽ có những lợi ích khác nhau , nó có thể được dùng để cho cơ sở dữ liệu với hàng ngàn người truy cập cùng một lúc , cho máy trạm Video HD hiệu suất cao hoặc đơn giản sử dụng trong nhà để lưu trữ những bức hình . Tất nhiên mỗi kiểu sẽ có những yêu cầu về thiết bị khác nhau , và mức đầu tư cũng khác nhau .
Có một số mức RAID tập trung vào hiệu suất hệ thống mà không quan tâm tới lưu trữ những dữ liệu thừa ( Redundance ) , một số khác trước hết lại quan tâm tới hiệu suất lưu trữ mà hiệu suất làm việc có thể chấp nhận được một mức độ nào đó .

Tăng cường hiệu suất

Khi đọc hoặc ghi dữ liệu trên đĩa của ổ cứng sẽ có hạn chế về mặt tốc độ của ổ cứng . Rất không may mắn khi cấu trúc cơ khí của ổ cứng chính là nguyên nhân gây sự chậm trễ khi dữ liệu di chuyển tới những bộ phận khác của máy tính . Những đĩa và những bộ phận cơ khí khác bên trong ổ đĩa chạy với tốc độ nhanh nhưng vẫn không bằng với các thiết bị khác trong PC như RAM .
Sự bổ xung quan trọng nhất của RAID chính tăng tăng hiệu suất cao hơn khi sử dụng một ổ đĩa bằng cách đọc hoặc ghi tới nhiều đĩa cùng một lúc . Theo lí thuyết thì dữ liệu có thể được khôi phục lại từ hai đĩa bằng nửa thời gian từ một đĩa duy nhất , từ 08 đĩa nhanh gấp bốn lần so với 02 đĩa ... như vậy với nhiều ổ cứng có hai ổ đĩa hoặc hai trăm ổ đĩa thì RAID có thể tăng hiệu suất ở một mức độ nào đó .

An toàn dữ liệu :

An toàn dữ liệu là khái niệm mà một mảng nhiều ổ cứng có thể khắc phục được lỗi của một ổ cứng và không mất mất kì dữ liệu nào trên đó . Điều đó được thực hiện thông qua dữ liệu những dữ liệu thừa ( Redundancy ) trên mảng nhiều ổ cứng , có nghĩa là có một số dung lượng đĩa cứng dành cho với lợi ích lưu trữ những dữ liệu phụ . Những dữ liệu thừa có thể cung cấp bằng cách Copy bản sao của tất cả dữ liệu thông qua những thông tin Parity , mà chúng ta sẽ đề cập sau .

Tính sẵn sàng của dữ liệu

Tính sẵn sàng của dữ liệu không nhầm lẫn với Độ an toàn của dữ liệu , khi mà mảng nhiều ổ cứng có thể chứa đựng ổ cứng lỗi nhưng dữ liệu vẫn không bị mất , luồng dữ liệu không bị dán đoạn và dịch vụ không bị ngắt .
Đặc điểm này không thực sự quan trọng cho những máy tính dùng trong gia đình , nhưng nó lại vô cùng cần thiết để duy trì hoạt động kinh doanh . Đôi khi nó không đơn giản chỉ là việc tạm ngừng dịch vụ , trang Web là một ví dụ , nhưng việc thay thế ổ cúng hỏng lại là đơn giản . Tính sẵn sàng của dữ liệu phải bao gồm Độ an toàn của dữ liệu , nhưng Độ an toàn dữ liệu nhiều khi lại không thực sự cần thiết bằng tính sẵn sàng của dữ liệu . Sự thay thế ổ cứng mà không cần tắt hệ thống ( Hot-swap ) với những thiết bị cho phép thay thế kiểu này ( Hot – Spare ) là một đặc điểm của bộ phận điều khiển RAID cho phép thay thế ổ cứng bị hỏng ngay trong khi hệ thống đang làm việc trong mảng nhiều ổ cứng .

Tăng dung lượng

Khi bạn cần nhiều khoảng trống trên một phân vùng duy nhất , đôi khi những ổ cứng có dung lượng lớn nhất hiện tại mà vẫn chưa đủ .
Ví dụ nếu bạn muốn ghi vài giờ Video 1080p ( có độ nét cao ) mà không nén thì với ổ cứng dung lượng 1TB vẫn không đủ để lưu trữ tất cả thông tin . Lúc đó với một mảng nhiều ổ cứng dung lượng 500GB không chỉ tạo thành một phân dùng duy nhất mà còn rẻ hơn nhiều nếu bạn dùng những ổ cứng dung lượng 1TB . Để giải thích rõ hơn về điều này ví dụ bạn có 01 ổ cứng với dung lượng 500GB thì bạn không thể tạo một phân vùng , như ổ C Logic chẳng hạn , có dung lượng lớn hơn 500GB , nhưng bạn có thể ghép 02 ổ cứng 500 GB để tạo thành một ổ C Logic có dung lượng 1TB .

Một số thuật ngữ của RAID

Striping

Hầu hết các mức RAID đều dùng Stripping , nó là một kiểu được dùng để mô tả khi những File riêng lẻ được phân chia thành nhiều gói nhỏ và những gói này được ghi trên 02 ổ đĩa cứng trở lên .
Stripping là cách mà RAID tăng cường hiệu suất truy cập dữ liệu bằng cách đọc , ghi liên tục tất cả các đĩa một cách liên tục . Ví dụ đơn giản để các bạn hình dùng trong một mảng gồm có 04 ổ cứng , một phần tư của mỗi File được ghi trên mỗi đĩa khác nhau . Như vậy mỗi đĩa chỉ có một phần tư của File vì thế mà công việc của nó được nhanh hơn là ghi trên một đĩa duy nhất . Cũng với khái niệm tương tự như vậy với thời gian đọc trở lại một phần tư File trên một ổ đĩa sẽ nhanh hơn đọc cả nội dung một File trên một ổ đĩa .


Hình 1 : Stripping
Stripping có thể làm theo mức từng Byte hoặc theo mức từng khối ( block ) . Stripping mức Byte có nghĩa là mỗi File được chia thành từng phần , mỗi phần có kích thước là một Byte . Ví dụ sử dụng mảng gồm 04 đĩa , thì Byte thứ 1 ghi vào ổ thứ 1 , Byte thứ 2 ghi vào ổ thứ 2 và cứ như vậy , cho tới khi Byte thứ 5 ghi lại vào ổ thứ 1 và quá trình đó lại bắt đầu lại .
Trong trường hợp Stripping theo mức Block , kích thước mỗi Block có thể được thiết lập theo cấu hình bên trong của BIOS trong bộ phận điều khiển RAID . Thông thường kích thước Block ngầm định ban đầu là 512 byte . Nếu file có kích thước dung lượng nhỏ hơn kích thước của Block thì nội dung File này được ghi trên một ổ đĩa cứng .
Stripping là cách làm duy nhất mà không có chứa dữ liệu thừa ( Redundance ) , nhưng khuyết điểm của nó lại không bảo vệ việc mất dữ liệu . điều đó có nghĩa là nếu một ổ cứng bị hỏng thì dữ liệu không thể khôi phục lại được .

Mirroring :

Mirroring là cách đơn giản nhất là sử dụng bằng cách lưu trữ dữ liệu thừa ra . Kỹ thuật này chỉ dùng 02 ổ cứng kết hợp lại với nhau không như Stripping . Khi dữ liệu được ghi trên một đĩa thì ngay lập tức đã được ghi thêm trên một đĩa khác . Nếu một đĩa bị lỗi , những công việc của nó vẫn tiếp tục không bị ngắt quãng và không mất dữ liệu . Giải pháp RAID trong những Mainboard này hay được sử dụng do giá thành của bộ phận điều khiển RAID rẻ nhất . Những mảng nhiều đĩa sử dụng Mirroring thì một nửa trong tổng số dung lượng của ổ cứng là lưu trữ dữ liệu thừa .
Ví dụ : Với Mirroring khi sử dụng 02 ổ cứng 500GB thì khả năng lưu trữ của hai ổ cứng này chỉ là 500GB dữ liệu có ích chứ không phải là 1TB bởi vì 500GB đã ghi dữ liệu thừa .

Parity

Parity được dùng bên cạnh với Stripping nhưng đó là cách mà không mất 50% dung lượng ghi những dữ liệu thừa như trong Mirroring . Trong mảng nhiều ổ cứng sử dụng Parity cho dữ liệu thừa , chỉ một phần khoảng trống trên ổ cứng được sử dụng để lưu trữ thông tin cần để khôi phục lại dữ liệu tất cả mảng nhiều ổ cứng trong trường hợp ổ cứng bị hỏng . Thông tin Parity được tạo ra từ dữ liệu lưu trữ trên ổ cứng bằng phép toán Logic “XOR” .
Bảng dưới đây chính là bảng trạng thái của phép toán Logic “XOR”

Hình 2 : XOR
Bảng trên cho thấy nếu A và B khác nhau thì cho giá trị đầu ra là 1 . Nếu A và B giống nhau thì cho giá trị đầu ra là 0 .
Dựa vào bảng này cho thấy từ bảng kết quả đầu ra nếu biết cột A thì sẽ xác định được giá trị ở cột B và ngược lại nếu biết giá trị cột B sẽ tìm được giá trị ở cột A .

Hình 3 : XOR chuỗi dữ liệu
Như vậy bạn sẽ thấy chỉ cần biết giá trị của hai cột là sẽ tính được giá trị của cột còn lại , vì vậy nếu một ổ cứng nào bị hỏng từ thuật toán Logic XOR sẽ tính được nội dung dữ liệu của ổ cứng bị hỏng .

Hình 4 : XOR chuỗi dữ liệu 03 cột
Cũng từ bảng trên cho thấy chỉ cần biết dữ liệu của 03 cột là sẽ tính toán được dữ liệu ở cột còn lại và cứ như vậy . Để giảm số liệu lưu trữ dư thừa thì chỉ cần tăng số phép tính XOR lên nhiều cột , nhưng bên cạnh đó việc tính toán cũng sẽ trở nên vô cùng phức tạp .
Điều không thuận lợi khi sử dụng Parity cho những thông tin dư thừa đó là tính toán phức tạp . Nếu số cột tham gia vào phép XOR tăng lên , bên cạnh là giảm khoảng lưu trữ dư thừa thì lại mất thời gian tính toán lại khi một ổ cứng nào đó bị hỏng . Nếu một mảng gồm 04 ổ cứng với tốc độ ghi 50MB/s thì bộ phận điều khiển RAID phải thực hiện gần 300 triệu phép tính XOR trong một giây .

RAID 0 - Stripping mức từng khối ( Block ) mà không có dữ liệu dư thừa

RAID0 là một trong những mức RAID hầu như được sử dụng trong các Motherboard hiện nay với mục đích tăng hiệu suất truy cập dữ liệu . Mọi File được ghi lên mảng nhiều ổ cứng , các File được chia thành những Block , mỗi Block có kích thước tuỳ theo thiết lập trong BIOS của bộ phận điều khiển RAID . Điều này có thể tăng tốc việc đọc và ghi trên ổ cứng bởi vì hoạt động của nó được thực hiện đồng thời trên những ổ cứng song song với nhau .

Hình 5 - Dữ liệu ghi trong RAID 0
Tăng cường hiệu suất đọc ghi dữ liệu trên đĩa phụ thuộc vào kích thước của Block và những ứng dụng được sử dụng . Ví dụ một mảng có 04 ổ cứng , với kích thước Block là 512 Byte , nếu File dữ liệu có kích thước 1124 Byte thì sẽ chỉ dùng 03 Block ghi trên 03 ổ cứng mà không sử dụng tới ổ cứng thứ 4

Ích lợi :

  • Hiệu suất làm việc tăng lên khi làm việc với những File có dung lượng lớn
  • Không mất bất kì một dữ liệu dư thừa nào .
  • Rẻ tiền – do tích hợp phần mềm cũng như phần cứng đơn giản

Không thuận lợi :

  • Không khôi phục được dữ liệu khi một ổ cứng bị hỏng
  • Hiệu suất làm việc không tăng lên đối với những ứng dụng trong gia đình .


(còn phần 2)

Nhận xét

Bài đăng phổ biến từ blog này

Backup and Restore MS SQL Server 2008 Database

  Backup and Restore MS SQL Server 2008 Database Bài viết này hướng dẫn các bạn backup và restore database sử dụng Microsoft SQL Server Management Studio. Công việc quản trị database đồi hỏi các bạn thật sự cẩn thận và phải có chiến lược backup hợp lý. vì lỡ một ngày đen đủi ổ cứng server die là coi như mình cũng die theo nó đối vế hệ thống server dữ liệu quan trọng thì việc backup database là vô cùng cần thiết. Sau đây mình hướng dẫn cách backup và restore database Mysql server 2008. 1. Backup database Sqlserver 2008. Step 1 : Open your Microsoft SQL Server Management Studio, whichever you prefer, standard or express edition. Step 2 : Dùng  User có quyền quản trị databse để login vào MS SQL server database. Step 3 : Select the database >> Right-click >> Tasks >> Back Up [xem hình bên dưới]: Bấm chọn  “ Backup ” hợp thoại backup xuất hiện Step 4 : chọn các loại backup. ở đậy mình chọn backup full. Backup type: F...

Hotswap và hot Plug là gì ?

Thuật ngữ Hot swap (tạm dịch: trao đổi nóng) là khả năng tháo gỡ và thay thế các bộ phận của một chiếc máy tính trong khi hệ thống vẫn đang chạy. Người ta còn dùng thuật ngữ Hot plug để chỉ khả năng này. Tháo lắp "nóng" thiết bị trong khi hệ thống vẫn đang hoạt động. Một khi phần mềm chuyên xử lý cái vụ hot swap được cài đặt vào máy tính, bạn có thể gắn vào và tháo ra thiết bị mà không cần phải tắt máy (shutdown, turn off) hay khởi động lại (reboot). Khả năng này cho phép bạn gắn hay tháo gỡ một cách dễ dàng các linh kiện ngoại vi như chuột, bàn phím, máy in,... Hồi xửa hồi xưa, chỉ có các hệ thống đắt tiền mới có khả năng này, vì việc hiệu chỉnh, cấu hình nó rất là nhiêu khê. Nguyên lý hoạt động của nó thế này: Các máy hỗ trợ hot swap cần phải có khả năng dò tìm và phát hiện có một bộ phận nào đó vừa được gỡ ra. Ngoài ra, tất cả các mối kết nối điện và cơ khí cũng cần phải được thiết kế làm thế nào để không làm tổn hại cho thiết bị cũng như người sử dụng mỗi ...

Hướng dẫn cài đặt Apache, MySQL, PHP, PhpMyAdmin trên CentOS 5.2

 Hướng dẫn cài webserver trên hệ điều hành Linux Centos Trong quá trình làm lab, test cho webserver chạy hệ điều hành linux dưới localhost, bài test đã hoàn thành đúng yêu cầu, nên mình viết lại các quá trình làm lab. Bài viết có gì thiếu xót mong các bạn bỏ qua. " Các bước cài đặt yêu cầu máy tính bạn được kết nối internet " Centos là một hệ điều hành mã nguồn mở mạnh mẽ với những tính năng quả trị rất mạnh, Nếu bạn muốn setup cho mình một hệ thống máy chủ webserver nhưng với chị phí hạn hẹp, trong khi đó server 2008/2003 thì chi phí quá cao. Thì Centos là một giải pháp cho các bạn đơn giản vì nó free và hiệu quả. Sau đây mình hướng dẫn các bạn các ứng dụng cơ bản ban đầu của Centos. TIẾN HÀNH CÀI ĐẶT NHÁ. 1. Cài đặt Apache server: Apache là chương trình máy chủ của HTTP . Apache chạy được trên các hệ điều hành như Unix, Window, Novell Netware và các hệ điều hành khác. Nó đóng vai trò quan trọng trong việc phát triển web.     Các bước cài đặt:  ...

Cài đặt phần mềm symantec backup exec 11d for windows server

1.    Tìm hiểu về ph ần mềm symantec backup exec 11d for windows server 1.1.               Giới thiệu Đây là giải pháp quản lý dữ liệu hiệu suất cao của symantec, được thiết kế theo mô hình client/server cung cấp khả năng backup và restore nhanh và tin cậy cho hệ thống server và workstation trên nền Windows. Bộ phần mềm symantec backup exec 11d có các version sau: ·          Symantec backup exec 11d for windows server ·          Small business server edition ·          Quickstart edition Tùy vào viersion khác nhau mà tính năng và số lượng agent được hỗ trợ khác nhau. 1.2.               Symantec backup exec 11d for windows server hoạt động như thế nào   1.1.       ...

Giải pháp Load Balancing và Fail Over toàn diện dành cho Web Server

    Xây dựng một hệ thống High Available (HA) là một nhiệm vụ sống còn dành cho doanh nghiệp hiện nay. Đã có những trường hợp đáng tiếc khiến cho doanh nghiệp phải chịu những thiệt hại lớn không đáng có, thậm chí là mất đi các khách hàng quan trọng – nguồn sống trong kinh doanh.  Trong bài “Để website luôn online với cluster Apache High Availability Linux” đăng trên một số trang web hiện nay tuy thuận tiện nhưng vẫn còn những nhược điểm đáng kể. Một trong những nhược điểm đó là hệ thống chỉ có tác dụng chịu lỗi (Fail Over) mà không thể cân bằng tải (Load Balancing). Do đó, hệ thống chỉ có thể thích hợp với những doanh nghiệp nhỏ lẻ, nhu cầu truy cập web của khách hàng không cao. Nếu sử dụng phương thức trên cho doanh nghiệp lớn thì sẽ gây hiện tượng thắt cổ chai (bottle neck) làm nghẽn lưu lượng truy cập. Mặt khác, doanh nghiệp muốn triển khai thêm nhiều dịch vụ khác thì đây không phải là một lựa chọn thật sự hiệu quả. Một giải pháp được  đưa ra l...

Lênh căn bản cho người bắt đầu dùng linux

 Những lệnh căn bản về Linux Khi bước chân vào Linux, các bạn nào mới tiếp xúc và lần đầu tiên làm quen với linux thì lúc đầu còn gặp nhiều bỡ ngỡi. hôm nay mình chia sẻ với các bạn vài lệnh căn bản để sử dụng và làm quen với hệ điều hành Linux. Lệnh cơ bản hệ thống. Lệnh change password root.   Passwd Lệnh mở thư mục # cd / var/www/html (câu l ệnh này dùng để mở thư mục html nằm trong www-var) L ệnh xem quyền hạn thư mục và file ll  ( Ví dụ ta muốn xem các tập tin và thư mục trong folder www quyền là gì, vào thư mục html và đánh lệnh ll để xem) 4.         Lệnh Rename tập tin, folder. # mv phpMyAdmin-3.2.4-english phpmyadm ( đ ổi tên thư mục phpMyAdmin-3.2.4-english thành phpmyadm) L ệnh xem dung lượng ổ cứng Df Xem dung l ượng sử dụng bộ nhớ (Ram) Free –m L ệnh xem ai đã login về hệ thống. Last ...

TỔNG QUAN MICROSOFT FOREFRONT THREAT MANAGEMENT GATEWAY

Vừa qua, Microsoft đã công bố sản phẩm Forefront Threat Management Gateway (Forefront TMG) Beta1, đây là sản phẩm cung cấp tính năng bảo mật tích hợp giữa Internet Security and Acceleration Server (ISA) , Forefront Client Security, Forefront Security for Exchange Server, Forefront Security for SharePoint. Các đặc điểm của Forefront TMG: - Bảo vệ hệ thống toàn diện - Quản lý đơn giản - Đơn giản giám sát hệ thống Forefront TMG cung cấp đầy đủ các tính năng của một Firewall: A. Các tính năng mới: Tính năng Mô tả Tương thích với Windows Server 2008, 64-bit TMG chỉ có thể chạy trên Windows Server 2008 64-bit Tùy chọn Antivirus, Antimalware - Quét những file bị lây nhiễm - Ngăn chặn những file bị nghi ngờ - Ngăn chặn những file tìm thấy đã bị hỏng - Ngăn chặn những file không thể scan - Ngăn chặn tất cả file đã được mã hóa - Ngăn chặn những file vượt quá thời gian admin qui định cho phép quét - Ngăn chặn những file có kích thước lớn do admin qui định ...

Scheduling automated backup using SQL server 2008

Ở bài trước mình đã hướng dẫn các bạn backup database Mysql server 2008 bằng cách thủ công là khi nào mình cần backup thì vào trong database chọn database backup lại, nhưng công việc này thì không mấy khả thi cho lắm, đối với những ai quản lý một lúc cùng nhiều con server database thì việc này vô cúng chiếm nhiều thời gian và lỡ như một ngày nào đó vô tình quên thì mọi chuyện trở nên rắc rối khi đúng ngày mình quên backup databse thì server die, lúc này không biết lấy gì lấy đâu database ngày đó restore lại. Các bạn đừng lo, trong bài viết này mình hướng dẫn các bạn xếp lịch backup database hoàn toàn một cách tự động. Ở bài này mình thực hiện việc backup định kỳ mỗi ngày vào lúc 12:00 AM. Các bước thực hiện Scheduling automated backup using SQL server 2008 :   1. Để bắt đầu tiến hành backup được Database chúng ta phải login vào Qsl server 2008 với quyền tài khoản quản trị. ớ đây mình dùng tài khoản mật định là Sa ( là tài khoản có quyền cao nhất trong sql server 2008). ...

Cài đặt VMware vSphere ESXi 5

Cài đặt VMware vSphere ESXi 5 Nghiên cứu vSphere cũng đã khá lâu, cũng có viết một số bài lab nhưng chưa publish lên. Thôi thì hôm nay dành ít thời gian để đăng tải loạt bài về VMware vSphere ESXi 5 lên blog, để nó mốc meo lâu quá rồi ^^! Mô hình mạng sẽ sử dụng trong các bài lab sắp tới như sau : Trong bài này, Tôi sẽ viết về quá trình cài đặt ESXi 5 và giới thiệu tổng quan một số thông tin, tùy chọn trên phiên bản ESXi 5. Đầu tiên là các bạn phải file .iso của ESXi 5 về và boot từ CD (.iso nếu cài trên máy ảo. Quá trình cài đặt: - Load các file cần thiết - Thông tin phần cứng - Nhấn [Enter] - Nhấn F11 để đồng ý các điều khoản - Quét kiểm tra phần cứng - Chọn ổ cứng để cài đặt vSphere ESXi 5.0 - Nhấn Enter để tiếp tục ( Default) - Nhập password cho quyền root. - Quá trình cài đặt bắt đầu. . - Việc cài đặt vSphere ESXi 5đã hoàn tất. - Khởi động lại server. Màn hình Console và các Option: Màn hình mặcđịnh kh...

File Monitoring and Auditing "Phần mềm giám sát try cập vào File server"

File Monitoring and Auditing PA File Sight is a file monitoring software that will help you determine who is reading from and writing to important files. It can tell you when a new file or folder is created or renamed. And, with our file watcher, when a file or folder gets deleted, PA File Sight can tell you who did it and what computer they did it from (IP address and computer name). Besides file access auditing and logging actions, the Ultra Edition helps you further by providing historical reports to help see what happened earlier, whether you chose to be notified or not. AND it lets you alert on user usage patterns (reading X files in Y time for example) to help detect file copying activity . Report from PA File Sight Ultra. Note: the Lite edition has alerting, but not reporting.