Khán giả mục tiêu
Kho dữ liệu (DW) là kho lưu trữ lượng lớn dữ liệu có tổ chức. Dữ liệu này được hợp nhất từ một hoặc nhiều nguồn dữ liệu khác nhau. DW là cơ sở dữ liệu quan hệ được thiết kế chủ yếu để báo cáo phân tích và đưa ra quyết định kịp thời trong các tổ chức.
Dữ liệu cho mục đích này được tách biệt và tối ưu hóa từ dữ liệu giao dịch nguồn, điều này sẽ không có bất kỳ tác động nào đến hoạt động kinh doanh chính. Nếu một tổ chức đưa ra bất kỳ thay đổi kinh doanh nào thì DW được sử dụng để kiểm tra tác động của thay đổi đó và do đó DW cũng được sử dụng để giám sát quá trình ra quyết định.
Kho dữ liệu chủ yếu là hệ thống chỉ đọc vì dữ liệu vận hành được tách biệt rất nhiều với DW. Điều này cung cấp một môi trường để truy xuất lượng dữ liệu cao nhất với khả năng viết truy vấn tốt.
Do đó, DW sẽ đóng vai trò là công cụ phụ trợ cho các công cụ Business Intelligence hiển thị các báo cáo, bảng điều khiển cho người dùng doanh nghiệp. DW được sử dụng rộng rãi trong các lĩnh vực ngân hàng, tài chính, bán lẻ, v.v.
Dưới đây là một số lý do tại sao Kho dữ liệu lại quan trọng.
Business Intelligence (BI) là một nhánh của kho dữ liệu được thiết kế để ra quyết định. Sau khi dữ liệu trong DW được tải, BI đóng vai trò chính bằng cách phân tích dữ liệu và trình bày dữ liệu đó cho người dùng doanh nghiệp.
Trên thực tế, thuật ngữ “ứng dụng kho dữ liệu” ngụ ý về số lượng loại dữ liệu khác nhau có thể được xử lý và sử dụng.
Chúng tôi có ba loại Ứng dụng DW như được đề cập dưới đây.
Đây là một loại ứng dụng trong đó kho dữ liệu cho phép liên hệ trực tiếp với dữ liệu được lưu trữ trong đó.
Vì dữ liệu có thể được xử lý bằng cách viết truy vấn trực tiếp lên dữ liệu (hoặc) bằng phân tích thống kê cơ bản về dữ liệu và kết quả cuối cùng sẽ được báo cáo cho người dùng doanh nghiệp dưới dạng báo cáo, bảng, biểu đồ hoặc đồ thị.
DW hỗ trợ các công cụ sau để xử lý thông tin:
(i) Công cụ truy vấn: Doanh nghiệp (hoặc) nhà phân tích chạy các truy vấn bằng cách sử dụng các công cụ truy vấn để khám phá dữ liệu và tạo đầu ra dưới dạng báo cáo hoặc đồ họa theo yêu cầu kinh doanh.
(ii) Công cụ báo cáo: Nếu doanh nghiệp muốn xem kết quả ở bất kỳ định dạng xác định nào và theo lịch trình tức là hàng ngày, hàng tuần hoặc hàng tháng thì các công cụ báo cáo sẽ được sử dụng. Những loại báo cáo này có thể được lưu và xem lại bất cứ lúc nào.
(iii) Công cụ thống kê: Nếu doanh nghiệp muốn phân tích dữ liệu ở góc độ bao quát thì các công cụ thống kê sẽ được sử dụng để tạo ra kết quả đó. Doanh nghiệp có thể đưa ra kết luận và dự đoán bằng cách hiểu những kết quả chiến lược này.
Đây là một loại ứng dụng trong đó kho dữ liệu cho phép xử lý phân tích dữ liệu được lưu trữ trong đó. Dữ liệu có thể được phân tích bằng các thao tác sau như Cắt và Xúc xắc, Truy sâu xuống, Cuộn lên và Xoay vòng.
(i) Slice-and-Dice : Kho dữ liệu cho phép các hoạt động cắt và xúc xắc phân tích dữ liệu được truy cập từ nhiều cấp độ với sự kết hợp của nhiều góc độ khác nhau. Hoạt động cắt và xúc xắc sử dụng cơ chế truy sâu xuống bên trong. Cắt lát hoạt động trên dữ liệu chiều.
Là một phần của yêu cầu kinh doanh, nếu chúng tôi tập trung vào một khu vực duy nhất thì việc cắt lát sẽ phân tích kích thước của khu vực cụ thể đó theo yêu cầu và đưa ra kết quả. Dicing hoạt động trên các hoạt động phân tích. Dicing thu phóng một tập hợp thuộc tính cụ thể trên tất cả các kích thước để cung cấp các góc nhìn đa dạng. Kích thước được xem xét từ một hoặc nhiều lát liên tiếp.
(ii) Đi sâu vào : Nếu doanh nghiệp muốn đi đến cấp độ chi tiết hơn của bất kỳ số tóm tắt nào, thì đi sâu vào là thao tác điều hướng xuống cấp độ tóm tắt đó đến các cấp độ chi tiết nhỏ. Điều này mang lại ý tưởng tuyệt vời về những gì đang xảy ra và nơi doanh nghiệp phải tập trung chặt chẽ hơn.
Đi sâu vào các dấu vết từ cấp độ phân cấp cho đến cấp độ chi tiết nhỏ để phân tích nguyên nhân gốc rễ. Bạn có thể dễ dàng hiểu điều này bằng một ví dụ vì việc phân tích chi tiết doanh số bán hàng có thể diễn ra từ Cấp quốc gia -> Cấp khu vực -> Cấp tiểu bang -> Cấp quận -> Cấp cửa hàng.
(iii) Roll up : Roll up hoạt động ngược lại với thao tác khoan xuống. Nếu doanh nghiệp muốn bất kỳ dữ liệu tóm tắt nào, thì việc cuộn lên sẽ xuất hiện. Nó tổng hợp dữ liệu ở cấp độ chi tiết bằng cách di chuyển lên trong hệ thống phân cấp thứ nguyên.
Roll-up được sử dụng để phân tích sự phát triển và hiệu suất của một hệ thống.
Điều này có thể được hiểu bằng một Ví dụ như trong bảng tổng hợp doanh số trong đó tổng số có thể được tổng hợp từ Cấp Thành phố -> Cấp Tiểu bang -> Cấp Khu vực -> Cấp Quốc gia .
(iv) Pivot : Xoay vòng phân tích dữ liệu kích thước bằng cách xoay dữ liệu trên các hình khối. Ví dụ: kích thước hàng có thể được hoán đổi thành kích thước cột và ngược lại.
Đây là một loại ứng dụng trong đó kho dữ liệu cho phép khám phá kiến thức về dữ liệu và kết quả sẽ được biểu diễn bằng các công cụ trực quan. Trong hai loại ứng dụng trên, thông tin có thể được điều khiển bởi người dùng.
Khi dữ liệu có rất nhiều trong các doanh nghiệp khác nhau, rất khó để truy vấn và đi sâu vào kho dữ liệu để có được tất cả thông tin chi tiết có thể có về dữ liệu. Sau đó, việc khai thác dữ liệu sẽ được thực hiện để hoàn thành việc khám phá kiến thức.
Điều này đưa vào dữ liệu với tất cả các liên kết, kết quả, v.v. trong quá khứ và dự đoán tương lai. Do đó, đây là điều khiển dựa trên dữ liệu chứ không phải điều khiển người dùng. Dữ liệu có thể được phát hiện bằng cách tìm các mẫu, mối liên hệ, phân loại và dự đoán ẩn.
Khai thác dữ liệu đi sâu vào dữ liệu để dự đoán tương lai. Dựa trên những dự đoán, nó cũng gợi ý những hành động cần thực hiện.
Dưới đây là các hoạt động khác nhau của Khai thác dữ liệu:
Do đó, dựa trên tất cả các kết quả trên, Khai thác dữ liệu cũng đề xuất một tập hợp các hành động cần thực hiện.
Kho dữ liệu được xây dựng dựa trên các đặc điểm sau của dữ liệu như Định hướng chủ đề, Tích hợp, Không biến động và Biến thể theo thời gian.
#1) Định hướng chủ đề: Chúng ta có thể định nghĩa kho dữ liệu là hướng chủ đề vì chúng ta có thể phân tích dữ liệu liên quan đến một lĩnh vực chủ đề cụ thể thay vì áp dụng dữ liệu khôn ngoan. Điều này cung cấp kết quả được xác định rõ ràng hơn để đưa ra quyết định dễ dàng. Đối với một hệ thống giáo dục, các môn học có thể là học sinh, môn học, điểm số, giáo viên, v.v..
#2) Tích hợp: Dữ liệu trong kho dữ liệu được tích hợp từ các nguồn riêng biệt như cơ sở dữ liệu quan hệ khác, tệp phẳng, v.v. Một lượng lớn dữ liệu như vậy được tìm nạp để phân tích dữ liệu hiệu quả. Tuy nhiên, có thể có xung đột dữ liệu vì các nguồn dữ liệu khác nhau có thể có định dạng khác nhau. Kho dữ liệu mang tất cả dữ liệu này ở định dạng nhất quán trên toàn hệ thống.
#3) Không biến động: Khi dữ liệu được tải vào kho dữ liệu, nó không thể thay đổi được. Về mặt logic, điều này có thể chấp nhận được vì việc thay đổi dữ liệu thường xuyên sẽ không cho phép bạn phân tích dữ liệu. Những thay đổi thường xuyên trong cơ sở dữ liệu vận hành có thể được tải vào kho dữ liệu theo lịch trình, trong quá trình này, dữ liệu mới sẽ được thêm vào, tuy nhiên, dữ liệu trước đó không bị xóa và vẫn là dữ liệu lịch sử.
#4) Biến thể theo thời gian: Tất cả dữ liệu lịch sử cùng với dữ liệu gần đây trong Kho dữ liệu đóng vai trò quan trọng để truy xuất dữ liệu trong bất kỳ khoảng thời gian nào. Nếu doanh nghiệp muốn bất kỳ báo cáo, đồ thị nào, v.v. thì để so sánh với các năm trước và để phân tích xu hướng, tất cả dữ liệu cũ 6 tháng, 1 năm hoặc thậm chí cũ hơn, v.v. đều được yêu cầu.
Khi hệ thống kho dữ liệu hoạt động hiệu quả, tổ chức sẽ nhận được những lợi ích sau khi sử dụng nó:
#1) Thông minh kinh doanh nâng cao: Trong những ngày trước khi Kho dữ liệu và Thông minh kinh doanh chưa xuất hiện, người dùng doanh nghiệp và nhà phân tích thường đưa ra quyết định với một lượng dữ liệu hạn chế và theo trực giác của họ.
DW & BI đã mang lại sự thay đổi bằng cách đưa ra những hiểu biết sâu sắc về dữ kiện thực tế và dữ liệu thực tế của tổ chức được thu thập trong một khoảng thời gian. Người dùng doanh nghiệp có thể truy vấn trực tiếp bất kỳ dữ liệu nào về quy trình kinh doanh như tiếp thị, tài chính, bán hàng, v.v., dựa trên nhu cầu ra quyết định chiến lược và quyết định kinh doanh thông minh của họ.
#2) Tăng hiệu suất truy vấn và hệ thống: Kho dữ liệu thu thập thông tin cồng kềnh từ các hệ thống không đồng nhất và đặt nó trong một hệ thống để có thể sử dụng một công cụ truy vấn duy nhất để truy xuất dữ liệu nhanh chóng.
#3) Business Intelligence từ nhiều nguồn: Bạn có biết Business Intelligence thường hoạt động như thế nào trên dữ liệu không? Nó hấp thụ dữ liệu từ nhiều hệ thống, hệ thống con, nền tảng và nguồn dữ liệu để làm việc trên một dự án. Tuy nhiên, Kho dữ liệu giải quyết vấn đề này cho BI bằng cách hợp nhất tất cả dữ liệu dự án mà không có bất kỳ sự trùng lặp nào.
#4) Truy cập dữ liệu kịp thời: Người dùng doanh nghiệp sẽ được hưởng lợi bằng cách dành ít thời gian hơn cho việc truy xuất dữ liệu. Họ có một số công cụ tiện dụng giúp họ có thể truy vấn dữ liệu với kiến thức kỹ thuật tối thiểu và tạo báo cáo. Điều này khiến người dùng doanh nghiệp dành đủ thời gian cho việc phân tích dữ liệu hơn là thu thập dữ liệu.
#5) Chất lượng và tính nhất quán của dữ liệu được nâng cao: Kho dữ liệu chuyển đổi dữ liệu có định dạng hệ thống nguồn khác nhau thành một định dạng duy nhất. Do đó, có thể các đơn vị kinh doanh tương tự đang tìm nguồn dữ liệu cho kho dữ liệu có thể sử dụng lại kho lưu trữ DW cho các báo cáo và truy vấn kinh doanh của họ.
Do đó, theo quan điểm của tổ chức, tất cả các đơn vị kinh doanh sẽ tuân thủ các kết quả/báo cáo nhất quán. Do đó, dữ liệu chất lượng tốt và nhất quán này giúp điều hành một doanh nghiệp thành công.
#6) Thông tin lịch sử: Kho dữ liệu duy trì tất cả dữ liệu lịch sử không được duy trì bởi bất kỳ hệ thống giao dịch nào. Lượng dữ liệu lớn này được sử dụng để phân tích dữ liệu trong khoảng thời gian cụ thể và báo cáo dữ liệu đó cũng như phân tích các xu hướng để dự đoán tương lai.
#7) Lợi tức đầu tư (ROI) cao: Bất kỳ ai cũng bắt đầu kinh doanh bằng cách mong đợi lợi nhuận tốt từ khoản đầu tư, xét về lợi nhuận lớn hơn và chi phí thấp hơn. Trong thế giới dữ liệu thực, nhiều nghiên cứu đã chứng minh rằng việc triển khai kho dữ liệu và hệ thống Business Intelligence tạo ra doanh thu cao và tiết kiệm chi phí.
Đến bây giờ, bạn đã có thể hiểu hệ thống DW được thiết kế tốt sẽ mang lại lợi ích như thế nào cho doanh nghiệp của bạn.
Mặc dù đây là một hệ thống rất thành công nhưng cũng nên biết một số cạm bẫy trong hệ thống:
Nguồn: softwaretesting
You need to login in order to like this post: click here
YOU MIGHT ALSO LIKE