OLAP là gì?
Xử lý phân tích trực tuyến (OLAP) là một loại phần mềm cho phép người dùng phân tích thông tin từ nhiều hệ thống cơ sở dữ liệu cùng một lúc. Đây là một công nghệ cho phép các nhà phân tích trích xuất và xem dữ liệu kinh doanh từ các quan điểm khác nhau.
Các nhà phân tích thường xuyên cần nhóm, tổng hợp và kết hợp dữ liệu. Các hoạt động này trong cơ sở dữ liệu quan hệ sử dụng nhiều tài nguyên. Với dữ liệu OLAP có thể được tính toán trước và tổng hợp trước, giúp phân tích nhanh hơn.
Cơ sở dữ liệu OLAP được chia thành một hoặc nhiều khối. Các hình khối được thiết kế theo cách mà việc tạo và xem các báo cáo trở nên dễ dàng. OLAP là viết tắt của Online Analytical Processing.
Trong hướng dẫn này, bạn sẽ học-
- Khối lập phương OLAP
- Các hoạt động phân tích cơ bản của OLAP
- Các loại hệ thống OLAP
- ROLAP
- MOLAP
- OLAP kết hợp
- Ưu điểm của OLAP
- Nhược điểm của OLAP
Khối lập phương OLAP:
Cốt lõi của khái niệm OLAP là một Khối lập phương OLAP. Khối lập phương OLAP là một cấu trúc dữ liệu được tối ưu hóa để phân tích dữ liệu rất nhanh.
Khối lập phương OLAP bao gồm các dữ kiện số được gọi là số đo được phân loại theo thứ nguyên. OLAP Cube còn được gọi là hypercube .
Thông thường, các phép toán và phân tích dữ liệu được thực hiện bằng cách sử dụng bảng tính đơn giản, nơi các giá trị dữ liệu được sắp xếp theo định dạng hàng và cột. Điều này là lý tưởng cho dữ liệu hai chiều. Tuy nhiên, OLAP chứa dữ liệu đa chiều, với dữ liệu thường được lấy từ một nguồn khác và không liên quan. Sử dụng bảng tính không phải là một lựa chọn tối ưu. Khối lập phương có thể lưu trữ và phân tích dữ liệu đa chiều một cách logic và có trật tự.
Làm thế nào nó hoạt động?
Kho dữ liệu sẽ trích xuất thông tin từ nhiều nguồn và định dạng dữ liệu như tệp văn bản, trang tính excel, tệp đa phương tiện, v.v.
Dữ liệu trích xuất được làm sạch và chuyển đổi. Dữ liệu được tải vào máy chủ OLAP (hoặc khối lập phương OLAP) nơi thông tin được tính toán trước để phân tích thêm.
Các hoạt động phân tích cơ bản của OLAP
Bốn loại hoạt động phân tích trong OLAP là:
- Cuộn lên
- Đi sâu vào
- Xắt từng lát mỏng
- Pivot (xoay)
1) Cuộn lên:
Cuộn lên còn được gọi là "hợp nhất" hoặc "tổng hợp". Thao tác cuộn lên có thể được thực hiện theo 2 cách
- Giảm kích thước
- Leo lên hệ thống phân cấp khái niệm. Hệ thống phân cấp khái niệm là một hệ thống nhóm các sự vật dựa trên thứ tự hoặc cấp độ của chúng.
Hãy xem xét sơ đồ sau
- Trong ví dụ này, các thành phố New jersey và Lost Angles và được tập hợp lại thành quốc gia Hoa Kỳ
- Con số bán hàng của New Jersey và Los Angeles lần lượt là 440 và 1560. Họ trở thành 2000 sau khi cuộn lên
- Trong quá trình tổng hợp này, dữ liệu được phân cấp vị trí di chuyển từ thành phố đến quốc gia.
- Trong quá trình cuộn lên, cần loại bỏ ít nhất một hoặc nhiều thứ nguyên. Trong ví dụ này, thứ nguyên Quater bị loại bỏ.
2) Đi sâu vào
Trong chi tiết dữ liệu được phân mảnh thành các phần nhỏ hơn. Nó ngược lại với quá trình cuộn lên. Nó có thể được thực hiện thông qua
- Di chuyển xuống hệ thống phân cấp khái niệm
- Tăng một thứ nguyên
Hãy xem xét sơ đồ trên
- Quý 1 được giảm xuống các tháng 1, 2 và 3. Doanh số tương ứng cũng là sổ đăng ký.
- Trong ví dụ này, tháng thứ nguyên được thêm vào.
3) Lát:
Tại đây, một thứ nguyên được chọn và một khối phụ mới được tạo.
Sơ đồ sau giải thích cách hoạt động của lát cắt được thực hiện:
- Thời gian thứ nguyên được cắt với Q1 làm bộ lọc.
- Một khối mới được tạo ra hoàn toàn.
Xúc xắc:
Thao tác này tương tự như một lát cắt. Sự khác biệt trong xúc xắc là bạn chọn 2 hoặc nhiều kích thước dẫn đến việc tạo ra một khối phụ.
4) Xoay vòng
Trong Pivot, bạn xoay các trục dữ liệu để cung cấp bản trình bày dữ liệu thay thế.
Trong ví dụ sau, trục xoay dựa trên các loại mục.
Các loại hệ thống OLAP
Cấu trúc phân cấp OLAP
Loại OLAP | Giải trình |
OLAP quan hệ (ROLAP): | ROLAP là một RDBMS mở rộng cùng với ánh xạ dữ liệu đa chiều để thực hiện hoạt động quan hệ tiêu chuẩn. |
OLAP đa chiều (MOLAP) | MOLAP Triển khai hoạt động trong dữ liệu đa chiều. |
Xử lý phân tích trực tuyến kết hợp (HOLAP) | Trong cách tiếp cận HOLAP, các tổng tổng hợp được lưu trữ trong cơ sở dữ liệu đa chiều trong khi dữ liệu chi tiết được lưu trữ trong cơ sở dữ liệu quan hệ. Điều này mang lại cả hiệu quả dữ liệu của mô hình ROLAP và hiệu suất của mô hình MOLAP. |
OLAP trên máy tính để bàn (DOLAP) | Trong OLAP trên máy tính để bàn, người dùng tải xuống một phần dữ liệu từ cơ sở dữ liệu cục bộ hoặc trên máy tính để bàn của họ và phân tích nó. DOLAP tương đối rẻ hơn để triển khai vì nó cung cấp rất ít chức năng so với các hệ thống OLAP khác. |
Web OLAP (WOLAP) | Web OLAP là hệ thống OLAP có thể truy cập được thông qua trình duyệt web. WOLAP là một kiến trúc ba tầng. Nó bao gồm ba thành phần: máy khách, phần mềm trung gian và máy chủ cơ sở dữ liệu. |
OLAP di động: | OLAP di động giúp người dùng truy cập và phân tích dữ liệu OLAP bằng thiết bị di động của họ |
OLAP không gian: | SOLAP được tạo ra để tạo điều kiện thuận lợi cho việc quản lý cả dữ liệu không gian và phi không gian trong hệ thống thông tin địa lý (GIS) |
ROLAP
ROLAP hoạt động với dữ liệu tồn tại trong cơ sở dữ liệu quan hệ. Dữ kiện và bảng thứ nguyên được lưu trữ dưới dạng bảng quan hệ. Nó cũng cho phép phân tích dữ liệu đa chiều và là OLAP phát triển nhanh nhất.
Ưu điểm của mô hình ROLAP:
- Hiệu quả dữ liệu cao. Nó mang lại hiệu quả dữ liệu cao vì hiệu suất truy vấn và ngôn ngữ truy cập được tối ưu hóa đặc biệt cho phân tích dữ liệu đa chiều.
- Khả năng mở rộng. Loại hệ thống OLAP này cung cấp khả năng mở rộng để quản lý khối lượng lớn dữ liệu và ngay cả khi dữ liệu đang tăng đều đặn.
Hạn chế của mô hình ROLAP:
- Nhu cầu về tài nguyên cao hơn: ROLAP cần sử dụng nhiều tài nguyên về nhân lực, phần mềm và phần cứng.
- Giới hạn dữ liệu tổng hợp. Các công cụ ROLAP sử dụng SQL cho tất cả các tính toán dữ liệu tổng hợp. Tuy nhiên, không có giới hạn nào được đặt ra đối với việc xử lý các phép tính.
- Hiệu suất truy vấn chậm. Hiệu suất truy vấn trong mô hình này chậm khi so sánh với MOLAP
MOLAP
MOLAP sử dụng công cụ lưu trữ đa chiều dựa trên mảng để hiển thị các chế độ xem đa chiều của dữ liệu. Về cơ bản, chúng sử dụng một khối lập phương OLAP.
Tìm hiểu thêm về OLAP tại đây
OLAP kết hợp
Hybrid OLAP là hỗn hợp của cả ROLAP và MOLAP. Nó cung cấp tính toán nhanh chóng của MOLAP và khả năng mở rộng cao hơn của ROLAP. HOLAP sử dụng hai cơ sở dữ liệu.
- Dữ liệu tổng hợp hoặc tính toán được lưu trữ trong khối OLAP đa chiều
- Thông tin chi tiết được lưu trữ trong cơ sở dữ liệu quan hệ.
Lợi ích của Hybrid OLAP:
- Loại OLAP này giúp tiết kiệm dung lượng ổ đĩa và nó cũng vẫn nhỏ gọn giúp tránh các vấn đề liên quan đến tốc độ truy cập và sự tiện lợi.
- Hybrid HOLAP's sử dụng công nghệ khối lập phương cho phép hiệu suất nhanh hơn cho tất cả các loại dữ liệu.
- ROLAP được cập nhật ngay lập tức và người dùng HOLAP có quyền truy cập vào dữ liệu được cập nhật tức thì theo thời gian thực này. MOLAP giúp làm sạch và chuyển đổi dữ liệu, do đó cải thiện mức độ liên quan của dữ liệu. Điều này mang lại tốt nhất của cả hai thế giới.
Hạn chế của OLAP kết hợp:
- Mức độ phức tạp lớn hơn : Hạn chế lớn trong hệ thống HOLAP là nó hỗ trợ cả các công cụ và ứng dụng ROLAP và MOLAP. Như vậy, nó rất phức tạp.
- Có khả năng chồng chéo : Có nhiều khả năng chồng chéo hơn, đặc biệt là về chức năng của chúng.
Ưu điểm của OLAP
- OLAP là một nền tảng cho tất cả các loại hình kinh doanh bao gồm lập kế hoạch, lập ngân sách, báo cáo và phân tích.
- Thông tin và tính toán nhất quán trong một khối OLAP. Đây là một lợi ích quan trọng.
- Nhanh chóng tạo và phân tích các tình huống "Nếu xảy ra"
- Dễ dàng tìm kiếm cơ sở dữ liệu OLAP cho các thuật ngữ rộng hoặc cụ thể.
- OLAP cung cấp các khối xây dựng cho các công cụ lập mô hình kinh doanh, công cụ khai thác dữ liệu, công cụ báo cáo hiệu suất.
- Cho phép người dùng thực hiện tất cả dữ liệu hình khối và lát cắt theo nhiều kích thước, thước đo và bộ lọc khác nhau.
- Nó rất tốt cho việc phân tích chuỗi thời gian.
- Tìm một số cụm và ngoại lệ thật dễ dàng với OLAP.
- Đây là một hệ thống quy trình phân tích trực tuyến trực quan mạnh mẽ cung cấp thời gian phản hồi nhanh hơn
Nhược điểm của OLAP
- OLAP yêu cầu tổ chức dữ liệu thành một giản đồ hình sao hoặc bông tuyết. Các lược đồ này rất phức tạp để triển khai và quản lý
- Bạn không thể có nhiều kích thước trong một khối OLAP duy nhất
- Không thể truy cập dữ liệu giao dịch bằng hệ thống OLAP.
- Bất kỳ sửa đổi nào trong khối OLAP đều cần cập nhật đầy đủ về khối. Đây là một quá trình tốn nhiều thời gian
Tóm lược:
- OLAP là một công nghệ cho phép các nhà phân tích trích xuất và xem dữ liệu kinh doanh từ các quan điểm khác nhau.
- Cốt lõi của khái niệm OLAP là một Khối lập phương OLAP.
- Các ứng dụng kinh doanh khác nhau và các hoạt động dữ liệu khác yêu cầu sử dụng Khối lập phương OLAP.
- Có năm loại hoạt động phân tích chính trong OLAP 1) Cuộn lên 2) Đi sâu vào 3) Cắt 4) Xúc xắc và 5) Xoay vòng
- Ba loại hệ thống OLAP được sử dụng rộng rãi là MOLAP, ROLAP và Hybrid OLAP.
- OLAP trên máy tính để bàn, OLAP trên web và OLAP trên điện thoại di động là một số loại hệ thống OLAP khác.