Lược đồ ngôi sao và bông tuyết trong Kho dữ liệu với các ví dụ

Mục lục:

Anonim

Lược đồ đa chiều là gì?

Lược đồ đa chiều được thiết kế đặc biệt để mô hình hóa hệ thống kho dữ liệu. Các lược đồ được thiết kế để giải quyết các nhu cầu riêng của cơ sở dữ liệu rất lớn được thiết kế cho mục đích phân tích (OLAP).

Các loại lược đồ kho dữ liệu:

Sau đây là 3 loại lược đồ đa chiều chính, mỗi loại có những ưu điểm riêng biệt.

  • Lược đồ sao
  • Lược đồ bông tuyết
  • Lược đồ Thiên hà

Trong hướng dẫn này, bạn sẽ tìm hiểu thêm về-

  • Lược đồ sao là gì?
  • Lược đồ bông tuyết là gì?
  • Lược đồ sao Vs Lược đồ bông tuyết: Những điểm khác biệt chính
  • Lược đồ Thiên hà là gì?
  • Lược đồ Cụm sao là gì?

Lược đồ sao là gì?

Lược đồ hình sao trong kho dữ liệu, trong đó tâm của ngôi sao có thể có một bảng dữ kiện và một số bảng kích thước liên quan. Nó được gọi là giản đồ sao vì cấu trúc của nó giống như một ngôi sao. Mô hình dữ liệu Lược đồ hình sao là loại giản đồ Kho dữ liệu đơn giản nhất. Nó còn được gọi là Star Join Schema và được tối ưu hóa để truy vấn các tập dữ liệu lớn.

Trong ví dụ về Sơ đồ hình sao sau đây, bảng dữ kiện nằm ở trung tâm chứa các khóa cho mọi bảng thứ nguyên như Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID và các thuộc tính khác như Đơn vị đã bán và doanh thu.

Ví dụ về Sơ đồ giản đồ sao

Đặc điểm của lược đồ sao:

  • Mọi thứ nguyên trong giản đồ hình sao được biểu thị bằng bảng một thứ nguyên duy nhất.
  • Bảng thứ nguyên phải chứa tập hợp các thuộc tính.
  • Bảng thứ nguyên được nối với bảng dữ kiện bằng khóa ngoại
  • Bảng thứ nguyên không được nối với nhau
  • Bảng dữ kiện sẽ chứa chìa khóa và thước đo
  • Lược đồ Star rất dễ hiểu và cung cấp khả năng sử dụng đĩa tối ưu.
  • Các bảng kích thước không được chuẩn hóa. Ví dụ, trong hình trên, Country_ID không có bảng tra cứu Quốc gia như một thiết kế OLTP sẽ có.
  • Lược đồ được hỗ trợ rộng rãi bởi BI Tools

Lược đồ bông tuyết là gì?

Lược đồ bông tuyết trong kho dữ liệu là sự sắp xếp hợp lý của các bảng trong cơ sở dữ liệu đa chiều sao cho biểu đồ ER giống với hình bông tuyết. Lược đồ Bông tuyết là một phần mở rộng của Lược đồ Sao và nó bổ sung thêm các thứ nguyên. Các bảng thứ nguyên được chuẩn hóa chia dữ liệu thành các bảng bổ sung.

Trong ví dụ về Lược đồ bông tuyết sau đây, Quốc gia được chuẩn hóa thêm thành một bảng riêng lẻ.

Ví dụ về giản đồ bông tuyết

Đặc điểm của Lược đồ Bông tuyết:

  • Lợi ích chính của lược đồ bông tuyết là nó sử dụng không gian đĩa nhỏ hơn.
  • Dễ dàng triển khai thứ nguyên hơn được thêm vào Giản đồ
  • Do nhiều bảng, hiệu suất truy vấn bị giảm
  • Thách thức chính mà bạn sẽ phải đối mặt khi sử dụng Lược đồ bông tuyết là bạn cần thực hiện nhiều nỗ lực bảo trì hơn vì có nhiều bảng tra cứu hơn.

Lược đồ sao Vs Lược đồ bông tuyết: Những điểm khác biệt chính

Sau đây là sự khác biệt chính giữa Lược đồ sao và Lược đồ bông tuyết:

Lược đồ sao Lược đồ bông tuyết
Cấu trúc phân cấp cho các thứ nguyên được lưu trữ trong bảng thứ nguyên. Cấu trúc phân cấp được chia thành các bảng riêng biệt.
Nó chứa một bảng dữ kiện được bao quanh bởi các bảng kích thước. Một bảng dữ kiện được bao quanh bởi bảng kích thước lần lượt được bao quanh bởi bảng kích thước
Trong lược đồ hình sao, chỉ một phép nối duy nhất tạo ra mối quan hệ giữa bảng dữ kiện và bất kỳ bảng thứ nguyên nào. Một giản đồ bông tuyết yêu cầu nhiều liên kết để tìm nạp dữ liệu.
Thiết kế DB đơn giản. Thiết kế DB rất phức tạp.
Cấu trúc dữ liệu được chuẩn hóa và truy vấn cũng chạy nhanh hơn. Cấu trúc dữ liệu chuẩn hóa.
Mức độ dự phòng dữ liệu cao Dự phòng dữ liệu mức rất thấp
Bảng Thứ nguyên đơn chứa dữ liệu tổng hợp. Dữ liệu được chia thành các Bảng thứ nguyên khác nhau.
Xử lý hình khối nhanh hơn. Quá trình xử lý hình khối có thể chậm do liên kết phức tạp.
Cung cấp các truy vấn hoạt động cao hơn bằng cách sử dụng Tối ưu hóa Truy vấn Tham gia Sao. Các bảng có thể được kết nối với nhiều kích thước. Lược đồ Snowflake được thể hiện bằng bảng dữ kiện tập trung mà không có khả năng kết nối với nhiều thứ nguyên.

Lược đồ Thiên hà là gì?

Một Galaxy Schema chứa hai bảng thực tế là bảng kích thước phần giữa chúng. Nó còn được gọi là Lược đồ Chòm sao Sự thật. Lược đồ được xem như một tập hợp các ngôi sao do đó có tên là Lược đồ Thiên hà.

Ví dụ về Lược đồ Thiên hà

Như bạn có thể thấy trong ví dụ trên, có hai bảng dữ kiện

  1. Doanh thu
  2. Sản phẩm.

Trong các kích thước chia sẻ lược đồ Thiên hà được gọi là Kích thước phù hợp.

Đặc điểm của Lược đồ Thiên hà:

  • Các thứ nguyên trong lược đồ này được phân tách thành các thứ nguyên riêng biệt dựa trên các cấp phân cấp khác nhau.
  • Ví dụ: nếu địa lý có bốn cấp độ phân cấp như khu vực, quốc gia, tiểu bang và thành phố thì giản đồ Thiên hà phải có bốn chiều.
  • Hơn nữa, có thể xây dựng loại lược đồ này bằng cách tách lược đồ một sao thành nhiều lược đồ Sao hơn.
  • Các kích thước lớn trong lược đồ này cần được xây dựng dựa trên các cấp của cấu trúc phân cấp.
  • Lược đồ này hữu ích cho việc tổng hợp các bảng dữ kiện để hiểu rõ hơn.

Lược đồ Cụm sao là gì?

Lược đồ bông tuyết chứa các cấu trúc phân cấp được mở rộng đầy đủ. Tuy nhiên, điều này có thể tăng thêm độ phức tạp cho Lược đồ và yêu cầu thêm các phép nối. Mặt khác, lược đồ hình sao chứa các cấu trúc phân cấp đã được thu gọn hoàn toàn, điều này có thể dẫn đến dư thừa. Vì vậy, giải pháp tốt nhất có thể là sự cân bằng giữa hai lược đồ này là thiết kế Lược đồ Cụm sao.

Ví dụ về giản đồ cụm sao

Các thứ nguyên chồng chéo có thể được tìm thấy dưới dạng ngã ba trong phân cấp. Một ngã ba xảy ra khi một thực thể đóng vai trò là cha mẹ trong hai cấu trúc phân cấp chiều khác nhau. Các thực thể Fork sau đó được xác định là phân loại với các mối quan hệ một-nhiều.

Tóm lược:

  • Lược đồ đa chiều được thiết kế đặc biệt để mô hình hóa hệ thống kho dữ liệu
  • Lược đồ hình sao là loại giản đồ Kho dữ liệu đơn giản nhất. Nó được gọi là giản đồ sao vì cấu trúc của nó giống như một ngôi sao.
  • Lược đồ Bông tuyết là phần mở rộng của Lược đồ Sao và nó bổ sung thêm các thứ nguyên. Nó được gọi là bông tuyết vì sơ đồ của nó giống một bông Tuyết.
  • Trong lược đồ hình sao, chỉ một phép nối xác định mối quan hệ giữa bảng dữ kiện và bất kỳ bảng thứ nguyên nào.
  • Lược đồ hình sao chứa một bảng dữ kiện được bao quanh bởi các bảng thứ nguyên.
  • Lược đồ bông tuyết được bao quanh bởi bảng kích thước, lần lượt được bao quanh bởi bảng kích thước
  • Một giản đồ bông tuyết yêu cầu nhiều liên kết để tìm nạp dữ liệu.
  • Một Lược đồ Thiên hà chứa hai bảng dữ kiện dùng chung các bảng kích thước. Nó còn được gọi là Lược đồ Chòm sao Sự thật.
  • Lược đồ cụm sao chứa các thuộc tính của Lược đồ sao và bông tuyết.