Bộ chuẩn hóa là một phép biến đổi hoạt động, được sử dụng để chuyển đổi một hàng đơn lẻ thành nhiều hàng và ngược lại. Đó là một cách thông minh để trình bày dữ liệu của bạn theo cách có tổ chức hơn.
Nếu trong một hàng có dữ liệu lặp lại trong nhiều cột, thì dữ liệu đó có thể được tách thành nhiều hàng. Đôi khi chúng tôi có dữ liệu trong nhiều cột xảy ra. Ví dụ
Tên học sinh | Điểm lớp 9 | Điểm lớp 10 | Điểm lớp 11 | Điểm lớp 12 |
Học sinh 1 | 50 | 60 | 65 | 80 |
Sinh viên 2 | 70 | 64 | 83 | 77 |
Trong trường hợp này, cột điểm lớp lặp lại trong bốn cột. Sử dụng bộ chuẩn hóa, chúng ta có thể chia chúng trong tập dữ liệu sau.
Tên học sinh | Lớp học | Ghi bàn |
Học sinh 1 | 9 | 50 |
Học sinh 1 | 10 | 60 |
Học sinh 1 | 11 | 65 |
Học sinh 1 | 12 | 80 |
Sinh viên 2 | 9 | 70 |
Sinh viên 2 | 10 | 64 |
Sinh viên 2 | 11 | 83 |
Sinh viên 2 | 12 | 77 |
Bước 1 - Tạo bảng nguồn "sales_source" và bảng mục tiêu "sales_target" bằng cách sử dụng tập lệnh và nhập chúng vào Informatica
Tải xuống Tệp Sales_Source.txt ở trên
Bước 2 - Tạo ánh xạ có nguồn "sales_source" và bảng mục tiêu "sales_target"
Bước 3 - Từ menu chuyển đổi, tạo một chuyển đổi mới
- Chọn bộ chuẩn hóa làm biến đổi
- Nhập tên, "nrm_sales"
- Chọn tùy chọn tạo
Bước 4 - Chuyển đổi sẽ được tạo, chọn tùy chọn hoàn tất
Bước 5 - Nhấp đúp vào chuyển đổi bộ chuẩn hóa, sau đó
- Chọn tab trình chuẩn hóa
- Nhấp vào biểu tượng để tạo hai cột
- Nhập tên cột
- Đặt số lần xuất hiện thành 4 cho doanh số và 0 cho tên cửa hàng
- Chọn nút OK
Các cột sẽ được tạo trong quá trình chuyển đổi. Bạn sẽ thấy cột số lượng 4 khi chúng tôi đặt số lần xuất hiện là 4.
Bước 6 - Sau đó, trong ánh xạ
- Liên kết bốn cột của bộ định lượng nguồn của bốn phần tư tương ứng với các cột bộ chuẩn hóa.
- Liên kết cột tên cửa hàng với cột chuẩn hóa
- Liên kết store_name và các cột bán hàng từ bộ chuẩn hóa với bảng mục tiêu
- Liên kết cột GK_sales từ bộ chuẩn hóa với bảng mục tiêu
Lưu ánh xạ và thực thi nó sau khi tạo phiên và quy trình làm việc. Đối với mỗi doanh số bán hàng quý của một cửa hàng, một hàng riêng biệt sẽ được tạo bằng cách chuyển đổi bộ chuẩn hóa.
Đầu ra của ánh xạ của chúng ta sẽ như sau:
Tên cửa hàng | Phần tư | Bán hàng |
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Dữ liệu nguồn có các cột lặp lại là QUARTER1, QUARTER2, QUARTER3 và QUARTER4. Với sự trợ giúp của bộ chuẩn hóa, chúng tôi đã sắp xếp lại dữ liệu để vừa với một cột QUARTER duy nhất và đối với một bản ghi nguồn, bốn bản ghi được tạo trong đích.
Bằng cách này, bạn có thể chuẩn hóa dữ liệu và tạo nhiều bản ghi cho một nguồn dữ liệu duy nhất.