Ánh xạ là một tập hợp các đối tượng nguồn và đích được liên kết với nhau bằng một tập hợp các phép biến đổi. Những chuyển đổi này bao gồm một tập hợp các quy tắc, xác định luồng dữ liệu và cách dữ liệu được tải vào các mục tiêu.
Một ánh xạ bao gồm tập hợp các đối tượng sau
- Định nghĩa nguồn - Định nghĩa nguồn xác định cấu trúc và đặc tính của nguồn, các kiểu dữ liệu cơ bản của nó, loại nguồn dữ liệu, v.v.
- Chuyển đổi - Các đối tượng chuyển đổi xác định cách dữ liệu nguồn được chuyển đổi và các chức năng khác nhau có thể được áp dụng trong quá trình này
- Định nghĩa mục tiêu - Định nghĩa mục tiêu xác định mục tiêu cuối cùng nơi dữ liệu sẽ được tải.
- Liên kết - Liên kết kết nối định nghĩa nguồn với các phép biến đổi khác nhau và các bảng mục tiêu. Nó xác định cách dữ liệu di chuyển từ nguồn đến đích và các phép biến đổi.
Trong Hướng dẫn này- bạn sẽ học
- Tại sao bạn cần Lập bản đồ?
- Các thành phần của ánh xạ
- Bản đồ giai đoạn là gì?
- Cách tạo bản đồ
- Tham số ánh xạ và biến
- Cách tạo thông số ánh xạ
- Cách tạo biến ánh xạ
Tại sao bạn cần Lập bản đồ?
Ánh xạ là một đối tượng trong Informatica với sự trợ giúp của nó mà bạn có thể xác định cách dữ liệu nguồn được sửa đổi trước khi nó đến đích hoặc đối tượng đích. Giống như nếu bạn có tên nhân viên là "Bill Clinton" trong hệ thống nguồn của mình và trong hệ thống đích, yêu cầu là phải có tên nhân viên ở định dạng là "Clinton Bill", các thao tác như vậy có thể được thiết kế ở cấp ánh xạ. Theo thuật ngữ cơ bản, những gì bạn làm với dữ liệu nguồn được xác định ở cấp ánh xạ.
Ánh xạ là đối tượng Informatica cơ bản với sự trợ giúp của chúng ta có thể xác định chi tiết chuyển đổi dữ liệu và đặc điểm đối tượng nguồn / đích. Ánh xạ giúp chúng tôi xác định chuyển đổi dữ liệu ở các cấp cột riêng lẻ cho mỗi hàng. Ngay cả trong một ánh xạ duy nhất, bạn có thể xử lý nhiều nguồn và mục tiêu.
Các thành phần của ánh xạ
Các thành phần cơ bản của ánh xạ là
- Bảng nguồn
- Các tham số và biến ánh xạ
- Đối tượng mục tiêu
- Ánh xạ các phép biến đổi
Có nhiều đối tượng khác nhau tạo thành một ánh xạ. Một ánh xạ có thể bao gồm các nguồn, mục tiêu, tham số ánh xạ và các biến, mapplet, các phép biến đổi khác nhau và các hàm do người dùng xác định .
- Nguồn ánh xạ : Nguồn ánh xạ là các đối tượng từ nơi bạn tìm nạp dữ liệu nguồn. Nó có thể là một bảng cơ sở dữ liệu, tệp phẳng, nguồn XML hoặc nguồn tệp COBOL
- Mục tiêu ánh xạ: Mục tiêu ánh xạ là các đối tượng đích của chúng tôi, nơi dữ liệu được xử lý cuối cùng được tải. Đích ánh xạ có thể là một bảng quan hệ của cơ sở dữ liệu, tệp phẳng hoặc tệp XML. Nguồn và mục tiêu là bắt buộc trong bất kỳ ánh xạ nào, loại của chúng có thể khác nhau
- Ánh xạ tham số và biến : Ánh xạ các tham số và biến giúp bạn tạo các đối tượng biến tạm thời sẽ giúp bạn xác định và lưu trữ các giá trị tạm thời trong khi xử lý dữ liệu ánh xạ. Các tham số và biến ánh xạ là các kiểu dữ liệu tùy chọn do người dùng xác định, có thể được tạo cho một ánh xạ và có thể được tham chiếu và cập nhật cho một yêu cầu cụ thể. Chúng ta sẽ tìm hiểu thêm về các tham số và biến ánh xạ trong phần này
- Mapplet : Chúng là các đối tượng bao gồm một tập hợp các chuyển đổi, nguồn hoặc các mục tiêu. Mapplet thường được tạo ra để sử dụng lại chức năng hiện có của một tập hợp các phép biến đổi. Nó có thể được sử dụng trong bất kỳ ánh xạ nào.
Bản đồ giai đoạn là gì?
Ánh xạ giai đoạn là một ánh xạ trong đó chúng ta tạo bản sao của bảng nguồn. Ví dụ: trong hệ thống sản xuất nếu bạn có bảng "nhân viên" thì bạn có thể tạo một bảng giống hệt "nhân viên_ sân khấu" trong lược đồ ETL.
Việc có một bảng giai đoạn cục bộ mang lại nhiều lợi thế khác nhau, chẳng hạn như thời gian ngừng sản xuất, sẽ không ảnh hưởng đến hệ thống ETL của bạn vì bạn có bảng "worker_stage" của riêng mình, thay vì tham chiếu đến bảng "nhân viên" sản xuất. Trong một hệ thống Sản xuất, có thể có các hoạt động và quy trình khác ảnh hưởng đến kết quả hoạt động. Tuy nhiên, khi bạn có bảng dàn sao, chỉ các quy trình ETL mới truy cập vào nó. Điều này mang lại lợi ích về hiệu suất.
Trong Sơ đồ giai đoạn,
- Bảng Nguồn và Bảng đích có cấu trúc giống hệt nhau
- Dữ liệu trong bảng đích là bản sao của dữ liệu bảng nguồn hoặc
- Dữ liệu trong bảng giai đoạn (đích) là một tập hợp con của dữ liệu nguồn.
Ví dụ: nếu bảng nguồn của bạn chứa thông tin chi tiết về nhân viên của deptno 10, 20, 30 và 40. Bảng dàn có thể là một bảng chỉ có bản ghi nhân viên của deptno 10 & 30.
Mục đích của việc tạo các bảng giai đoạn trong Kho dữ liệu là làm cho quá trình chuyển đổi dữ liệu hiệu quả bằng cách chỉ tìm nạp những dữ liệu có liên quan đến chúng tôi và cũng để giảm thiểu sự phụ thuộc của ETL / Kho dữ liệu từ hệ thống hoạt động thời gian thực.
Cách tạo bản đồ
Trong bài tập này, chúng ta sẽ tạo một ánh xạ giai đoạn, trong đó nguồn sẽ là "bảng emp" và đích sẽ là "emptgt".
Quy ước đặt tên - các tên ánh xạ được bắt đầu bằng 'm_', theo sau là tên bảng nguồn và bảng đích được phân tách bằng dấu gạch dưới.
Ví dụ - nếu bạn đang tải bảng emp_target từ bảng emp, thì tên ánh xạ có thể là 'm_emp_emp_target'.
Bước 1 - Khởi chạy Trình thiết kế bản đồ
- Mở Công cụ thiết kế Informatica
- Nhấp vào Biểu tượng trình thiết kế ánh xạ để khởi chạy Trình thiết kế ánh xạ
Bước 2 - Trong Trình thiết kế bản đồ
- Nhấp vào Trình đơn ánh xạ
- Chọn Tạo tùy chọn
Bước 3 - Nhập tên ánh xạ là 'm_emp_emp_target' và chọn Nút OK.
Ánh xạ sẽ được tạo và liệt kê trong thư mục ánh xạ.
Một ánh xạ ít nhất phải có một nguồn và một mục tiêu , bạn sẽ thêm các nguồn và mục tiêu vào ánh xạ.
Bước 4 - Trong bước này, chúng tôi sẽ,
- Chọn bảng nguồn "emp" trong thư mục nguồn.
- Kéo và thả bảng "emp" vào trình thiết kế ánh xạ.
Trong trình thiết kế ánh xạ, bảng nguồn đã nhập sẽ được hiển thị.
Lưu ý - Khi bạn nhập bất kỳ bảng quan hệ (cơ sở dữ liệu) nào trong ánh xạ, một đối tượng bổ sung của loại định tính nguồn cũng sẽ được tạo. Việc chuyển đổi định tính nguồn này là cần thiết và giúp dịch vụ tích hợp Informatica xác định bảng cơ sở dữ liệu nguồn và các thuộc tính của nó. Bất cứ khi nào bạn nhập một bảng nguồn, chuyển đổi định tính nguồn cũng sẽ được tạo. Bạn không bao giờ được xóa đối tượng định tính nguồn trong ánh xạ.
Bước 5 - Trong bước này, chúng tôi sẽ,
- Chọn bảng nguồn "emp_target" trong thư mục Mục tiêu.
- Kéo và thả bảng "emp_target" vào trình thiết kế ánh xạ
Trong trình thiết kế ánh xạ, "bảng mục tiêu" sẽ được nhập và hiển thị.
Để quản lý không gian xem, bạn có thể biểu tượng hóa các đối tượng này trong ánh xạ.
Bước 6 - Nhấp chuột phải vào bất kỳ đâu trong không gian làm việc trống của nhà thiết kế ánh xạ và chọn tùy chọn - Sắp xếp tất cả các biểu tượng.
Sau khi chọn tùy chọn "Sắp xếp tất cả các biểu tượng", không gian làm việc sẽ như thế này.
Bước 7 - Trong Informatica, Chúng tôi thiết kế với luồng từ trái sang phải. Vì vậy, các bảng nguồn nên ở bên trái và các bảng đích phải ở bên phải. Để sắp xếp các bảng trong không gian làm việc của chúng tôi, Chọn bảng "emp_target", sau đó kéo và thả nó vào bên phải của bảng emp.
Sau khi sắp xếp lại, không gian làm việc sẽ như thế này.
Lưu ý - Định kỳ sử dụng phím tắt "ctrl + s" để lưu các thay đổi đối với kho lưu trữ.
Bước 8 - Bây giờ bạn có bảng nguồn và bảng đích trong ánh xạ của mình, nhưng việc ánh xạ vẫn chưa hoàn tất. Bảng nguồn và bảng đích phải được liên kết để hoàn thành một ánh xạ.
Để liên kết nguồn và mục tiêu
Nhấp đúp vào bảng SQ_EMP và bảng EMP_TARGET để thay đổi chế độ xem của chúng từ biểu tượng sang đồ họa.
Bước 9 - Nhấp chuột phải vào ánh xạ không gian làm việc của nhà thiết kế và chọn "Tự động liên kết" theo tùy chọn tên.
Bước 10 - Để liên kết nguồn với bảng đích
- Chọn các cột trong bảng Nguồn.
- Kéo và thả các cột vào bảng mục tiêu.
Bảng Nguồn và Bảng đích sẽ được liên kết và các mũi tên kết nối sẽ xuất hiện từ nguồn đến bảng đích.
Lưu ý - Ở đây bạn đã liên kết tất cả các cột nguồn với cột bảng đích tương ứng. Nó có nghĩa là, đối với mỗi bản ghi nguồn được tải xuống, tất cả các cột của đích sẽ được tải. Nếu bạn muốn loại trừ bất kỳ cột cụ thể nào được tải, hãy nhấp vào liên kết cột đó và nhấn phím xóa khỏi bàn phím. Liên kết sẽ bị xóa và cột mục tiêu sẽ không được tải.
Bước 11 - Sử dụng phím tắt "ctrl + s" để lưu các thay đổi đối với ánh xạ của bạn. Trên cửa sổ đầu ra, bạn có thể thấy thông báo xác nhận / phân tích cú pháp ánh xạ. Nó xác nhận rằng ánh xạ của bạn là hợp lệ. Ngoài ra, sẽ có một dấu tích tạm thời màu xanh lá cây bên cạnh tên ánh xạ trong cây thư mục ánh xạ cho biết việc ánh xạ được thực hiện thành công.
Trong ánh xạ có thể có một yêu cầu, trong đó chúng ta cần chuyển biến cho ánh xạ hoặc có thể có một tình huống mà chúng ta cần tính toán các biến tạm thời và cần lưu trữ chúng cho lần chạy ánh xạ tiếp theo. Với những mục đích này, chúng tôi tạo các tham số và biến ánh xạ.
Tham số ánh xạ và biến
Giống như mọi ngôn ngữ lập trình khác, Informatica có cách xác định các tham số và biến riêng. Nhưng không giống như các ngôn ngữ lập trình khác, Informatica không phải là một ngôn ngữ dựa trên mã. Để tạo các tham số và biến trong Informatica, bạn phải tuân theo cú pháp và điều hướng được xác định trước.
Sự khác biệt giữa các tham số và biến -
Tham số ánh xạ |
Ánh xạ các biến |
Tham số ánh xạ là những kiểu dữ liệu mà giá trị của nó sau khi được gán sẽ không đổi trong suốt quá trình ánh xạ. Giống như nếu bạn đã tạo một tham số ánh xạ deptno = 20, thì giá trị 20 sẽ không đổi cho toàn bộ quá trình ánh xạ. Tham số ở bất cứ nơi nào nó sẽ được tham chiếu sẽ luôn trả về giá trị 20 cho trường hợp chạy ánh xạ đó. Đối với một trường hợp ánh xạ mới, giá trị tham số có thể được xác định lại. |
Các biến ánh xạ là các đối tượng có thể được tham chiếu trong suốt quá trình chạy ánh xạ (để truy cập các giá trị của chúng) và các giá trị của chúng có thể được gán lại. Ví dụ, một biến ánh xạ của total_salary có thể được sử dụng trong một ánh xạ và giá trị của nó có thể được cập nhật dựa trên tiền lương. |
Các tham số và biến ánh xạ chỉ dành riêng cho một ánh xạ. Chúng không thể được tham chiếu trong một ánh xạ khác.
Cách tạo thông số ánh xạ
Khi bạn tạo một tham số ánh xạ, trong quá trình thực thi ánh xạ, dịch vụ Tích hợp sẽ tìm kiếm giá trị được chỉ định của nó. Giá trị này có thể được chỉ định cho các vị trí sau đây.
- Tệp thông số bên trong
- Trong nhiệm vụ biến trước phiên
- Giá trị ban đầu trong kho
- Giá trị mặc định được chỉ định trong quá trình tạo biến
Bước 1 - Để tạo thông số ánh xạ - Trong trình thiết kế ánh xạ,
- Chọn menu ánh xạ
- Chọn tham số và menu biến
Bước 2 - Trong màn hình tiếp theo,
- Nhấp vào menu thêm biến mới
- Từ trình đơn thả xuống, hãy chọn loại làm tham số
- Nhập tên thông số là $$ Deptno
- Nhập giá trị ban đầu là 10
- Chọn nút OK
Bây giờ, bạn đã tạo một tham số ánh xạ deptno, với giá trị được gán ban đầu là 10 và tham số này có thể được tham chiếu bên trong ánh xạ.
Cách tạo biến ánh xạ
Bước 1 - Trong trình thiết kế ánh xạ
- Chọn menu ánh xạ
- Chọn tham số và menu biến
Bước 2 - Trên màn hình tiếp theo
- Nhấp vào menu thêm biến mới
- Từ trình đơn thả xuống, hãy chọn loại là biến
- Nhập tên biến là $$ TotalSalary
- Chọn DataType dưới dạng thập phân
- Nhập giá trị ban đầu là 0
- Chọn nút OK
Điều này sẽ tạo ra một biến ánh xạ.
Lưu ý - tham số ánh xạ và tên biến luôn bắt đầu bằng $$.
Tóm lược
Ánh xạ rất quan trọng trong Informatica để khớp dữ liệu nguồn với đích theo yêu cầu của dự án. Chúng ta đã thảo luận về ánh xạ giai đoạn và khái niệm về ánh xạ biến và tham số.