Trong ETL / Data Warehouse, bạn sẽ gặp các nguồn và mục tiêu khác nhau.
Nguồn trong ETL là một thực thể mà từ đó bạn kéo các bản ghi và sau đó bạn lưu trữ các bản ghi này trong các bảng tạm thời (bảng dàn) hoặc bộ đệm chuyển đổi Informatica. Trên cơ sở lập bản đồ tài liệu thiết kế / yêu cầu kinh doanh, bạn thực hiện thay đổi trong các bản ghi dữ liệu này (chuyển đổi dữ liệu) và sau đó bạn tải dữ liệu đã chuyển đổi trong cấu trúc bảng khác, được gọi là bảng đích.
Trong mọi ánh xạ Informatica, sẽ luôn có một nguồn và một mục tiêu. Để quản lý các nguồn và mục tiêu khác nhau trong Informatica, bạn phải sử dụng trình phân tích nguồn và trình thiết kế mục tiêu. Các công cụ này được tích hợp vào công cụ thiết kế Powercenter và có thể được khởi chạy từ chính nó.
Với sự trợ giúp của Trình phân tích nguồn, bạn có thể tạo hoặc nhập các loại nguồn khác nhau trong Informatica. Tương tự bằng cách sử dụng trình thiết kế mục tiêu, bạn có thể tạo hoặc nhập các loại mục tiêu khác nhau. Informatica cung cấp cho bạn tính năng tạo nguồn / đích từ đầu bằng cách thiết kế cấu trúc của nó hoặc bạn có thể tạo nguồn / đích bằng cách nhập các định nghĩa. Khi bạn Nhập Nguồn từ cơ sở dữ liệu, siêu dữ liệu sau sẽ được nhập.
- Tên nguồn (Bảng)
- Vị trí cơ sở dữ liệu
- Tên các cột
- Cột Kiểu dữ liệu
- Ràng buộc
Bạn cũng có thể xác định các mối quan hệ chính trong các bảng, mối quan hệ này chỉ áp dụng ở cấp Informatica và được lưu trữ trong kho lưu trữ.
Nguồn hoặc đích được tạo / nhập trong Informatica có thể được sử dụng lại bất kỳ lúc nào trong các ánh xạ khác nhau. Mọi ánh xạ phải có ít nhất mục tiêu có thể tải được. Nếu không, ánh xạ sẽ không hợp lệ.
Lưu ý - Khi chúng tôi tạo nguồn / đích trong trình phân tích nguồn / trình thiết kế đích, cấu trúc chỉ được tạo trong Informatica. Ở cấp độ cơ sở dữ liệu, không có đối tượng nào được tạo. Vì vậy, bạn phải tạo các đối tượng Cơ sở dữ liệu có cùng cấu trúc như bạn đã tạo trong Informatica.
Bạn có thể nhập loại nguồn sau bằng cách sử dụng trình phân tích nguồn
- Bảng quan hệ (bảng cơ sở dữ liệu), dạng xem và từ đồng nghĩa
- Các tập tin phẳng
- Tệp cobol
- Tệp XML
Mẹo về hiệu suất - Để cải thiện hiệu suất của bảng Nguồn quan hệ, hãy sử dụng các chỉ mục trên bảng cơ sở dữ liệu nguồn. Trên mục tiêu, các bảng vô hiệu hóa hoặc loại bỏ các ràng buộc và chỉ mục cho hiệu suất.
Trong Hướng dẫn này - bạn sẽ học
- Cách mở Trình phân tích mã nguồn
- Cách nhập bảng Nguồn trong Trình phân tích nguồn
- Cách mở Target Designer và nhập target trong target designer
- Cách tạo thư mục trong Informatica
Cách mở Trình phân tích mã nguồn
Bước 1 - Mở công cụ thiết kế Informatica PowerCenter
Bước 2 - Trong màn hình tiếp theo
- Nhấp đúp vào kho lưu trữ mà bạn muốn kết nối
- Điền tên đăng nhập
- Nhập mật khẩu
- Bấm vào nút Kết nối
Sau khi đăng nhập thành công, các thư mục của người dùng sẽ được liệt kê dưới tên kho
Ghi chú -
- Nếu đăng nhập không thành công, hãy kiểm tra xem người dùng có đặc quyền kết nối với kho lưu trữ hay không
- Nếu không có thư mục nào hiển thị dưới tên kho lưu trữ, hãy kiểm tra xem thư mục đó có được tạo hay không.
- Nếu một thư mục được tạo gần đây thì hãy ngắt kết nối khỏi kho lưu trữ và kết nối lại.
Bước 3 - Trong bước tiếp theo
- Nhấp chuột phải vào thư mục
- Chọn tùy chọn mở
Khi một thư mục được mở, các thư mục con của thư mục đó sẽ được liệt kê.
Bước 4 - Nhấp vào menu Bộ phân tích nguồn, như trong hình.
Cách nhập bảng Nguồn trong Trình phân tích nguồn
Bước 1 - Trong trình phân tích nguồn
- Nhấp vào tab "nguồn" từ menu chính
- Chọn tùy chọn nhập từ cơ sở dữ liệu, sau khi hộp Kết nối ODBC này sẽ mở ra.
Bước 2 - Bây giờ chúng tôi sẽ tạo kết nối ODBC (Nếu bạn đã có kết nối ODBC, hãy chuyển sang bước 3)
- Bấm vào nút bên cạnh Nguồn dữ liệu ODBC.
- Trên trang tiếp theo, chọn tab DSN của người dùng và nhấp vào nút Thêm.
DSN (Tên nguồn dữ liệu) về cơ bản là một cấu trúc dữ liệu và nó chứa thông tin về một chi tiết cụ thể (loại cơ sở dữ liệu, vị trí, chi tiết người dùng, v.v.). Thông tin này được yêu cầu bởi trình điều khiển ODBC để nó có thể kết nối với cơ sở dữ liệu đó.
- Khi bạn nhấp vào nút thêm, bạn sẽ thấy danh sách trình điều khiển cho các cơ sở dữ liệu khác nhau (Oracle, SQL Server, Sybase, Microsoft Access, Excel, v.v.) Trình điều khiển bạn chọn phụ thuộc vào cơ sở dữ liệu bạn muốn kết nối. Chọn trình điều khiển cho nguồn dữ liệu. Ở đây trong guru99, bạn sẽ sử dụng các bảng cơ sở dữ liệu oracle. Chọn trình điều khiển giao thức dây Oracle.
- Trên trang tiếp theo, chọn tab chung và nhập chi tiết cơ sở dữ liệu. Sau đó bấm vào kiểm tra kết nối.
Lưu ý - Chi tiết cơ sở dữ liệu dành riêng cho cài đặt của bạn tùy thuộc vào tên máy chủ, cổng và SID bạn đã chọn trong quá trình cài đặt cơ sở dữ liệu. Bạn có thể lấy thông tin chi tiết này bằng cách mở tệp tnsnames.ora nằm trong thư mục cài đặt oracle của bạn.
- Sau khi bạn thực hiện Kết nối thử nghiệm, hãy nhập tên người dùng, mật khẩu cơ sở dữ liệu và sau đó chọn nút "OK"
- Nếu kết nối thành công, nó sẽ hiện ra một hộp thông báo.
- Chọn OK để kiểm tra cửa sổ kết nối và cửa sổ thiết lập Trình điều khiển ODBC. Nguồn dữ liệu ODBC đã tạo sẽ được thêm vào nguồn dữ liệu người dùng. Bây giờ chúng ta được thiết lập với nguồn Dữ liệu ODBC.
Bước 3 - Trong guru99, bạn sẽ sử dụng các bảng lược đồ Scott / Tiger của oracle. Nếu bạn không có những bảng này trong cơ sở dữ liệu, hãy tạo những bảng đó bằng cách sử dụng tập lệnh này.
Tải xuống Tệp Scott.sql ở trên
Bước 4 - Trong cửa sổ nhập bảng.
- Chọn nguồn dữ liệu ODBC cho cơ sở dữ liệu oracle.
- Nhập tên người dùng cơ sở dữ liệu
- Nhập mật khẩu cơ sở dữ liệu
- Bấm vào nút kết nối / kết nối lại. Điều này sẽ hiển thị các bảng cho người dùng cơ sở dữ liệu.
- Mở rộng thư mục cây dưới bảng và chọn bảng EMP
- Chọn nút OK.
Bước 5 - Bảng sẽ được nhập vào Trình phân tích nguồn Informatica. Sử dụng các phím "ctrl + s" để lưu các thay đổi vào kho lưu trữ.
Tương tự, bạn có thể nhập bất kỳ bảng cơ sở dữ liệu nào khác trong trình phân tích nguồn.
Cách nhập mục tiêu trong trình thiết kế mục tiêu
Trong hướng dẫn này, bạn sẽ tạo bảng đích emp_target, bảng này sẽ có cấu trúc giống hệt bảng EMP nguồn. Để nhập bảng mục tiêu, bảng mục tiêu phải có trong cơ sở dữ liệu. Để tạo bảng mục tiêu, hãy sử dụng tập lệnh dưới đây. Các loại mục tiêu có sẵn trong Informatica là tệp quan hệ, XML và tệp phẳng.
Tải xuống Tệp emp_target.sql ở trên
Lưu ý - ở đây trong hướng dẫn này, cả bảng nguồn và bảng đích đều có trong cùng một lược đồ cơ sở dữ liệu (guru99). Tuy nhiên, bạn cũng có thể tạo mục tiêu trong một lược đồ khác.
Bước 1 - Trong Informatica Designer, nhấp vào biểu tượng nhà thiết kế mục tiêu để khởi chạy mục tiêu, nhà thiết kế.
Bước 2- Trong bước tiếp theo
- Chọn tùy chọn "Mục tiêu" từ menu chính
- Chọn "nhập" từ tùy chọn cơ sở dữ liệu
Bước 3 - Trong cửa sổ bảng nhập.
- Chọn nguồn dữ liệu ODBC cho cơ sở dữ liệu oracle.
- Nhập tên người dùng cơ sở dữ liệu
- Nhập mật khẩu cơ sở dữ liệu
- Bấm vào nút kết nối / kết nối lại. Điều này sẽ hiển thị các bảng cho người dùng cơ sở dữ liệu.
- Mở rộng cây dưới thư mục bảng và chọn bảng EMP_TARGET
- Chọn nút OK
Điều này sẽ nhập mục tiêu trong Target Designer của Informatica Powercenter. Sử dụng phím "ctrl + s" để lưu các thay đổi.
Trong hướng dẫn này, bạn đã nhập các nguồn và mục tiêu. Bây giờ, bạn đã sẵn sàng để tạo ánh xạ đầu tiên của mình.
Cách tạo thư mục trong Informatica
Các thư mục Informatica là vùng chứa logic, giữ các đối tượng mà bạn tạo trong trình thiết kế Informatica / trình quản lý quy trình làm việc (ánh xạ, mapplet, nguồn, mục tiêu, v.v.)
Để tạo thư mục
Bước 1 - Mở Trình quản lý Kho lưu trữ
Lưu ý - Nếu Informatica Designer đã được mở, thì có thể mở trình quản lý kho lưu trữ bằng các phím tắt có sẵn trong hộp công cụ.
Thao tác này sẽ mở Trình quản lý kho lưu trữ Informatica trong một cửa sổ riêng biệt.
Bước 2 - Làm theo các bước sau
- Nhấp vào menu thư mục
- Chọn tùy chọn Tạo
Bước 3 - Trong bước tiếp theo
- Nhập tên thư mục mong muốn
- Chọn ok
Thao tác này sẽ tạo một thư mục mới và xuất hiện thông báo "Thư mục đã được tạo thành công."
Thư mục mới tạo sẽ được liệt kê trong kho tương ứng.
Điều này hoàn thành hướng dẫn. Hẹn gặp lại các bạn trong những bài tiếp theo!