50 câu hỏi phỏng vấn hàng đầu về Teradata & Câu trả lời

Anonim

tải PDF

1) Bạn định nghĩa Teradata như thế nào? Nêu một số đặc điểm cơ bản của giống nhau.

Teradata về cơ bản là một RDMS được sử dụng để điều khiển Datamart, Datawarehouse, OLAP, OLTP, cũng như DSS Appliances của công ty. Dưới đây là một số đặc điểm cơ bản của Teradata.

  • Có khả năng chạy trên các nút đơn, cũng như nhiều nút.
  • Tính song song được tích hợp sẵn trong hệ thống.
  • Rất tương thích với các tiêu chuẩn của ANSI.
  • Có xu hướng hoạt động giống như một máy chủ.
  • Nó là một Hệ thống mở về cơ bản thực thi cho UNIX MR-RAS, Suse Linux ETC, WIN2K, v.v.

2) Các tính năng mới được phát triển của Teradata là gì?

Một số tính năng mới được phát triển của Teradata là: -

  • Phân tích thời gian tự động
  • Mở rộng khả năng nén cho phép nén dữ liệu linh hoạt gấp 20 lần dữ liệu so với phiên bản trước.
  • Sự đổi mới liên quan đến khách hàng như quan điểm tetradata.

3) Làm nổi bật một vài thành phần quan trọng của Teradata.

Một số thành phần quan trọng của Teradata là: -

  • Bynet
  • Bộ xử lý mô-đun truy cập (AMP)
  • Công cụ phân tích cú pháp (PE)
  • Đĩa ảo (vDisk)
  • Hệ thống lưu trữ ảo (VSS)

4) Đề cập đến thủ tục mà qua đó, chúng ta có thể chạy các công việc Teradata trong môi trường UNIX.

Tất cả những gì bạn phải làm là thực hiện thực thi trong UNIX theo cách như đã đề cập bên dưới.

$ Sh> BTEQ <[Đường dẫn tập lệnh]> [Đường dẫn tệp nhật ký]

hoặc là

$ Sh> BTEQ <[Đường dẫn tập lệnh] TEE [Đường dẫn tệp nhật ký]

5) Trong Teradata, chúng ta tạo trình tự như thế nào?

Trong Teradata, chúng tôi Tạo trình tự bằng cách sử dụng Cột nhận dạng

6) Trong thời gian Hiển thị, trình tự do Teradata tạo ra như thế nào?

Tất cả những gì bạn phải làm là sử dụng CSUM.

7) Một tải trọng nhất định đang được đặt lên bàn và điều đó cũng vậy, mỗi giờ. Lưu lượng truy cập vào buổi sáng tương đối thấp và ban đêm là rất cao. Theo tình huống này, tiện ích nào được khuyên dùng nhất và tiện ích đó sẽ được tải như thế nào?

Tiện ích gợi ý nhất ở đây phải là Tpump. Bằng cách sử dụng kích thước gói giảm hoặc tăng, lưu lượng có thể được xử lý dễ dàng.

8) Nếu Fast Load Script không thành công và chỉ có các bảng lỗi được cung cấp cho bạn, thì bạn sẽ khởi động lại như thế nào?

Về cơ bản có hai cách để khởi động lại trong trường hợp này.

  • Làm cho tệp cũ để chạy - Đảm bảo rằng bạn không bỏ hoàn toàn các bảng lỗi. Thay vào đó, hãy cố gắng sửa các lỗi có trong tập lệnh hoặc tệp và sau đó thực thi lại.
  • Chạy một tệp mới - Trong quá trình này, tập lệnh được thực thi đơn giản bằng cách sử dụng các câu lệnh tải kết thúc và bắt đầu. Điều này sẽ giúp loại bỏ khóa đã được đặt trên bảng đích và cũng có thể xóa bản ghi đã cho khỏi bảng nhật ký nhanh. Sau khi hoàn tất, bạn có thể chạy lại toàn bộ tập lệnh một lần nữa.

9) Đề cập đến một số công cụ ETL thuộc Teradata.

Một số công cụ ETL thường được sử dụng trong Teradata là DataStage, Informatica, SSIS, v.v.

10) Làm nổi bật một số lợi thế mà các công cụ ETL có so với TD.

Một số lợi thế mà các công cụ ETL có so với TD là: -

  • Nhiều điểm đến không đồng nhất, cũng như các nguồn có thể được vận hành.
  • Quá trình gỡ lỗi dễ dàng hơn nhiều với sự trợ giúp của các công cụ ETL do hỗ trợ GUI chính thức.
  • Các thành phần của công cụ ETL có thể được tái sử dụng dễ dàng và kết quả là nếu có bản cập nhật cho máy chủ chính, thì tất cả các ứng dụng tương ứng được kết nối với máy chủ sẽ được cập nhật tự động.
  • De-pivoting và xoay vòng có thể dễ dàng thực hiện bằng cách sử dụng các công cụ ETL.

11) Ý nghĩa của Caching trong Teradata là gì?

Bộ nhớ đệm được coi là một lợi thế bổ sung của việc sử dụng Teradata vì nó chủ yếu hoạt động với nguồn giữ nguyên thứ tự tức là không thay đổi thường xuyên. Đôi khi, Cache thường được chia sẻ giữa các ứng dụng.

12) Làm cách nào để chúng tôi có thể kiểm tra phiên bản Teradata mà chúng tôi đang sử dụng hiện tại?

Chỉ cần đưa ra lệnh .SHOW VERSION.

13) Đưa ra lý do chính đáng tại sao Đa tải hỗ trợ NUSI thay vì USI.

Hàng của bảng phụ chỉ mục xảy ra trên cùng một Amp theo cùng một cách với hàng dữ liệu trong NUSI. Do đó, mỗi Amp được vận hành riêng biệt và song song.

14) Hệ thống máy khách MLOAD được khởi động lại như thế nào sau khi thực thi?

Tập lệnh phải được gửi theo cách thủ công để có thể dễ dàng tải dữ liệu từ trạm kiểm soát đến sau cùng.

15) Máy chủ MLOAD Teradata được khởi động lại như thế nào sau khi thực thi?

Quá trình này về cơ bản được thực hiện từ trạm kiểm soát cuối cùng đã biết và khi dữ liệu đã được thực hiện sau khi thực thi tập lệnh MLOAD, máy chủ sẽ được khởi động lại.

16) Nút có nghĩa là gì?

Về cơ bản, một nút được gọi là một tập hợp các thành phần của phần cứng và phần mềm. Thông thường một máy chủ được gọi là một nút.

17) Giả sử có một tệp bao gồm 100 bản ghi trong đó chúng ta cần bỏ qua 20 bản ghi đầu tiên và 20 bản ghi cuối cùng. Đoạn mã sẽ là gì?

Chúng ta cần sử dụng BTEQ Utility để thực hiện tác vụ này. Bỏ qua 20, cũng như Lặp lại 60 sẽ được sử dụng trong tập lệnh.

18) Giải thích PDE.

PDE về cơ bản là viết tắt của Parallel Data Extension. PDE về cơ bản là một lớp giao diện của phần mềm hiện diện phía trên hệ thống vận hành và tạo cơ hội cho cơ sở dữ liệu hoạt động trong một môi trường song song.

19) TPD là gì?

TPD về cơ bản là viết tắt của Cơ sở dữ liệu song song đáng tin cậy và về cơ bản nó hoạt động theo PDE. Teradata là một cơ sở dữ liệu chủ yếu hoạt động theo PDE. Đây là lý do tại sao Teradata thường được gọi là cơ sở dữ liệu song song đáng tin cậy hoặc song song thuần túy.

20) Trình điều khiển kênh có nghĩa là gì?

Trình điều khiển kênh là phần mềm hoạt động như một phương tiện giao tiếp giữa các PE và tất cả các ứng dụng đang chạy trên các kênh được gắn với máy khách.

21) Cổng Teradata có nghĩa là gì?

Cũng giống như trình điều khiển kênh, Teradata Gateway hoạt động như một phương tiện giao tiếp giữa Parse Engine và các ứng dụng được gắn với các máy khách mạng. Chỉ một Cổng được gán cho mỗi nút.

22) Đĩa ảo nghĩa là gì?

Virtual Disk về cơ bản là một tập hợp của toàn bộ một loạt các xi lanh là các đĩa vật lý. Nó đôi khi được gọi là Mảng đĩa.

23) Giải thích ý nghĩa của Amp?

Amp về cơ bản là viết tắt của Access Module Processor và là một bộ xử lý hoạt động ảo và về cơ bản được sử dụng để quản lý một phần cơ sở dữ liệu. Phần cụ thể của cơ sở dữ liệu này không thể được chia sẻ bởi bất kỳ Amp nào khác. Do đó, hình thức kiến ​​trúc này thường được gọi là kiến ​​trúc không chia sẻ.

24) Amp chứa những gì và tất cả các hoạt động mà nó thực hiện là gì?

Về cơ bản, Amp bao gồm một Hệ thống con Trình quản lý Cơ sở dữ liệu và có khả năng thực hiện các hoạt động được đề cập bên dưới.

  • Thực hiện DML
  • Thực hiện DDL
  • Triển khai Tổng hợp và Tham gia.
  • Phát hành và áp dụng khóa, v.v.

25) Công cụ phân tích cú pháp có nghĩa là gì?

PE là một loại Vproc. Chức năng chính của nó là nhận các yêu cầu SQL và gửi phản hồi trong SQL. Nó bao gồm một loạt các thành phần phần mềm được sử dụng để chia SQL thành các bước khác nhau và sau đó gửi các bước đó tới AMP.

26) Bạn có nghĩa là gì khi phân tích cú pháp?

Phân tích cú pháp là một quá trình liên quan đến việc phân tích các ký hiệu của chuỗi bằng ngôn ngữ máy tính hoặc ngôn ngữ tự nhiên.

27) Chức năng của Trình phân tích cú pháp là gì?

Một trình phân tích cú pháp: -

  • Kiểm tra lỗi ngữ nghĩa
  • Kiểm tra lỗi cú pháp
  • Kiểm tra sự tồn tại của đối tượng

28) Người điều phối có nghĩa là gì?

Người điều phối nhận toàn bộ bộ sưu tập các yêu cầu và sau đó giữ chúng trong một hàng đợi. Cùng một hàng đợi đang được lưu giữ trong suốt quá trình để cung cấp nhiều nhóm phản hồi.

29) PE có khả năng xử lý bao nhiêu phiên MAX tại một thời điểm cụ thể?

Chuyên gia sản xuất có thể xử lý tổng cộng 120 phiên tại một thời điểm cụ thể.

30) Giải thích BYNET.

BYNET về cơ bản đóng vai trò như một phương tiện giao tiếp giữa các thành phần. Nó chịu trách nhiệm chính trong việc gửi tin nhắn và cũng chịu trách nhiệm thực hiện các thao tác hợp nhất, cũng như sắp xếp.

31) Clique có nghĩa là gì?

Clique về cơ bản được biết đến là một loại nút được chia sẻ giữa các ổ đĩa thông thường. Sự hiện diện của Clique là vô cùng quan trọng vì nó giúp tránh các lỗi nút.

32) Điều gì xảy ra khi một nút bị sập?

Bất cứ khi nào có sự sụt giảm về mức hiệu suất của một nút, tất cả các Vprocs tương ứng sẽ ngay lập tức di chuyển đến một nút mới từ nút lỗi để lấy lại tất cả dữ liệu từ các ổ đĩa chung.

33) Liệt kê tất cả các dạng KHÓA có sẵn trong Teradata.

Về cơ bản có bốn loại KHÓA nằm dưới Teradata. Đó là: -

  • Đọc khóa
  • Khóa truy cập
  • Khóa độc quyền
  • Viết khóa

34) Mức cụ thể được chỉ định mà tại đó LOCK có thể được áp dụng trong Teradata là gì?

  • Mức bảng - Tất cả các hàng hiện diện bên trong bảng chắc chắn sẽ bị khóa.
  • Khóa mức cơ sở dữ liệu - Tất cả các đối tượng hiện diện bên trong cơ sở dữ liệu sẽ bị khóa.
  • Khóa cấp độ băm hàng - Chỉ những hàng sẽ bị khóa tương ứng với hàng cụ thể.

35) Trong Chỉ mục chính, điểm số của các AMP tham gia tích cực là bao nhiêu?

Chỉ một AMP tích cực tham gia vào Chỉ mục chính.

36) Trong Teradata, ý nghĩa của lệnh UPSERT là gì?

UPSERT về cơ bản là viết tắt của Update Else Insert. Tùy chọn này chỉ có ở Teradata.

37) Làm nổi bật những ưu điểm của PPI (Chỉ số chính phân vùng).

PPI về cơ bản được sử dụng cho các mục đích lưu trữ dữ liệu dựa trên Phạm vi hoặc dựa trên Danh mục. Khi nói đến truy vấn Phạm vi, không cần sử dụng tính năng quét Toàn bảng vì nó di chuyển ngay đến phân vùng do đó bỏ qua tất cả các phân vùng khác.

38) Đưa ra các kích thước của SMALLINT, BYTEINT và INTEGER.

SMALLINT - 2 Byte - 16 Bit -> -32768 đến 32767

BYTEINT - 1 Byte - 8 Bit -> -128 đến 127

INTEGER - 4 byte - 32 bit -> -2,147,483,648 đến 2,147,483,647

39) Kế hoạch Chi phí Ít nhất có nghĩa là gì?

Kế hoạch Chi phí Ít nhất về cơ bản thực hiện trong thời gian ngắn hơn trên con đường ngắn nhất.

40) Làm nổi bật những điểm khác biệt giữa cơ sở dữ liệu và người dùng trong Teradata.

  • Cơ sở dữ liệu về cơ bản là thụ động, trong khi người dùng đang hoạt động.
  • Cơ sở dữ liệu chủ yếu lưu trữ tất cả các đối tượng của cơ sở dữ liệu, trong khi người dùng có thể lưu trữ bất kỳ đối tượng nào cho dù đó là macro, bảng, dạng xem, v.v.
  • Cơ sở dữ liệu không có mật khẩu trong khi người dùng phải nhập mật khẩu.

41) Làm nổi bật sự khác biệt giữa Khóa chính và Chỉ mục chính.

  • Chỉ mục chính là khá bắt buộc, trong khi Khóa chính là tùy chọn.
  • Chỉ mục chính có giới hạn là 64 bảng / cột, trong khi Khoá chính không có bất kỳ giới hạn nào.
  • Chỉ mục chính cho phép trùng lặp và rỗng, trong khi Khóa chính thì không.
  • Chỉ mục chính là một cơ chế vật lý, trong khi Khoá chính hoàn toàn là cơ chế logic.

42) Giải thích cách sử dụng không gian cuộn.

Spool space trong Teradata về cơ bản được sử dụng để chạy các truy vấn. Trong tổng số không gian có sẵn trong Teradata, 20% không gian về cơ bản được phân bổ cho không gian ống chỉ.

43) Làm nổi bật sự cần thiết của Điều chỉnh Hiệu suất.

Điều chỉnh hiệu suất trong Teradata về cơ bản được thực hiện để xác định tất cả các nút thắt cổ chai và sau đó giải quyết chúng.

44) Nhận xét xem nút cổ chai có phải là lỗi hay không.

Về mặt kỹ thuật, nút cổ chai không phải là một dạng lỗi, nhưng chắc chắn nó gây ra độ trễ nhất định trong hệ thống.

45) Làm thế nào có thể xác định được các nút thắt cổ chai?

Về cơ bản có bốn cách để xác định điểm nghẽn. Đó là: -

  • Giải thích trực quan về Teradata
  • Giải thích Công cụ sửa đổi yêu cầu
  • Người quản lý Teradata
  • Giám sát hiệu suất

46) Kế hoạch Chi phí Cao nhất có nghĩa là gì?

Theo Kế hoạch chi phí cao nhất, thời gian thực hiện quy trình này nhiều hơn và phải có con đường dài nhất hiện có.

47) Đánh dấu tất cả các chế độ hiện có trong Mức độ tin cậy.

Thấp, Không, Cao và Tham gia là bốn chế độ có trong Mức độ tin cậy.

48) Đặt tên cho năm giai đoạn trong Tiện ích đa tải.

Giai đoạn Sơ bộ, Giai đoạn DML, Giai đoạn Thu thập dữ liệu, Giai đoạn Ứng dụng và Giai đoạn Kết thúc.

49) Làm nổi bật những hạn chế của Tiện ích TPUMP.

Sau đây là những hạn chế của tiện ích TPUMP: -

  • Chúng ta không thể sử dụng câu lệnh SELECT.
  • Các tệp dữ liệu không thể được nối với nhau.
  • Toán tử tổng hợp và lũy thừa không được hỗ trợ.
  • Không thể hỗ trợ các hàm số học.

50) Trong BTEQ, các tham số chế độ phiên được thiết lập như thế nào?

.set giao dịch phiên BTET -> Chế độ giao dịch Teradata

.set phiên giao dịch ANSI -> Chế độ ANSI

Các lệnh này sẽ chỉ hoạt động khi chúng được nhập trước khi đăng nhập vào phiên.