40 câu hỏi và câu trả lời phỏng vấn ElasticSearch hàng đầu

Anonim

Dưới đây là các câu hỏi phỏng vấn tìm kiếm Elastic dành cho các ứng viên mới và có kinh nghiệm.

1) Elasticsearch là gì?

Elasticsearch là một cơ sở dữ liệu NoSQL. Nó dựa trên công cụ tìm kiếm Lucene và nó được xây dựng với RESTful APIS. Nó cung cấp triển khai đơn giản, độ tin cậy tối đa và quản lý dễ dàng. Nó cũng cung cấp các truy vấn nâng cao để thực hiện phân tích chi tiết và lưu trữ tất cả dữ liệu một cách tập trung. Nó giúp thực hiện tìm kiếm nhanh các tài liệu.

2) Các tính năng quan trọng của Elasticsearch là gì?

Dưới đây là các tính năng quan trọng của Elasticsearch:

  • Một máy chủ tìm kiếm mã nguồn mở được viết bằng Java.
  • Được sử dụng để lập chỉ mục bất kỳ loại dữ liệu không đồng nhất nào
  • Có giao diện web REST API với đầu ra JSON
  • Tìm kiếm toàn văn bản
  • Tìm kiếm gần thời gian thực (NRT)
  • Kho tài liệu JSON được chia nhỏ, có thể tìm kiếm được sao chép.
  • Kho tài liệu phân tán dựa trên REST & JSON không có giản đồ
  • Hỗ trợ đa ngôn ngữ và vị trí địa lý

3) Cluster là gì?

Cụm là một tập hợp các nút cùng nhau lưu giữ dữ liệu và cung cấp khả năng lập chỉ mục và tìm kiếm được kết hợp.

4) Giải thích Chỉ số

Một nút là một đối tượng tìm kiếm đàn hồi. Nó được tạo khi một phiên bản tìm kiếm đàn hồi bắt đầu.

5) Tài liệu trong Tìm kiếm đàn hồi là gì?

Trong tìm kiếm Elastic, tài liệu là một đơn vị thông tin cơ bản có thể được lập chỉ mục. Nó được thể hiện bằng cặp JSON (key: value). '{"người dùng": "nullcon"}'. Mỗi Tài liệu được liên kết với một loại và một id duy nhất.

6) Xác định đoạn thuật ngữ

Mọi chỉ mục có thể được chia thành nhiều phân đoạn để có thể phân phối dữ liệu. Phân đoạn là phần nguyên tử của chỉ mục, có thể được phân phối trên cụm nếu bạn muốn thêm nhiều nút hơn.

7) Những lợi thế quan trọng của Tìm kiếm đàn hồi là gì?

Dưới đây là những ưu điểm quan trọng của Elasticsearch:

  • Lưu trữ dữ liệu ít giản đồ và cũng tạo một lược đồ cho dữ liệu của bạn.
  • Thao tác bản ghi dữ liệu của bạn theo từng bản ghi với sự trợ giúp của API đa tài liệu
  • Thực hiện lọc và truy vấn dữ liệu của bạn để có thông tin chi tiết
  • Dựa trên Apache Lucene và cung cấp API RESTful
  • Nó cung cấp khả năng mở rộng theo chiều ngang, độ tin cậy và khả năng đa đối tượng để sử dụng lập chỉ mục theo thời gian thực.
  • Giúp bạn chia tỷ lệ theo chiều dọc và chiều ngang

8) Ngăn xếp ELK là gì?

ELK Stack là tập hợp ba sản phẩm mã nguồn mở - Elasticsearch, Logstash và Kibana. Tất cả chúng đều được phát triển, quản lý và duy trì bởi công ty Elastic.

  • E là viết tắt của ElasticSearch : Nó được sử dụng để lưu trữ các bản ghi.
  • L là viết tắt của LogStash: Nó được sử dụng cho cả việc vận chuyển cũng như xử lý và lưu trữ các bản ghi.
  • K là viết tắt của Kibana: Nó là một công cụ trực quan hóa (một giao diện web) được lưu trữ thông qua Nginx hoặc Apache.

9) Giải thích kiến ​​trúc ngăn xếp ELK

ELK Stack được thiết kế để cho phép người dùng truy cập dữ liệu từ bất kỳ nguồn nào, ở bất kỳ định dạng nào và tìm kiếm, phân tích và trực quan hóa dữ liệu đó trong thời gian thực.

  • Nhật ký: Nhật ký máy chủ cần được phân tích được xác định
  • Logstash: Thu thập dữ liệu nhật ký và sự kiện. Nó thậm chí còn phân tích cú pháp và chuyển đổi dữ liệu.
  • ElasticSearch: Dữ liệu được chuyển đổi từ Logstash isStore, Search và được lập chỉ mục.
  • Kibana: Kibana sử dụng Elasticsearch DB để Khám phá, Hình ảnh hóa và Chia sẻ

10) Lý do sử dụng ngăn xếp ELK là gì?

Đây là những lý do để sử dụng ngăn xếp ELK:

  • ELK hoạt động tốt nhất khi nhật ký từ các Ứng dụng khác nhau của một doanh nghiệp hội tụ thành một phiên bản ELK duy nhất
  • Nó cung cấp thông tin chi tiết đáng kinh ngạc cho trường hợp duy nhất này và cũng loại bỏ sự cần thiết phải đăng nhập vào hàng trăm nguồn dữ liệu nhật ký khác nhau.
  • Cài đặt tại chỗ nhanh chóng
  • Dễ dàng triển khai Cân theo chiều dọc và chiều ngang
  • Elastic cung cấp một loạt các ứng dụng khách ngôn ngữ, bao gồm cả Ruby. Con trăn. PHP, Perl, .NET, Java và JavaScript, v.v.
  • Sự sẵn có của các thư viện cho các ngôn ngữ lập trình và kịch bản khác nhau

11) Giải thích Tokenizer trong ElasticSearch

Phân tích Tokenizer các trường giá trị của tài liệu vào một luồng. Chỉ mục đảo ngược được tạo và cập nhật bằng cách sử dụng các giá trị này. Sau đó, các dòng giá trị này được lưu trữ trong tài liệu.

12) Bản sao trong ElasticSearch là gì?

Mỗi phân đoạn trong ElasticSearch có 2 bản sao, được gọi là bản sao. Chúng giúp bạn có được tính khả dụng cao và khả năng chịu lỗi.

13) Các thao tác chính bạn có thể thực hiện trên tài liệu là gì?

Đây là thao tác quan trọng được thực hiện trên tài liệu:

  • Lập chỉ mục tài liệu
  • Tìm nạp tài liệu
  • Cập nhật tài liệu
  • Xóa tài liệu

14) Cluster trong Elasticsearch là gì?

Cluster là một tập hợp các nút duy nhất hoặc nhiều nút chứa toàn bộ dữ liệu của bạn và cung cấp khả năng lập chỉ mục và tìm kiếm được liên kết trên tất cả các nút.

15) Làm cách nào bạn có thể xóa một chỉ mục trong Tìm kiếm đàn hồi?

Để xóa một chỉ mục trong Elasticsearch, bạn cần viết lệnh:

 DELETE /index name. 

Ví dụ: XÓA / trang web.

16) Giải thích phương pháp thêm ánh xạ trong Chỉ mục

Elasticsearch cho phép bạn tạo ánh xạ theo dữ liệu được cung cấp bởi người dùng trong phần thân yêu cầu. Tính năng số lượng lớn của nó có thể được sử dụng để thêm nhiều hơn một đối tượng JSON trong chỉ mục.

Ví dụ: ĐĂNG trang web / _bulk.

17) Các cách tìm kiếm khác nhau trong Elasticsearch là gì?

Sau đây là cách tìm kiếm trong Elasticsearch:

Tìm kiếm nhiều chỉ mục, Nhiều kiểu: Bạn có thể tìm kiếm các API có thể được áp dụng trên tất cả các chỉ số bằng cách sử dụng hệ thống hỗ trợ đa chỉ mục.

Trong Tìm kiếm đàn hồi, chúng tôi có thể tạo các thẻ nhất định trên tất cả các chỉ số trên tất cả các chỉ số và tất cả các loại.

  • Tìm kiếm URI: Yêu cầu tìm kiếm được thực hiện bằng URI bằng cách cung cấp các tham số được yêu cầu.
  • Yêu cầu tìm kiếm nội dung: Yêu cầu tìm kiếm cần được thực hiện bởi DSL tìm kiếm. Nó bao gồm DSL truy vấn bên trong nội dung.

18) Phiên bản mới nhất của Elasticsearch là gì?

Phiên bản mới nhất của Elastic Search vào tháng 1 năm 2020, là phiên bản ổn định và mới nhất của Elasticsearch.

19) Bản đồ là gì?

Ánh xạ là một quá trình giúp bạn xác định cách một tài liệu được ánh xạ tới công cụ tìm kiếm. Các đặc điểm có thể tìm kiếm của nó bao gồm các trường được mã hóa cũng như có thể tìm kiếm được.

20) Tìm kiếm đàn hồi được lưu trữ ở đâu?

Bạn có thể lưu trữ Elasticsearch là một tài liệu phân tán, là một kho chứa nhiều loại thư mục khác nhau. Bạn cũng có thể truy xuất các cấu trúc dữ liệu phức tạp có thể được tuần tự hóa dưới dạng tài liệu JSON.

21) Apache Lucene là gì?

Apache Lucene là một thư viện phần mềm truy xuất thông tin mã nguồn mở. Ban đầu nó được viết bằng ngôn ngữ Java.

22) Dưới đây là công cụ quản lý cấu hình quan trọng được Elasticsearch hỗ trợ:

  • Con rối - con rối-đàn hồi
  • Chef - sách nấu ăn-đàn hồi
  • Ansible - tìm kiếm không thể nghe được-đàn hồi

23) NRT trong Elasticsearch là gì?

NRT là một dạng đầy đủ của nền tảng (Gần thời gian thực tìm kiếm). Nó là một nền tảng tìm kiếm gần thời gian thực. Nó có nghĩa là có một độ trễ nhỏ (chủ yếu là một giây) từ khi bạn lập chỉ mục tài liệu cho đến khi tài liệu đó trở nên rất có thể tìm kiếm được.

24) Bạn định cấu hình cài đặt cho X-Pack ở đâu?

Bạn có thể định cấu hình cài đặt cho X-Pack. Nó có các tính năng trong tệp cấu hình thunsearch, logstash và kibana.yml (ngăn xếp ELK).

25) API cat trong Elasticsearch là gì?

Các lệnh này chấp nhận một tham số chuỗi truy vấn. Điều này giúp xem tất cả thông tin và tiêu đề và thông tin mà họ cung cấp và lệnh / _cat, cho phép bạn liệt kê tất cả các lệnh có sẵn.

26) Các lệnh khác nhau có sẵn trong API mèo Elasticsearch là gì?

Lệnh sử dụng với API cat là:

  • Bí danh mèo, phân bổ mèo, số lượng mèo, dữ liệu trường mèo
  • Sức khỏe của mèo, chỉ số mèo, chủ mèo, nhiệm vụ đang chờ xử lý, bổ sung cho mèo, phục hồi mèo
  • kho mèo, ảnh chụp nhanh mèo, mẫu mèo

27) Nút Ingest là gì?

Nút Ingest được sử dụng để xử lý trước tài liệu trước khi việc lập chỉ mục tài liệu thực sự xảy ra. Nó giúp bạn chặn các yêu cầu hàng loạt và lập chỉ mục. Nó cũng áp dụng các phép biến đổi và sau đó nó chuyển các tài liệu trở lại API và chỉ mục hàng loạt.

28) Các cách sử dụng lệnh X-Pack khác nhau là gì?

Dưới đây là các lệnh X-Pack giúp bạn định cấu hình bảo mật:

  • Certgen
  • di cư
  • syskeygen
  • certutil
  • siêu dữ liệu saml
  • thiết lập-mật khẩu
  • người dùng

29) Các API tài liệu đơn trong Elasticsearch là gì?

  • Nhận API
  • API chỉ mục
  • Xóa API
  • Cập nhật API

30) Giải thích API Khám phá trong Elasticsearch

API khám phá Đồ thị cho phép bạn trích xuất và tóm tắt thông tin liên quan đến các tài liệu.

31) Làm cách nào bạn có thể tạo Chỉ mục trong Elasticsearch?

Ví dụ:

PUT / khách hàng?

GET / _cat / chỉ số? V

32) Aggregations là gì?

Khung tổng hợp giúp bạn cung cấp dữ liệu tổng hợp dựa trên truy vấn tìm kiếm. Nó dựa trên các khối xây dựng đơn giản được gọi là tập hợp. Nó có thể được tạo ra để xây dựng các bản tóm tắt phức tạp của dữ liệu.

33) Elasticsearch có lược đồ không?

Ánh xạ ElasticSearch có thể được sử dụng để thực thi một lược đồ trên tài liệu.

34) Truy vấn DSL trong Elasticsearch là gì?

Elasticsearch cung cấp DSL truy vấn đầy đủ (Ngôn ngữ dành riêng cho miền) dựa trên JSON để xác định các truy vấn.

35) Nút dữ liệu Elasticsearch là gì?

Các nút dữ liệu giữ các phân đoạn xử lý các tài liệu được lập chỉ mục. Chúng giúp bạn thực thi CRUD liên quan đến dữ liệu và các hoạt động tổng hợp tìm kiếm, v.v. Tuy nhiên, bạn cần Đặt node.data = true để tạo nút làm Nút dữ liệu.

36) Tài liệu trong ElasticSearch là gì?

Tài liệu rất giống với một hàng trong cơ sở dữ liệu quan hệ. Mọi tài liệu trong chỉ mục có cấu trúc khác nhau nhưng có cùng kiểu dữ liệu cho các trường tương ứng.

  • MySQL => Cơ sở dữ liệu => Bảng => Cột / Hàng
  • ElasticSearch => Chỉ số => Loại => Tài liệu có thuộc tính

37) Giải thích loại trong ElasticSearch

Loại là một phân vùng chỉ mục logic có ngữ nghĩa phụ thuộc vào người dùng.

38) Ngôn ngữ truy vấn của Elasticsearch là gì?

Ngôn ngữ truy vấn Apache Lucene, còn được gọi là Truy vấn DSL, được Elasticsearch sử dụng.

39) Ánh xạ động trong Elasticsearch là gì?

Ánh xạ động giúp người dùng lập chỉ mục tài liệu mà không có cấu hình không mong muốn cho tên trường. Thay vào đó, nó sẽ được thêm tự động thông qua Elasticsearch với một số quy tắc tùy chỉnh.

40) Tìm kiếm mờ Elasticsearch là gì?

Tìm kiếm mờ là một quá trình trong đó các vị trí tài liệu trang web cần được xác định. Điều đó giống với đối số tìm kiếm. Nó cũng hoạt động khi đối số không liên quan đến người tìm kiếm thông tin cụ thể.