tải PDF
1) Học máy là gì?
Máy học là một nhánh của khoa học máy tính liên quan đến lập trình hệ thống để tự động học hỏi và cải thiện theo kinh nghiệm. Ví dụ: Robot được lập trình để chúng có thể thực hiện nhiệm vụ dựa trên dữ liệu mà chúng thu thập được từ các cảm biến. Nó tự động học các chương trình từ dữ liệu.
2) Đề cập đến sự khác biệt giữa Khai phá dữ liệu và Máy học?
Học máy liên quan đến việc nghiên cứu, thiết kế và phát triển các thuật toán cung cấp cho máy tính khả năng học mà không cần được lập trình rõ ràng. Trong khi, khai thác dữ liệu có thể được định nghĩa là quá trình trong đó dữ liệu phi cấu trúc cố gắng trích xuất kiến thức hoặc các mẫu thú vị chưa biết. Trong quá trình máy này, các thuật toán học được sử dụng.
3) 'Overfitting' trong Machine learning là gì?
Trong học máy, khi mô hình thống kê mô tả lỗi hoặc nhiễu ngẫu nhiên thay vì mối quan hệ cơ bản 'overfitting' xảy ra. Khi một mô hình quá phức tạp, việc trang bị quá mức thường được quan sát thấy do có quá nhiều tham số liên quan đến số lượng kiểu dữ liệu huấn luyện. Mô hình thể hiện hiệu suất kém đã được trang bị quá mức.
4) Tại sao trang bị quá mức xảy ra?
Khả năng trang bị quá mức tồn tại vì các tiêu chí được sử dụng để đào tạo mô hình không giống với các tiêu chí được sử dụng để đánh giá tính hiệu quả của một mô hình.
5) Làm thế nào bạn có thể tránh trang bị quá nhiều?
Việc trang bị quá nhiều dữ liệu có thể tránh được, việc trang bị quá mức xảy ra tương đối khi bạn có một tập dữ liệu nhỏ và bạn cố gắng học hỏi từ nó. Nhưng nếu bạn có một cơ sở dữ liệu nhỏ và bạn buộc phải đi kèm với một mô hình dựa trên đó. Trong tình huống như vậy, bạn có thể sử dụng một kỹ thuật được gọi là xác thực chéo . Trong phương pháp này, tập dữ liệu chia thành hai phần, tập dữ liệu thử nghiệm và huấn luyện, tập dữ liệu thử nghiệm sẽ chỉ kiểm tra mô hình trong khi, trong tập dữ liệu huấn luyện, các điểm dữ liệu sẽ đi kèm với mô hình.
Trong kỹ thuật này, một mô hình thường được cung cấp một tập dữ liệu gồm một dữ liệu đã biết mà quá trình huấn luyện (tập dữ liệu huấn luyện) được chạy và một tập dữ liệu không xác định mà mô hình được kiểm tra. Ý tưởng của xác nhận chéo là xác định một tập dữ liệu để “kiểm tra” mô hình trong giai đoạn đào tạo.
6) Học máy quy nạp là gì?
Học máy quy nạp bao gồm quá trình học bằng các ví dụ, trong đó một hệ thống, từ một tập hợp các trường hợp được quan sát sẽ cố gắng đưa ra một quy tắc chung.
7) Năm thuật toán phổ biến của Học máy là gì?
- Cây quyết định
- Mạng thần kinh (lan truyền ngược)
- Mạng xác suất
- Láng giềng gần nhất
- Hỗ trợ máy vector
8) Các kỹ thuật thuật toán khác nhau trong Học máy là gì?
Các loại kỹ thuật khác nhau trong Học máy là
- Học tập có giám sát
- Học tập không giám sát
- Học tập bán giám sát
- Học tăng cường
- Truyền tải
- Học để học
9) Ba giai đoạn để xây dựng các giả thuyết hoặc mô hình trong học máy là gì?
- Xây dựng mô hình
- Kiểm tra mô hình
- Áp dụng mô hình
10) Cách tiếp cận tiêu chuẩn đối với việc học có giám sát là gì?
Cách tiếp cận tiêu chuẩn đối với việc học có giám sát là tách tập ví dụ thành tập huấn luyện và bài kiểm tra.
11) 'Tập huấn luyện' và 'Tập kiểm tra' là gì?
Trong các lĩnh vực khoa học thông tin khác nhau như học máy, một tập hợp dữ liệu được sử dụng để khám phá mối quan hệ có khả năng dự đoán được gọi là 'Tập huấn luyện'. Tập huấn luyện là một ví dụ được đưa ra cho người học, trong khi Tập kiểm tra được sử dụng để kiểm tra độ chính xác của các giả thuyết được tạo ra bởi người học và nó là tập hợp ví dụ được giữ lại từ người học. Tập huấn luyện khác với tập kiểm tra.
12) Liệt kê các cách tiếp cận khác nhau cho học máy?
Các cách tiếp cận khác nhau trong Học máy là
- Khái niệm Vs Phân loại Học
- Học thống kê Vs tượng trưng
- Học phân tích quy nạp Vs
13) Học máy không phải là gì?
- Trí tuệ nhân tạo
- Suy luận dựa trên quy tắc
14) Giải thích chức năng của 'Học tập không giám sát' là gì?
- Tìm các cụm dữ liệu
- Tìm các biểu diễn dữ liệu theo chiều thấp
- Tìm chỉ đường thú vị trong dữ liệu
- Các tọa độ và mối tương quan thú vị
- Tìm các quan sát mới / làm sạch cơ sở dữ liệu
15) Giải thích chức năng của 'Học tập có giám sát' là gì?
- Phân loại
- Nhận dạng giọng nói
- hồi quy
- Dự đoán chuỗi thời gian
- Chú thích chuỗi
16) Học máy độc lập thuật toán là gì?
Học máy trong đó nền tảng toán học độc lập với bất kỳ bộ phân loại cụ thể hoặc thuật toán học tập nào được gọi là học máy độc lập thuật toán?
17) Sự khác biệt giữa học nhân tạo và học máy là gì?
Thiết kế và phát triển các thuật toán theo các hành vi dựa trên dữ liệu thực nghiệm được gọi là Học máy. Trong khi trí tuệ nhân tạo ngoài việc học máy, nó còn bao gồm các khía cạnh khác như biểu diễn kiến thức, xử lý ngôn ngữ tự nhiên, lập kế hoạch, người máy, v.v.
18) Bộ phân loại trong học máy là gì?
Bộ phân loại trong Học máy là một hệ thống nhập một vectơ gồm các giá trị tính năng rời rạc hoặc liên tục và xuất ra một giá trị rời rạc duy nhất, lớp.
19) Lợi thế của Naive Bayes là gì?
Trong Naïve Bayes trình phân loại sẽ hội tụ nhanh hơn các mô hình phân biệt như hồi quy logistic, vì vậy bạn cần ít dữ liệu huấn luyện hơn. Ưu điểm chính là nó không thể học tương tác giữa các tính năng.
20) Nhận dạng mẫu được sử dụng trong những lĩnh vực nào?
Nhận dạng mẫu có thể được sử dụng trong
- Tầm nhìn máy tính
- Nhận dạng giọng nói
- Khai thác dữ liệu
- Số liệu thống kê
- Truy xuất không chính thức
- Tin học sinh học
21) Lập trình di truyền là gì?
Lập trình di truyền là một trong hai kỹ thuật được sử dụng trong học máy. Mô hình dựa trên thử nghiệm và lựa chọn sự lựa chọn tốt nhất trong số một tập hợp các kết quả.
22) Lập trình Logic quy nạp trong Học máy là gì?
Lập trình lôgic quy nạp (ILP) là một trường con của học máy sử dụng lập trình lôgic đại diện cho kiến thức và ví dụ nền tảng.
23) Lựa chọn mô hình trong Học máy là gì?
Quá trình lựa chọn mô hình giữa các mô hình toán học khác nhau, được sử dụng để mô tả cùng một tập dữ liệu được gọi là Lựa chọn mô hình. Lựa chọn mô hình được áp dụng cho các lĩnh vực thống kê, học máy và khai thác dữ liệu.
24) Hai phương pháp được sử dụng để hiệu chuẩn trong Học tập có giám sát là gì?
Hai phương pháp được sử dụng để dự đoán xác suất tốt trong Học tập có giám sát là
- Hiệu chuẩn Platt
- Hồi quy đẳng áp
Các phương pháp này được thiết kế để phân loại nhị phân, và nó không hề tầm thường.
25) Phương pháp nào thường được sử dụng để ngăn chặn việc mặc trang phục quá mức?
Khi có đủ dữ liệu, 'Hồi quy đẳng áp' được sử dụng để ngăn vấn đề trang bị quá mức.
26) Sự khác biệt giữa heuristic cho học quy tắc và heuristics cho cây quyết định là gì?
Sự khác biệt là các phương pháp heuristics cho cây quyết định đánh giá chất lượng trung bình của một số tập hợp rời rạc trong khi những người học quy tắc chỉ đánh giá chất lượng của tập hợp các thể hiện được bao phủ bởi quy tắc ứng viên.
27) Perceptron trong Học máy là gì?
Trong Học máy, Perceptron là một thuật toán để phân loại có giám sát của đầu vào thành một trong một số đầu ra không nhị phân có thể có.
28) Giải thích hai thành phần của chương trình logic Bayes?
Chương trình logic Bayes bao gồm hai thành phần. Thành phần đầu tiên là một thành phần logic; nó bao gồm một tập hợp các Điều khoản Bayes, nắm bắt cấu trúc định tính của miền. Thành phần thứ hai là một thành phần định lượng, nó mã hóa thông tin định lượng về miền.
29) Mạng Bayesian (BN) là gì?
Mạng Bayes được sử dụng để biểu diễn mô hình đồ họa cho mối quan hệ xác suất giữa một tập hợp các biến.
30) Tại sao thuật toán học tập dựa trên ví dụ đôi khi được gọi là thuật toán học tập lười biếng?
Thuật toán học tập dựa trên phiên bản còn được gọi là thuật toán học tập lười biếng vì chúng trì hoãn quá trình quy nạp hoặc tổng quát hóa cho đến khi phân loại được thực hiện.
31) Hai phương pháp phân loại mà SVM (Hỗ trợ Vector Machine) có thể xử lý là gì?
- Kết hợp bộ phân loại nhị phân
- Sửa đổi hệ nhị phân để kết hợp học đa lớp
32) Học tập theo nhóm là gì?
Để giải quyết một chương trình tính toán cụ thể, nhiều mô hình như bộ phân loại hoặc chuyên gia được tạo và kết hợp một cách chiến lược. Quá trình này được gọi là học tập theo nhóm.
33) Tại sao học theo nhóm được sử dụng?
Học tập hợp được sử dụng để cải thiện phân loại, dự đoán, xấp xỉ hàm, v.v. của một mô hình.
34) Khi nào sử dụng học theo nhóm?
Học theo nhóm được sử dụng khi bạn xây dựng các bộ phân loại thành phần chính xác hơn và độc lập với nhau.
35) Hai mô hình của phương pháp tổng hợp là gì?
Hai mô hình của phương pháp tổng hợp là
- Các phương pháp tổng hợp tuần tự
- Phương pháp kết hợp song song
36) Nguyên tắc chung của phương pháp tổng hợp là gì và phương pháp đóng gói và tăng cường trong phương pháp kết hợp là gì?
Nguyên tắc chung của phương pháp tổng hợp là kết hợp các dự đoán của một số mô hình được xây dựng với một thuật toán học nhất định để cải thiện độ mạnh mẽ so với một mô hình duy nhất. Đóng bao là một phương pháp trong tập hợp để cải thiện các sơ đồ phân loại hoặc ước tính không ổn định. Trong khi phương pháp thúc đẩy được sử dụng tuần tự để giảm độ chệch của mô hình kết hợp. Cả hai đều có thể giảm sai số bằng cách giảm phương sai.
37) Phân tích phương sai sai lệch của sai số phân loại trong phương pháp tổng hợp là gì?
Lỗi mong đợi của một thuật toán học tập có thể được phân tách thành độ chệch và phương sai. Một thuật ngữ thiên vị đo lường mức độ chặt chẽ của bộ phân loại trung bình được tạo ra bởi thuật toán học tập phù hợp với hàm mục tiêu. Thuật ngữ phương sai đo lường mức độ dao động của dự đoán của thuật toán học tập đối với các tập huấn luyện khác nhau.
38) Thuật toán Học tập tăng dần trong nhóm là gì?
Phương pháp học tăng dần là khả năng của một thuật toán để học từ dữ liệu mới có thể có sẵn sau khi bộ phân loại đã được tạo từ tập dữ liệu đã có sẵn.
39) PCA, KPCA và ICA được sử dụng để làm gì?
PCA (Phân tích thành phần chính), KPCA (Phân tích thành phần chính dựa trên nhân) và ICA (Phân tích thành phần độc lập) là các kỹ thuật trích xuất tính năng quan trọng được sử dụng để giảm kích thước.
40) Giảm kích thước trong Học máy là gì?
Trong Machine Learning và thống kê, giảm thứ nguyên là quá trình giảm số lượng biến ngẫu nhiên đang được xem xét và có thể được chia thành lựa chọn đối tượng và trích xuất đối tượng.
41) Máy vector hỗ trợ là gì?
Máy vector hỗ trợ là các thuật toán học có giám sát được sử dụng để phân loại và phân tích hồi quy.
42) Các thành phần của kỹ thuật đánh giá quan hệ là gì?
Các thành phần quan trọng của kỹ thuật đánh giá quan hệ là
- Thu thập dữ liệu
- Sự thật về mặt đất
- Kỹ thuật xác thực chéo
- Loại truy vấn
- Chỉ số tính điểm
- Kiểm tra mức độ quan trọng
43) Các phương pháp khác nhau để Học có Giám sát Tuần tự là gì?
Các phương pháp khác nhau để giải quyết các vấn đề về Học tập có giám sát tuần tự là
- Phương pháp cửa sổ trượt
- Cửa sổ trượt tái diễn
- Mô hình Markow ẩn
- Mô hình Markow entropy tối đa
- Các trường ngẫu nhiên có điều kiện
- Vẽ đồ thị mạng máy biến áp
44) Các lĩnh vực trong chế biến rô bốt và xử lý thông tin nơi phát sinh vấn đề dự đoán tuần tự?
Các lĩnh vực trong chế tạo rô bốt và xử lý thông tin nơi phát sinh vấn đề dự đoán tuần tự là
- Học bắt chước
- Dự đoán có cấu trúc
- Học tập củng cố dựa trên mô hình
45) Học thống kê theo lô là gì?
Kỹ thuật học thống kê cho phép học một chức năng hoặc công cụ dự đoán từ một tập hợp dữ liệu quan sát có thể đưa ra dự đoán về dữ liệu chưa nhìn thấy hoặc trong tương lai. Các kỹ thuật này cung cấp đảm bảo về hiệu suất của công cụ dự đoán đã học trên dữ liệu không nhìn thấy được trong tương lai dựa trên giả định thống kê về quá trình tạo dữ liệu.
46) Học PAC là gì?
Học PAC (Có thể là Gần đúng) là một khung học tập đã được giới thiệu để phân tích các thuật toán học và hiệu quả thống kê của chúng.
47) Các loại khác nhau mà bạn có thể phân loại quá trình học theo trình tự là gì?
- Dự đoán trình tự
- Tạo trình tự
- Nhận dạng trình tự
- Quyết định tuần tự
48) Học theo trình tự là gì?
Học theo trình tự là một phương pháp dạy và học một cách logic.
49) Hai kỹ thuật của Học máy là gì?
Hai kỹ thuật của Học máy là
- Lập trình di truyền
- Học tập quy nạp
Công cụ đề xuất được triển khai bởi các trang web thương mại điện tử lớn sử dụng Học máy.