AI là gì?
AI (Trí tuệ nhân tạo) là một nhánh của khoa học máy tính, trong đó máy móc được lập trình và cung cấp khả năng nhận thức để suy nghĩ và bắt chước các hành động như con người và động vật. Tiêu chuẩn cho AI là trí thông minh của con người liên quan đến lý luận, lời nói, học tập, tầm nhìn và giải quyết vấn đề, điều này còn rất xa trong tương lai.
AI có ba cấp độ khác nhau:
- AI hẹp : Một trí tuệ nhân tạo được cho là hẹp khi máy móc có thể thực hiện một nhiệm vụ cụ thể tốt hơn con người. Nghiên cứu hiện tại về AI hiện đang ở đây
- Trí thông minh nhân tạo: Trí thông minh nhân tạo đạt đến trạng thái chung khi nó có thể thực hiện bất kỳ nhiệm vụ trí tuệ nào với mức độ chính xác tương tự như con người
- AI hoạt động : AI hoạt động khi nó có thể đánh bại con người trong nhiều nhiệm vụ
Các hệ thống AI ban đầu sử dụng hệ thống đối sánh mẫu và hệ thống chuyên gia.

Trong hướng dẫn này, bạn sẽ học-
- AI là gì?
- ML là gì?
- Học sâu là gì?
- Quy trình học máy
- Quy trình học sâu
- Tự động trích xuất tính năng bằng DL
- Sự khác biệt giữa Học máy và Học sâu
- Khi nào sử dụng ML hoặc DL?
ML là gì?
ML (Machine Learning) là một loại AI trong đó máy tính được đào tạo để tự động hóa các tác vụ mà con người thực hiện hoặc không thể thực hiện được. Nó là công cụ tốt nhất để phân tích, hiểu và xác định các mẫu trong dữ liệu dựa trên việc nghiên cứu các thuật toán máy tính. Máy học có thể đưa ra quyết định với sự can thiệp tối thiểu của con người.
So sánh Trí tuệ nhân tạo và Học máy, Học máy sử dụng dữ liệu để cung cấp một thuật toán có thể hiểu mối quan hệ giữa đầu vào và đầu ra. Khi máy học kết thúc, nó có thể dự đoán giá trị hoặc lớp của một điểm dữ liệu mới.
Học sâu là gì?
Học sâu là một phần mềm máy tính mô phỏng mạng lưới tế bào thần kinh trong não. Nó là một tập hợp con của học máy và được gọi là học sâu vì nó sử dụng mạng nơ-ron sâu. Máy sử dụng các lớp khác nhau để học từ dữ liệu. Độ sâu của mô hình được biểu thị bằng số lớp trong mô hình. Học sâu là một công nghệ mới trong lĩnh vực AI. Trong học sâu, giai đoạn học được thực hiện thông qua mạng nơ-ron. Mạng nơron là một kiến trúc mà các lớp được xếp chồng lên nhau
Quy trình học máy
Hãy tưởng tượng bạn muốn xây dựng một chương trình nhận dạng các đối tượng. Để đào tạo mô hình, bạn sẽ sử dụng một bộ phân loại . Một bộ phân loại sử dụng các tính năng của một đối tượng để cố gắng xác định lớp mà nó thuộc về.
Trong ví dụ này, bộ phân loại sẽ được huấn luyện để phát hiện xem hình ảnh có phải là:
- Xe đạp
- Thuyền
- Xe hơi
- Máy bay
Bốn đối tượng trên là lớp mà bộ phân loại phải nhận ra. Để tạo một bộ phân loại, bạn cần có một số dữ liệu làm đầu vào và gán nhãn cho nó. Thuật toán sẽ lấy những dữ liệu này, tìm một mẫu và sau đó phân loại nó vào lớp tương ứng.
Nhiệm vụ này được gọi là học có giám sát. Trong học tập có giám sát, dữ liệu đào tạo bạn cung cấp cho thuật toán bao gồm một nhãn.
Việc đào tạo một thuật toán yêu cầu phải tuân theo một số bước tiêu chuẩn:
- Thu thập dữ liệu
- Đào tạo trình phân loại
- Dự đoán
Bước đầu tiên là cần thiết, việc chọn đúng dữ liệu sẽ làm cho thuật toán thành công hay thất bại. Dữ liệu bạn chọn để đào tạo mô hình được gọi là một tính năng. Trong ví dụ đối tượng, các đối tượng là pixel của hình ảnh.
Mỗi hình ảnh là một hàng trong dữ liệu trong khi mỗi pixel là một cột. Nếu hình ảnh của bạn có kích thước 28x28, thì tập dữ liệu chứa 784 cột (28x28). Trong hình dưới đây, mỗi hình đã được chuyển thành một vector đặc trưng. Nhãn cho máy tính biết đối tượng nào trong ảnh.

Mục tiêu là sử dụng các dữ liệu đào tạo này để phân loại loại đối tượng. Bước đầu tiên bao gồm tạo các cột tính năng. Sau đó, bước thứ hai liên quan đến việc chọn một thuật toán để đào tạo mô hình. Khi huấn luyện xong, người mẫu sẽ dự đoán bức tranh tương ứng với đối tượng nào.
Sau đó, có thể dễ dàng sử dụng mô hình để dự đoán hình ảnh mới. Đối với mỗi hình ảnh mới được đưa vào mô hình, máy sẽ dự đoán loại hình ảnh đó thuộc về. Ví dụ, một hình ảnh hoàn toàn mới không có nhãn sẽ đi qua mô hình. Đối với một con người, việc hình dung hình ảnh như một chiếc ô tô là điều tầm thường. Máy sử dụng kiến thức trước đó của nó để dự đoán cũng như hình ảnh là một chiếc xe hơi.
Quy trình học sâu
Trong học sâu, giai đoạn học được thực hiện thông qua mạng nơ-ron. Mạng nơron là một kiến trúc mà các lớp được xếp chồng lên nhau.
Hãy xem xét cùng một ví dụ hình ảnh ở trên. Tập hợp đào tạo sẽ được cung cấp cho một mạng nơ-ron
Mỗi đầu vào đi vào một tế bào thần kinh và được nhân với một trọng số. Kết quả của phép nhân chảy sang lớp tiếp theo và trở thành đầu vào. Quá trình này được lặp lại cho mỗi lớp của mạng. Lớp cuối cùng được đặt tên là lớp đầu ra; nó cung cấp một giá trị thực tế cho nhiệm vụ hồi quy và xác suất của mỗi lớp cho nhiệm vụ phân loại. Mạng nơron sử dụng một thuật toán toán học để cập nhật trọng số của tất cả các nơron. Mạng nơ-ron được huấn luyện đầy đủ khi giá trị của các trọng số cho kết quả gần với thực tế. Ví dụ, một mạng nơ-ron được đào tạo bài bản có thể nhận ra đối tượng trên ảnh với độ chính xác cao hơn so với mạng nơ-ron truyền thống.

Tự động trích xuất tính năng bằng DL
Một tập dữ liệu có thể chứa hàng chục đến hàng trăm tính năng. Hệ thống sẽ học hỏi từ mức độ liên quan của các tính năng này. Tuy nhiên, không phải tất cả các tính năng đều có ý nghĩa đối với thuật toán. Một phần quan trọng của học máy là tìm một tập hợp các tính năng có liên quan để làm cho hệ thống học được điều gì đó.
Một cách để thực hiện phần này trong học máy là sử dụng tính năng trích xuất. Tính năng trích xuất kết hợp các tính năng hiện có để tạo ra một tập hợp các tính năng phù hợp hơn. Nó có thể được thực hiện với PCA, T-SNE hoặc bất kỳ thuật toán giảm kích thước nào khác.
Ví dụ: xử lý hình ảnh, người thực hiện cần trích xuất thủ công đối tượng địa lý trong hình ảnh như mắt, mũi, môi, v.v. Các tính năng được trích xuất đó là nguồn cấp dữ liệu cho mô hình phân loại.
Học sâu giải quyết vấn đề này, đặc biệt là đối với mạng nơ-ron phức tạp. Lớp đầu tiên của mạng nơ-ron sẽ học các chi tiết nhỏ từ bức tranh; các lớp tiếp theo sẽ kết hợp các kiến thức trước đó để tạo ra các thông tin phức tạp hơn. Trong mạng nơ-ron tích tụ, việc trích xuất đặc trưng được thực hiện với việc sử dụng bộ lọc. Mạng áp dụng bộ lọc cho hình ảnh để xem có trùng khớp hay không, tức là hình dạng của đối tượng địa lý giống với một phần của hình ảnh. Nếu có sự trùng khớp, mạng sẽ sử dụng bộ lọc này. Quá trình khai thác tính năng do đó được thực hiện tự động.

Sự khác biệt giữa Học máy và Học sâu
Dưới đây là sự khác biệt chính giữa Học sâu và Học máy
Học máy |
Học kĩ càng |
|
Phụ thuộc dữ liệu |
Màn trình diễn xuất sắc trên tập dữ liệu vừa / nhỏ |
Hiệu suất tuyệt vời trên một tập dữ liệu lớn |
Phụ thuộc phần cứng |
Làm việc trên một máy cấp thấp. |
Yêu cầu máy mạnh, tốt nhất là có GPU: DL thực hiện một lượng nhân ma trận đáng kể |
Kỹ thuật tính năng |
Cần hiểu các tính năng đại diện cho dữ liệu |
Không cần phải hiểu tính năng tốt nhất đại diện cho dữ liệu |
Thời gian thực hiện |
Từ vài phút đến vài giờ |
Lên đến hàng tuần. Mạng thần kinh cần tính toán một số trọng số đáng kể |
Khả năng diễn giải |
Một số thuật toán dễ diễn giải (logistic, cây quyết định), một số thì gần như không thể (SVM, XGBoost) |
Khó đến không thể |
Khi nào sử dụng ML hoặc DL?
Trong bảng dưới đây, chúng tôi tóm tắt sự khác biệt giữa học máy và học sâu với các ví dụ.
Máy học | Học kĩ càng | |
Tập dữ liệu đào tạo | Nhỏ | Lớn |
Chọn các tính năng | Đúng | Không |
Số lượng thuật toán | Nhiều | Vài |
Thời gian huấn luyện | Ngắn | Dài |
Với học máy, bạn cần ít dữ liệu hơn để đào tạo thuật toán so với học sâu. Học sâu đòi hỏi một bộ dữ liệu đa dạng và phong phú để xác định cấu trúc cơ bản. Bên cạnh đó, học máy cung cấp một mô hình được đào tạo nhanh hơn. Hầu hết các kiến trúc học sâu nâng cao có thể mất vài ngày đến một tuần để đào tạo. Ưu điểm của học sâu so với học máy là nó có độ chính xác cao. Bạn không cần phải hiểu những tính năng nào là đại diện tốt nhất của dữ liệu; mạng thần kinh đã học cách chọn các tính năng quan trọng. Trong học máy, bạn cần chọn cho mình những tính năng nào để đưa vào mô hình.
Tóm lược
Trí tuệ nhân tạo đang truyền đạt khả năng nhận thức cho một cỗ máy. So sánh AI và Machine Learning, các hệ thống AI ban đầu đã sử dụng hệ thống đối sánh mẫu và hệ thống chuyên gia.
Ý tưởng đằng sau việc học máy là máy có thể học mà không cần sự can thiệp của con người. Máy cần tìm cách học cách giải quyết một nhiệm vụ được cung cấp dữ liệu.
Học sâu là bước đột phá trong lĩnh vực trí tuệ nhân tạo. Khi có đủ dữ liệu để đào tạo, học sâu sẽ đạt được kết quả ấn tượng, đặc biệt là đối với nhận dạng hình ảnh và dịch văn bản. Lý do chính là việc khai thác tính năng được thực hiện tự động trong các lớp khác nhau của mạng.