4. Perceptron Đa tầng

Trong chương này, chúng tôi sẽ giới thiệu mạng nơ-ron sâu thực sự đầu tiên của bạn. Mạng nơ-ron sâu đơn giản nhất được gọi là perceptron đa tầng. Nó gồm nhiều tầng nơ-ron, mỗi nơ-ron được kết nối đầy đủ với các nơ-ron khác ở tầng phía dưới (các nơ-ron cung cấp đầu vào) và tầng phía trên (các nơ-ron mà nó gây ảnh hưởng). Khi huấn luyện các mô hình có độ phức tạp cao, ta sẽ có nguy cơ gặp vấn đề quá khớp. Vì vậy, chúng tôi cần cung cấp cho bạn những hiểu biết ban đầu thật chặt chẽ với các khái niệm quá khớp, dưới khớp và kiểm soát độ phức tạp. Nhằm giúp bạn giải quyết những vấn đề kể trên, chúng tôi sẽ giới thiệu những kỹ thuật điều chuẩn như dropout và suy giảm trọng số. Ta cũng sẽ bàn đến các vấn đề liên quan tới sự ổn định số học và việc khởi tạo tham số, hai yếu tố chính giúp việc huấn luyện mạng nơ-ron sâu thành công. Xuyên suốt chương này, chúng tôi tập trung vào việc áp dụng các mô hình cho dữ liệu thực tế, nhằm giúp độc giả không chỉ nắm vững được các khái niệm mà còn có thể thực hành sử dụng mạng nơ-ron sâu. Những vấn đề liên quan tới hiệu năng tính toán, khả năng mở rộng và mức hiệu quả của mô hình sẽ được giới thiệu ở các chương sau.

4.11. Những người thực hiện

Bản dịch trong trang này được thực hiện bởi:

  • Đoàn Võ Duy Thanh
  • Phạm Minh Đức