13. Thị giác Máy tính

Nhiều ứng dụng trong lĩnh vực thị giác máy tính liên quan mật thiết đến cuộc sống hàng ngày của chúng ta ở hiện tại và tương lai; từ chẩn đoán y tế, xe tự hành, camera giám sát đến những bộ lọc thông minh. Trong những năm gần đây, công nghệ học sâu đã nâng cao đáng kể chất lượng của hệ thống thị giác máy tính. Có thể nói rằng những ứng dụng thị giác máy tính tiên tiến nhất gần như không thể tách rời khỏi học sâu.

Ở chương “Mạng Nơ-ron Tích chập”, chúng tôi đã giới thiệu các mô hình học sâu thường được sử dụng trong lĩnh vực thị giác máy tính và đã cùng thực hành một số tác vụ phân loại hình ảnh đơn giản. Trong chương này, chúng tôi sẽ giới thiệu các phương pháp tăng cường hình ảnh (image augmentation), phương pháp tinh chỉnh (fine-tuning) và áp dụng chúng vào phân loại hình ảnh. Tiếp đến, ta sẽ khám phá các phương pháp phát hiện vật thể khác nhau, cùng tìm hiểu cách sử dụng các mạng tích chập đầy đủ để thực hiện phân vùng ngữ nghĩa trên hình ảnh. Sau đó, chúng tôi giải thích cách sử dụng kỹ thuật truyền tải phong cách (style transfer) để tạo nên những hình ảnh trông giống như bìa của cuốn sách này. Cuối cùng, chúng tôi sẽ thực hiện các bài tập thực hành trên hai bộ dữ liệu thị giác máy tính quan trọng để xem lại nội dung của chương này và những chương trước.

13.15. Những người thực hiện

Bản dịch trong trang này được thực hiện bởi:

  • Đoàn Võ Duy Thanh
  • Trần Yến Thy
  • Lê Khắc Hồng Phúc
  • Nguyễn Văn Cường