Fast R-CNN Understanding

2021-07-20

Giới thiệu

Trong bài trước chúng ta đã tìm hiểu về mô hình R-CNN. Nhận thấy mô hình R-CNN có một số nhược điểm sau:

  • Nhiều stage: CNN để trích xuất features, Linear SVM và regressor for bounding boxes
  • Trong quá trình training cần lưu lại các extracted feature vector của tất cả các classes và background. Sau đó mới train SVM được. Việc này dẫn đến tốn rất nhiều bộ nhớ
  • Thời gian training và inference rất lâu. Không có sự chia sẻ tính toán, từng region proposal lần lượt được đưa vào ConvNet.
Read More

R-CNN Understanding

2021-07-18

Giới thiệu

Năm 2014 Ross Girshick và các cộng sự đã đề xuất phương pháp mới cho object detection - R-CNN. Sau nay nó đã trở thành nền tảng cho các phương pháp như Fast R-CNN, Faster R-CNN và Mask R-CNN. Gần đây FAIR (Facebook AI Research) đã phát triển fully functional framework gọi là Detectron2 được xây dựng dựa trên các model state-of-the-art Faster R-CNN và Mask R-CNN.

Read More

Text detection with Tesseract

2021-07-16

Trong bài trước chúng ta đã tìm hiểu sơ bộ về Tesseract. Trong bài này cùng tìm hiểu cách thực hiện text localization và text detection với Tesseract. Thực chất nội dung này có thể bị trùng lặp với bài trước. Tuy nhiên ở đây chúng ta sẽ đi sâu hơn một chút.

Read More

Nhận diện văn bản với Tesseract OCR

2021-07-14

Hôm nay chúng ta sẽ cùng tìm hiểu một công cụ nhận dạng văn bản Tesseract OCR. Tesseract OCR được bắt đầu phát triển từ những năm 80 của thế kì trước. Sau khi về tay Google nó tiếp tục được phát triển và phát hành dưới dạng open-source. Đây là cung cụ hữu ích giúp nhận dạng văn bản. Chúng ta sẽ xem cách cài đặt và chạy thử với Tesseract xem thế nào.

Read More