Bài báo: “OCR-Based Information Extraction on Vietnamese Book Cover Images”
Sinh viên thực hiện:
Nguyễn Minh tâm - 20520748 - KHDL2020 - Tác giả chính
Nguyễn Trường Thịnh - 20520783 - KHDL2020 - Đồng tác giả
Trần Phạm Gia Phú - 2050694 - KHDL2020 - Đồng tác giả
Quách Cơ Thái - 20520756 - KHDL2020 - Đồng tác giả
Giáo viên hướng dẫn: TS. Đỗ Trọng Hợp
Tóm tắt bài báo:
Trong các thư viện hiện đại, việc số hóa sách để lưu trữ và truy xuất thông tin về sách một cách có hệ thống đang dần trở thành một vấn đề quan trọng, đặc biệt khi số lượng sách xuất bản trên thị trường đang gia tăng nhanh chóng. Theo truyền thống, những thông tin liên quan đến sách như tiêu đề, tác giả, nhà xuất bản, ... sẽ được nhân viên trong các thư viện hoặc hiệu sách đánh máy thủ công, dẫn đến lãng phí rất nhiều thời gian và sức lao động. Với sự phát triển nhanh chóng của công nghệ học máy và học sâu, máy tính giờ đây có thể hỗ trợ chúng ta thực hiện các nhiệm vụ nhận dạng và phân loại thông tin một cách nhanh chóng, chính xác và hiệu quả. Cụ thể, công nghệ nhận dạng ký tự quang học (OCR) và xử lý ngôn ngữ tự nhiên (NLP) có thể tự động hóa quá trình số hóa sách, giúp tiết kiệm đáng kể chi phí nhân lực và nâng cao tính hiệu quả. Văn bản trên ảnh bìa sách sẽ được nhận diện bằng mô hình OCR trước khi được trích xuất về những trường cụ thể như như tiêu đề, tác giả, nhà xuất bản, … bằng các mô hình phân loại.
Trong bài báo này, nhóm tập trung vào việc thực hiện bài toán trích xuất thông tin về sách từ văn bản trên ảnh bìa sách ở Việt Nam sử dụng bộ dữ liệu Vi-BCI gồm hơn 7000 bức ảnh bìa sách đã được gán nhãn. Nhóm đã xây dựng nhiều mô hình khác nhau cho bài toán theo nhiều hướng tiếp cận khác nhau, các mô hình đều có kết quả dự đoán cao. Từ đó, nhóm chọn ra các mô hình có kết quả tốt nhất theo từng hướng tiếp cận và đánh giá kết quả các mô hình này trên thang đo Character Error Rate (CER). Từ kết quả này, nhóm đã phân tích các trường hợp dự đoán sai để tìm giải pháp khắc phục và đề xuất hướng phát triển trong tương lai.
Chúng em xin gửi lời cảm ơn đến thầy Đỗ Trọng Hợp đã đồng hành và hướng dẫn nhóm chúng em trong quá trình nghiên cứu và công bố bài báo khoa học quốc tế này. Chúng em cũng xin cảm ơn chị Nguyễn Thị Thắm và chị Võ Kiều Hoa, cựu sinh viên lớp KHDL2018 của trường, đã cho phép chúng em sử dụng bộ dữ liệu Vi-BCI và có những góp ý quý giá cho chúng em trong quá trình thực hiện đề tài.
Hội nghị RIVF là một hội nghị quốc tế trong lĩnh vực Công nghệ Truyền thông và Điện toán, là sự kiện khoa học quốc tế lớn quy tụ các nhà khoa học, nghiên cứu trong lĩnh vực điện toán và truyền thông ở Việt Nam và thế giới đồng hành “Nghiên cứu – Đổi mới và Tầm nhìn cho tương lai” (Reseach, Innovation and Vision for the future, viết tắt là RIVF). Hội nghị RIVF được liệt kê vào danh sách các hội nghị uy tín theo đề xuất của SCOPUS and ISI Web of Science. RIVF đã trải qua 16 lần tổ chức và năm 2023 là lần tổ chức thứ 17. Đây là một trong những hội nghị khoa học uy tín cao về lĩnh vực Công nghệ Truyền thông và Điện toán. Hội nghị sẽ được tổ chức tại Hà Nội vào tháng 12.2023.
Thông tin chi tiết: https://www.facebook.com/UIT.Fanpage/posts/pfbid02mRqPS2hmMtJcGTbFYheLHYiZjqhGXdaL2cjUNbuZAQxFFHS2RfqVcN6t2gc74ddQl
Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin