Skip to content
  • Tiếng Việt
  • English

Chúc mừng nhóm sinh viên UIT có bài báo khoa học được chấp nhận đăng tại Hội nghị quốc tế CBMI 2024

CBMI (Content-Based Multimedia Indexing) là một hội nghị quốc tế lớn và uy tín, với mục tiêu quy tụ các chuyên gia và cộng đồng đa dạng tham gia vào nghiên cứu và phát triển trong lĩnh vực lập chỉ mục đa phương tiện dựa trên nội dung. Hội nghị tập trung vào các phương pháp truy xuất, duyệt, quản lý, trực quan hóa và phân tích dữ liệu đa phương tiện, đồng thời khuyến khích các đóng góp về cả khía cạnh lý thuyết và ứng dụng của CBMI trong kỷ nguyên mới của Trí tuệ Nhân tạo. CBMI 2024 sẽ được tổ chức tại Reykjavík, Iceland vào tháng 9 năm 2024.

Bài báo: “IMSearch: An Interactive Multimedia Video-moment Search System”

Học viên thực hiện:

- Lưu Đức Tuấn - Nghiên cứu viên PTN TTĐPT (MMLAB) - Tác giả chính;

- Nguyễn Duy Ngọc - KHCL 2021 - Đồng tác giả;

- Bùi Lê Khánh Linh - KHCL 2021 - Đồng tác giả;

Giáo viên hướng dẫn:

- TS. Nguyễn Vinh Tiệp

Tóm tắt bài báo:

In recent years, video content has become increasingly popular due to the development of technologies, especially for recording devices. This explosion has driven the need for an advanced video-moment retrieval system that can accurately search for specific video segments matching the intentions of the user’s queries. A prominent challenge in this field lies in the multimedia nature of the video data, which includes visual, auditory and even textual information. The accuracy and relevance of search results depend on how efficiently a retrieval system processes these types of metadata. In this paper, we introduce IMSearch, an interactive multimedia search system that can retrieve precise video-moment content by executing queries across various information types, such as text, audio, location of the objects, sketch, and human pose. Additionally, we implement a re-ranking mechanism based on user feedback to simultaneously improve and optimize the performance of our IMSearch system. We also explore two different vector libraries (FAISS and HNSW) for vector searching and report the retrieval accuracy and executed time to demonstrate our proposed paradigm.

"Chúng tôi xin chân thành cảm ơn Phòng thí nghiệm Truyền thông Đa phương tiện (MMLab), Khoa Khoa học máy tính đã hỗ trợ, tạo điều kiện cho chúng tôi trong quá trình nghiên cứu này."

Mọi thông tin chi tiết xem tại: https://www.facebook.com/share/p/saJzSNGfKe9GquTe/

Đông Xanh - Cộng tác viên truyền thông Trường Đại học Công nghệ Thông tin