Nhóm sinh viên ngành Trí tuệ nhân tạo, Khoa học máy tính và An toàn thông tin tham dự hội nghị và báo cáo công trình nghiên cứu về Truy vấn thông tin sự kiện trong video tại Hội nghị khoa học quốc tế “The 13th International Symposium on Information and Communication Technology (SOICT 2024).
Thông tin về bài báo khoa học:
- Tên bài báo: “ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction”
- Sinh viên thực hiện:
- Nguyễn Hoàng Phúc - Trí tuệ nhân tạo Hệ Chính quy (KHNT2022)
- Hồ Thuý Nga - Trí tuệ nhân tạo Hệ Chính quy (KHNT2022)
- Trần Dương Minh Đại - An toàn thông tin Hệ Tài năng (ATTN2022)
- Trương Đức Hào- An toàn thông tin Hệ Chính quy (ATTT2022)
- Nguyễn Thế Luân - Khoa học máy tính Hệ Chính quy (KHMT2023)
Bài báo khoa học của nhóm là kết quả của quá trình nghiên cứu và xây dựng giải pháp truy vấn hiệu quả thông tin sự kiện cuộc sống thường nhật từ dữ liệu video trong Hội thi Thử thách trí tuệ nhân tạo Tp. HCM năm 2024 (AI Challenge 2024). Bài báo này được trình bày trong Phiên chương trình "Lifelog and Multimedia Event Retrieval" tại Hội nghị SoICT 2024.
Abstract: "In this century, search engines have emerged as a crucial component of the technological landscape. Enterprises require a search engine to retrieve specific information within a particular field. However, they face various challenges due to the rapidly increasing volume of data and the need for effective database management to handle diverse data types. Additionally, the search for data is hindered by difficulties in matching queries with key frames or the limitations in understanding query context. In this paper, we introduce ArtemisSearch, a text-based multimodal search engine designed for temporal event retrieval in videos. In the proposed system, an efficient algorithm for Content-Based Image Retrieval (CBIR) using ViT-H/14 and BEiT3 for feature extraction and an open-source vector database, Milvus, our system efficiently retrieves events by leveraging temporal segmentation of queries and matching embeddings for Artificial Intelligence (AI) applications. Additionally, we developed a web application that allows end users to easily create temporally-aware descriptive queries, efficiently explore top results, and view precise video previews at relevant timestamps. The ArtemisSearch method represents a significant advancement in temporal video retrieval, with potential applications across diverse fields, leading to a smoother and more accurate video search experience".
Thông tin chung:
Hội nghị SoICT 2024 diễn ra tại Thành phố Đà Nẵng do Trường Công nghệ thông tin và Truyền Thông - ĐH Bách Khoa Hà Nội, Trường ĐH Khoa học Tự nhiên - ĐHQG TP. HCM, Trường ĐH Bách khoa - ĐH Đà Nẵng phối hợp tổ chức vào ngày 13-15/12/2024.
Mọi thông tin chi tiết xem tại: https://www.facebook.com/share/p/18scByopuF/?mibextid=wwXIfr
Đông Xanh - Cộng tác viên truyền thông Trường Đại học Công nghệ Thông tin