Nhóm sinh viên Khoa học Dữ liệu đã thực hiện bài báo “New Benchmark Dataset and Fine-Grained Cross-Modal Fusion Framework for Vietnamese Multimodal Aspect-Category Sentiment Analysis” và được công bố trên Tạp chí Quốc tế Multimedia Systems (Q1).
Sinh viên thực hiện:
Nguyễn Hoàng Quý - KHDL2020 - Tác giả chính
Nguyễn Trương Minh Văn - KHDL2020 - Đồng tác giả
Giảng viên hướng dẫn: TS. Nguyễn Văn Kiệt
Tóm tắt:
Sự xuất hiện của dữ liệu đa thể thức trên nền tảng mạng xã hội đã mang đến những cơ hội mới để nắm bắt rõ hơn về cảm xúc, trải nghiệm của người dùng đối với các sản phẩm và dịch vụ. Tuy nhiên, các bộ dữ liệu đa thể thức hiện có cho nhiệm vụ Phân Tích Cảm Xúc Dựa trên Khía Cạnh (Aspect Category Sentiment Analysis) thường chỉ tập trung vào gán nhãn văn bản, bỏ qua thông tin chi tiết quý giá có thể được thu thập từ hình ảnh. Do đó, chúng không thể khai thác đầy đủ sự phong phú và tiềm năng mà dữ liệu đa thể thức mang lại. Nhận thấy tầm quan trọng của bài toán, chúng tôi giới thiệu một bộ dữ liệu đa thể thức cho tiếng Việt với tên là ViMACSA, bao gồm 4,876 cặp văn bản-hình ảnh với tổng cộng 14,618 nhãn chi tiết cho cả văn bản và hình ảnh trong lĩnh vực khách sạn. Bộ dữ liệu này cung cấp các thông tin chi tiết và toàn diện về khía cạnh và cảm xúc của người dùng thông qua sự kết hợp giữa hình ảnh và văn bản. Điều này cho phép khai thác tối đa lượng thông tin từ cả hai thể thức, góp phần cải thiện tính chính xác của các mô hình phân tích cảm xúc. Bên cạnh đó, chúng tôi đã nghiên cứu và đề xuất một framework mới với tên Fine-Grained Cross-Modal Fusion (FCMF), có khả năng học được cả tương tác nội thể thức và liên thể thức, sau đó hợp nhất các tương tác này để có được một biểu diễn đa thể thức thống nhất. Kết quả thử nghiệm cho thấy rằng framework của chúng tôi vượt qua các mô hình SOTA khác trên bộ dữ liệu ViMACSA, đạt được điểm F1 cao nhất là 79.73%. Điều này chứng minh được sự vượt trội của FCMF trong việc xử lí dữ liệu đa thể thức.
"Chúng em xin chân thành cảm ơn thầy Nguyễn Văn Kiệt – người đã hỗ trợ, đồng hành và hướng dẫn nhóm trong suốt quá trình nghiên cứu. Nhờ vào sự tận tâm, nhiệt huyết và những góp ý vô cùng quý giá của thầy, chúng em đã đạt được những bước tiến quan trọng và có cơ hội công bố bài báo khoa học quốc tế này. Thầy đã luôn là nguồn động viên và hỗ trợ không thể thiếu, giúp chúng em vượt qua những thử thách để đạt được thành quả như mong đợi."
Multimedia Systems là một tạp chí quốc tế xuất bản các công trình nghiên cứu về hệ thống đa phương tiện, bao gồm các lĩnh vực như xử lý văn bản, hình ảnh, âm thanh, video. Đây là tạp chí khoa học quốc tế uy tín được xếp hạng Q1 (theo Scimago) trong danh mục ISI (theo Web of science) với chỉ số ảnh hưởng của tạp chí (Impact Factor) là 3.5 (2023).
Thông tin chi tiết: https://www.facebook.com/UIT.Fanpage/posts/pfbid0T9Qd4B3KvfoKQ5eJdHjErwz6HdTAQGDYW2krPu6GZAJJ2ws3CNda1ZRzxuWKjxkel