Bài báo: “UIT-DarkCow team at ImageCLEFmedical Caption 2024: Diagnostic Captioning for Radiology Images Efficiency with Transformer Models”
Học viên thực hiện:
- Nguyễn Văn Quân - 21521333 - Khoa học dữ liệu - Tác giả chính.
- Phạm Quang Huy - 21522163 - Khoa học dữ liệu - Đồng tác giả.
- Trần Quang Dân - 21521917 - Khoa học dữ liệu - Đồng tác giả.
- Nguyễn Kiến Bảo Thắng - 21521432 - Khoa học dữ liệu - Đồng tác giả.
- Nguyễn Đặng Nhật Hào - 20520490 – Trí tuệ nhân tạo - Đồng tác giả
Giáo viên hướng dẫn:
- TS. Nguyễn Tất Bảo Thiện.
Tóm tắt:
Trong cuộc thi ImageCLEFmedical2024 Caption, chúng em phát triển các phương pháp kết hợp kiến trúc Transformer encoder-decoder và Query Transformer. Mục tiêu của nghiên cứu là phát triển công nghệ tạo văn bản tự động từ hình ảnh y khoa như X-quang, CT, MRI nhằm hỗ trợ các chuyên gia y tế giảm sai sót lâm sàng và cải thiện năng suất. Phương pháp này nhắm đến việc cung cấp công cụ nâng cao chất lượng và hiệu quả báo cáo, có thể ảnh hưởng đáng kể đến cả thực hành lâm sàng và nghiên cứu học sâu trong lĩnh vực y sinh. Các đánh giá thực nghiệm cho thấy hiệu quả của các mô hình của chúng em, với mô hình VisionDiagnostor-BioBART đạt điểm BERTScore cao nhất là 0.6267. Hiệu suất này đã giúp đội của chúng em, UIT - DarkCow, đạt vị trí thứ ba trên bảng xếp hạng.
“Chúng em muốn bày tỏ lòng biết ơn sâu sắc đến Thầy Nguyễn Tất Bảo Thiện vì đã dành thời gian và tâm huyết để hướng dẫn và chỉ ra những hạn chế trong quá trình tham gia cuộc thi, nghiên cứu và công bố bài báo khoa học quốc tế này”.
Thông tin chung:
ImageCLEFmedical là một phần của cuộc thi ImageCLEF, một sáng kiến quốc tế nhằm đánh giá các hệ thống xử lý và truy xuất thông tin hình ảnh y tế. Cuộc thi này tập trung vào các thách thức liên quan đến việc phân tích và hiểu dữ liệu hình ảnh y tế, bao gồm hình ảnh X-quang, CT, MRI và các dạng hình ảnh y tế khác.
Mỗi năm, ImageCLEFmedical tổ chức các chiến dịch đánh giá với nhiều nhiệm vụ khác nhau, nhằm khuyến khích sự phát triển của các thuật toán tiên tiến và công cụ hỗ trợ y tế. Các nhiệm vụ thường bao gồm tạo ra các chú thích tự động cho hình ảnh y tế để hỗ trợ bác sĩ trong việc chẩn đoán và báo cáo, phân loại hình ảnh y tế theo các loại bệnh lý hoặc điều kiện y tế cụ thể, tìm kiếm và truy xuất hình ảnh y tế từ cơ sở dữ liệu lớn dựa trên các đặc điểm hình ảnh và ngữ cảnh, và phát hiện các vùng bất thường trong hình ảnh y tế để hỗ trợ phát hiện sớm các bệnh lý.
Với những nỗ lực này, ImageCLEFmedical đã trở thành một nền tảng quan trọng cho các nghiên cứu và phát triển trong lĩnh vực hình ảnh y tế, góp phần nâng cao hiệu quả và độ chính xác của các quy trình chẩn đoán và điều trị y tế.
Mọi thông tin chi tiết xem tại: https://www.facebook.com/UIT.Fanpage/posts/pfbid02oYj9rXLLGM3NyYfK7W7epsEwngQkWHvjeaLL32dGbkzUspy7YrcquhRnvRCjhe3ql
Đông Xanh - Cộng tác viên truyền thông Trường Đại học Công nghệ Thông tin