Skip to content
  • Tiếng Việt
  • English

Chúc mừng nhóm sinh viên UIT có bài báo khoa học được chấp nhận đăng tại Hội nghị khoa học ISDA2023

2023 International Conference on Intelligent Systems Design and Applications (ISDA) là một hội nghị quốc tế lớn xếp rank C, quy tụ các nhà nghiên cứu, kỹ sư và chuyên gia làm việc trong các lĩnh vực hệ thống thông minh và các ứng dụng của nó trong công nghiệp và đời sống thực tế. Mỗi năm, ISDA thu hút các tác giả từ hơn 30 quốc gia. Sau thành công của hội nghị lần thứ 21 được tổ chức trực tuyến, ISDA 2023 diễn ra từ ngày 11 đến ngày 13 tháng 12 năm 2023. ISDA 2023 mang lại cơ hội cho các nhà nghiên cứu gặp gỡ và thảo luận về các giải pháp mới nhất, kết quả khoa học và phương pháp trong việc giải quyết các vấn đề hấp dẫn trong lĩnh vực trí tuệ nhân tạo và các ứng dụng thực tế của nó.

Bài báo: “Automatic Textual Normalization for Hate Speech Detection” (Link bài báo: https://arxiv.org/abs/2311.06851)

Sinh viên thực hiện:

- Nguyễn Thị Hoàng Anh - KHDL 2020 - Tác giả chính

- Nguyễn Hà Dung - KHDL 2020 - Tác giả chính

- Nguyễn Thị Nguyệt - KHDL 2020 - Đồng tác giả

- Hồ Thanh Duy Khánh - KHDL 2020 - Đồng tác giả

Giáo viên hướng dẫn:

- ThS. Nguyễn Văn Kiệt

Tóm tắt bài báo:

Dữ liệu từ mạng xã hội là một nguồn tài nguyên quý giá cho nghiên cứu, nhưng nó chứa nhiều từ không chuẩn (NSW). Những điểm không đồng nhất này cản trở hiệu quả hoạt động của các công cụ xử lý ngôn ngữ tự nhiên (NLP). Các phương pháp hiện đại nhất cho ngôn ngữ tiếng Việt hiện nay giải quyết vấn đề này như một bài toán chuẩn hóa từ vựng, bao gồm việc tạo ra các quy tắc thủ công hoặc triển khai các framework học sâu đa tầng, yêu cầu nỗ lực đáng kể để xây dựng các quy tắc phức tạp. Trái lại, phương pháp của chúng tôi rất đơn giản, chỉ sử dụng mô hình Seq2Seq. Trong nghiên cứu này, chúng tôi cung cấp một tập dữ liệu để chuẩn hóa văn bản, bao gồm 2.181 bình luận được chú thích thủ công với mức độ đồng thuận giữa các người chú thích là 0,9014. Bằng cách tận dụng mô hình Seq2Seq cho chuẩn hóa văn bản, kết quả của chúng tôi cho thấy độ chính xác đạt được hơi thấp hơn 70%. Tuy nhiên, chuẩn hóa văn bản cải thiện độ chính xác của nhiệm vụ Hate Speech Detection khoảng 2%, cho thấy tiềm năng nâng cao hiệu suất của các nhiệm vụ NLP phức tạp.

“Chúng em xin bày tỏ lòng biết ơn sâu sắc đến Thầy Nguyễn Văn Kiệt vì sự hướng dẫn tận tâm và những đóng góp quý báu trong suốt quá trình nghiên cứu của chúng em. Sự hỗ trợ, chỉ dẫn và kiến thức sâu rộng của Thầy đã giúp chúng em đạt được những kết quả đáng khích lệ”.

Mọi thông tin chi tiết xem tại: https://www.facebook.com/share/p/WhvRKAKr9nwzePtP/

Đông Xanh - Cộng tác viên truyền thông Trường Đại học Công nghệ Thông tin