Skip to content
  • Tiếng Việt
  • English

Chúc mừng nhóm sinh viên UIT có bài báo khoa học được đăng tại Hội nghị Quốc tế ISDA 2023

Bài báo: “Gendec: A Machine Learning-based Framework for Gender Detection from Japanese Names”

Link bài báo: https://arxiv.org/abs/2311.11001

Sinh viên thực hiện: Phạm Tiến Dương – 20521222 – KHDL2020 – Tác giả chính

Giảng viên hướng dẫn: Th.S Nguyễn Thành Luân

Tóm tắt bài báo:

Every human has their own name, a fundamental aspect of their identity and cultural heritage. The name can often convey a wealth of information, including details about an individual’s background, ethnicity, and, especially, their gender. By detecting gender through the analysis of names, researchers can unlock valuable insights into linguistic patterns and cultural norms, which can be applied to practical applications. In this paper, we release a novel large-scale dataset for Japanese name gender detection comprising 64,139 full names in romaji, hiragana, and kanji forms, along with their biological genders. Moreover, we propose Gendec, a machine learning-based framework for gender detection from Japanese names that leverages diverse approaches, including traditional machine learning techniques or state-of-the-art transfer learning approaches, to predict the gender associated with Japanese names accurately. Through a thorough investigation, the proposed framework is expected to be effective and serve potential applications in various domains.

Hội nghị ISDA là một hội nghị quốc tế uy tín thường niên tập trung về nghiên cứu các hệ thống thông minh (Intelligent systems) và ứng dụng của nó trong thế giới thực. Chủ đề chính của ISDA’23 là ứng dụng của các mô hình ngôn ngữ lớn và tạo sinh trong thế giới thực.

Thông tin chi tiết: https://www.facebook.com/UIT.Fanpage/posts/pfbid025YnynHGuk1YQB52YBoFrGxkdg3KDxSS9VJdTRn7qgXLBKx3rJCWcvcG6qNYcT7dvl

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin