Máy dịch (MT) đã trở thành cầu nối giúp mọi người tương tác với nội dung và giao tiếp bất chấp rào cản ngôn ngữ. Tuy nhiên, một thách thức lớn mà các hệ thống này gặp phải là sự phân biệt giới tính trong ngôn ngữ. Nhiều ngôn ngữ yêu cầu tính chính xác cho những cụm từ trung tính hoặc không rõ ràng, điều này tạo ra khó khăn trong việc đảm bảo bản dịch chính xác và phù hợp.
Ngôn ngữ phân giới (Gendered Languages) là gì?
Ngôn ngữ phân giới (Gendered Languages) là ngôn ngữ thể hiện sự khác biệt giới tính thông qua cách sử dụng từ ngữ, ngữ pháp hoặc cách diễn đạt. Đây là một đặc điểm phổ biến trong nhiều ngôn ngữ trên thế giới và có thể phản ánh hoặc củng cố các quan niệm văn hóa về giới tính.
Khó khăn khi biên dịch ngôn ngữ phân giới
Biên dịch các gendered languages (ngôn ngữ có phân biệt giới tính) thường mang lại nhiều khó khăn do sự khác biệt về cấu trúc ngôn ngữ và văn hóa. Các trở ngại thường gặp có thể kể đến:
- Có thể bị mất đi ý nghĩa khi được biên dịch sang ngôn ngữ trung lập về giới
- Cần phải chọn giới tính phù hợp với ngữ cảnh khi biên dịch từ ngôn ngữ trung lập sang ngôn ngữ phân giới
- Một số từ được phân giới do gắn với các định kiến xã hội
- Một số cụm từ không có tương đương trực tiếp tới ngôn ngữ đích
Khi không có các dấu hiệu ngữ cảnh, như trong việc dịch một câu đơn, mô hình phiên dịch thường gặp khó khăn trong việc xác định hình thức giới tính chính xác. Điều này đặc biệt phổ biến trong nhiều ngôn ngữ châu Âu, nơi thường xác định giới cho các từ như “trẻ em”, “bạn bè” và “thành viên”, bên cạnh các chức danh nghề nghiệp.
Giải pháp được Apple nghiên cứu
Mới đây, Apple đã cho ra mắt Generating Gender Alternatives trong MT tại GeBNLP 2024. Phương pháp này sẽ cung cấp cho người dùng toàn bộ các phiên bản phân giới của ngôn ngữ đích. Ví dụ: để dịch câu “Tôi là giáo viên, học sinh của tôi rất chăm chỉ và tôi rất thương các em từ Tiếng Anh sang Tiếng Tây Ban Nha sẽ có 3 phiên bản phụ thuộc vào giới tính của người nói (nam – nữ – trung tính).
Điều này giúp người dùng có thể dễ dàng điều chỉnh chính xác cách dịch các thuật ngữ có giới tính mà không cần phải thêm bất kỳ thành phần nào. Nhờ đó, người dùng có thể dễ dàng lựa chọn phương án phù hợp nhất cho ngữ cảnh của mình. Tất cả các thuật ngữ và từ ngữ giới tính sẽ được cung cấp trong một lần dịch và chỉ sử dụng một công cụ duy nhất.
Ngoài ra, nghiên cứu được phát triển nhằm nâng cao trải nghiệm người dùng trong ứng dụng Translate của Apple. Phát hành đồng thời với IOS 17, tính năng “grammatical gender” (giới tính ngữ pháp) giúp cho người dùng có thể dễ dàng chọn giới tính phù hợp khi dịch từ tiếng Anh sang các ngôn ngữ phân giới.
Đặc biệt hơn, phương pháp này chỉ sử dụng một mô hình dịch duy nhất, không cần có sự trợ giúp từ các công cụ khác từ đó giúp tiết kiệm tài nguyên và thời gian cho người dùng. Không chỉ vậy, giải pháp này của Apple cũng đang sử dụng hệ thống đào tạo AI mở (open source research) cho phép mọi người cùng đóng góp và cải thiện tính năng của công cụ này.
Apple mang đến cho người dùng giải pháp giải quyết các vấn đề trong biên dịch ngôn ngữ phân giới. Công cụ Translate trong bản cập nhật IOS 17 đã có khả năng kiểm soát tốt hơn đối với các bản dịch, giúp người dùng dễ dàng lựa chọn từ ngữ thích hợp trong mọi tình huống.