Aug 22, 2024
# Lược đồ Winograd và Xử lý Ngôn ngữ Tự nhiên
## Tổng quan về Lược đồ Winograd
- Một bài kiểm tra khả năng xử lý ngôn ngữ của máy tính.
- Xác định liệu máy có thể hiểu ngữ cảnh để nhận diện các đại diện được nhắm tới trong câu hay không.
- Ví dụ: "Chiếc cúp không vừa với vali nâu vì nó quá lớn."
- **Câu hỏi quan trọng**: Cái gì quá lớn?
## Hiểu Ngữ cảnh trong Ngôn ngữ
- Con người xuất sắc trong việc nhận biết đại diện từ ngữ cảnh nhờ:
- Kiến thức về cú pháp và ngữ pháp.
- Kinh nghiệm thực tế với các vật thể (vali, cúp).
- Hiểu biết yêu cầu phải hiểu mối quan hệ và kích thước.
## Nguồn gốc của Lược đồ Winograd
- Được đề xuất bởi Terry Winograd vào năm 1972.
- Ví dụ: "Hội đồng thành phố từ chối cấp phép cho người biểu tình vì họ 'sợ bạo lực' hoặc vì họ 'ủng hộ cuộc cách mạng'."
- Hiểu ngữ cảnh chính trị và vai trò của hội đồng thành phố.
- Nhấn mạnh cách các đại diện thay đổi theo ngữ cảnh.
## Sự Mơ Hồ trong Ngôn ngữ
- Một số câu mơ hồ ngay cả với con người, đặc biệt khi dùng các đại từ giống hệt.
- Những thử thách xảy ra trong viết lách (ví dụ, truyện tình cảm đồng tính).
- Các nhà văn thiếu kinh nghiệm có thể sử dụng hoán dụ, có thể gây ra sự lúng túng.
- Các nhà văn có kinh nghiệm sử dụng ngữ cảnh và cấu trúc để tránh nhầm lẫn.
## Lược đồ Winograd so với Sự Hiểu Biết của Máy Tính
- Lược đồ Winograd hướng tới việc dễ dàng cho con người nhưng thách thức cho máy tính.
- Tình trạng hiện tại của Xử lý Ngôn ngữ Tự nhiên (NLP):
- Nhu cầu cao cho việc hiểu ngôn ngữ (ví dụ, Siri, Alexa).
- Nhiều hệ thống NLP dựa vào trích xuất từ khóa, không hiệu quả với lược đồ Winograd.
- Ví dụ: "Tôi trải khăn trên bàn để bảo vệ nó."
- Mơ hồ mà không có ngữ cảnh.
## Giới Hạn của Công Nghệ AI Hiện Tại
- Future Tom tham chiếu đến các tiến bộ trong hệ thống học máy GPT-2.
- Ngay cả những mô hình tiên tiến cũng gặp khó khăn với ngữ cảnh và sự hiểu biết.
- Ví dụ: Tường thuật do AI tạo ra xung quanh vali và chiếc cúp.
- Làm nổi bật những giới hạn trong việc hiểu và lý luận.
## Vấn Đề với Sự Mơ Hồ của Từ Loại
- Từ có thể thay đổi chủng loại dựa vào ngữ cảnh (ví dụ, "chính").
- Hiểu những biến thể này đòi hỏi kinh nghiệm con người.
## Giải Pháp Hiện Tại và Triển Vọng Tương Lai
- Thừa nhận rằng AI hiện tại (ví dụ, Siri) có những giới hạn.
- Đề xuất gắn thẻ dữ liệu thủ công để giúp cải thiện khả năng học của chương trình.
- Xử lý ngôn ngữ nhân tạo vẫn được coi là cách xa một thập kỷ để đạt được sự hiểu biết như con người.
## Nguồn Tham Khảo Thêm
- Đề cập đến podcast "Lingthusiasm" bởi đồng tác giả Gretchen McCulloch, được liên kết trong mô tả.