Groupe de FVCL

Thông báo – Cập nhật [ngày 12 tháng 02 năm 2014]:

Trang này tập hợp các bài giảng, bài tập và tài liệu tham khảo nghiên cứu XLNNTN.

THÔNG BÁO CHUNG:
>> Thứ 3 hàng tuần họp nhóm trên H3.2.
>> Nhóm đọc về ngôn ngữ lập trình PYTHON (http://www.python.org) để áp dụng trong XLNNTN.
>> Báo cáo qua EMAIL cho Thầy về bài tập được ghi trên blog.
>> Nhóm báo cáo với Thầy về các câu hỏi đã được đặt ra và thống kê BLEU, NIST,… khi chạy Moses đối với Anh-Việt, Pháp-Việt, Anh-Pháp, đánh giá và nhận xét.
>> Cài đặt MOSES, áp dụng ngữ liệu FEVC được cung cấp ở link phía dưới.
>> Viết chương trình theo yêu cầu sau đây:
a) Hàm ghép các cặp câu song ngữ trong những tập tin song ngữ tương ứng theo định dạng sau đây:
* câu của ngôn ngữ A
+ câu của ngôn ngữ B
b) Hàm tách các cặp câu song ngữ và lưu lại các câu đơn ngữ trong những tập tin đơn ngữ tương ứng theo định dạng sau đây:
Giả sử: tập tin corpusFRVI.txt chứa các cặp câu song ngữ có định dạng sau:
* câu của ngôn ngữ A
+ câu của ngôn ngữ B
Kết quả mong muốn: tập tin corpusFR.txt chứa các câu FR có định dạng sau:
câu FR1
câu FR2
câu …..
Và tập tin corpusVI.txt chứa các câu FR có định dạng sau:
câu VI1
câu VI2
câu …..

——————————————–

Giáo trình : Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP)
Bài giảng và bài tập:
Câu hỏi lý thuyết về tổng quan XLNNTN
Bài tập 2 XLNNTN
Bài tập 3 XLNNTN
Bài tập 4 XLNNTN

*** Câu hỏi thêm:
1) Nêu các thành phần của Moses.
2) Tuning là gì ?

Corpus FEVC:
Ngữ liệu FEVC

Bài tập thực hành :
>> Tài liệu hướng dẫn cách cài đặt MOSES :
1) Công cụ MOSES slides (.ppt)
2) Ví dụ tham khảo (.doc)
——————————————–