A New Feature to Improve Moore’s Sentence Alignment Method

Title: A New Feature to Improve Moore’s Sentence Alignment Method
Authors: Trieu, Hai-Long
Nguyen, Phuong-Thai
Nguyen, Le-Minh
Keywords: Sentence Alignment;Parallel Corpora;Word Clustering;Natural Language Processing
Issue Date: 2015
Publisher: H. : ĐHQGHN
Citation: p. 32-44
Series/Report no.: Vol. 31, No. 1;
URI: http://repository.vnu.edu.vn/handle/VNU_123/965
The sentence alignment approach proposed by Moore, 2002 (M-Align) is an effective method which gets a rela-tively high performance based on mbination of length-based and word correspondences. Nevertheless, despite the high precision, M-Align usually gets a low recall especially when dealing with sparse data problem. We pro-pose an algorithm which not only exploits advantages of M-Align but overcomes the weakness of this baseline method by using a new feature in sentence alignment, word clustering. Experiments shows an mprovement on the baseline method up to 30% recall while precision is reasonable.

Nhận xét

Bài đăng phổ biến từ blog này

Nghiên cứu về điều khiển truy cập sử dụng mô hình RBAC mở rộng

Tội bắt cóc nhằm chiếm đoạt tài sản trong luật hình sự Việt Nam

Trách nhiệm hình sự đối với các tội xâm phạm sở hữu không có tính chất chiếm đoạt tài sản trong Luật hình sự Việt Nam