top of page

Published Paper

2277-7970

International Journal of Advanced Computer Research

International Journal of Advanced Computer Research

Cải tiến mô hình không gian vector TF/IDF bằng các quan hệ từ vựng

Minh Chau Huynh; Pham Duy Thanh Le; Trong Hai Duong

DOI:
Từ khoá:

TF-IDF, Vector Space Model, Lexical Relations, Information Retrieval

Dương Trọng Hải

Hải Dương

Tóm tắt

Mô hình không gian vector hiện tại, ví dụ TF/IDF, vẫn chưa tính đến các quan hệ giữa các thuật ngữ; mô hình này chỉ kết hợp tần suất thuật ngữ trong một tài liệu với tần suất tài liệu nghịch đảo trên toàn bộ cơ sở dữ liệu để xác định điểm tầm quan trọng (trọng số) của một thuật ngữ đối với tài liệu. Tại đây, chúng tôi khám phá các quan hệ từ vựng giữa các thuật ngữ trong tài liệu nhằm cải tiến mô hình không gian vector TF/IDF. Trọng số sinh ra từ TF/IDF cho mỗi thuật ngữ được cải tiến nhờ các quan hệ từ vựng giữa các thuật ngữ liên quan trong tài liệu. Chúng tôi đánh giá phương pháp đề xuất bằng các tài liệu được chọn từ Wikipedia. Kết quả cho thấy phương pháp đề xuất có hiệu quả đáng kể.

Minh Chau Huynh; Pham Duy Thanh Le; Trong Hai Duong (2015), "Cải tiến mô hình không gian vector TF/IDF bằng các quan hệ từ vựng", International Journal of Advanced Computer Research , 5, (21), pp. 334-346

bottom of page