Published Paper
2277-7970
International Journal of Advanced Computer Research
Cải tiến mô hình không gian vector TF/IDF bằng các quan hệ từ vựng
Minh Chau Huynh; Pham Duy Thanh Le; Trong Hai Duong
DOI:
Từ khoá:
TF-IDF, Vector Space Model, Lexical Relations, Information Retrieval
Tóm tắt
Mô hình không gian vector hiện tại, ví dụ TF/IDF, vẫn chưa tính đến các quan hệ giữa các thuật ngữ; mô hình này chỉ kết hợp tần suất thuật ngữ trong một tài liệu với tần suất tài liệu nghịch đảo trên toàn bộ cơ sở dữ liệu để xác định điểm tầm quan trọng (trọng số) của một thuật ngữ đối với tài liệu. Tại đây, chúng tôi khám phá các quan hệ từ vựng giữa các thuật ngữ trong tài liệu nhằm cải tiến mô hình không gian vector TF/IDF. Trọng số sinh ra từ TF/IDF cho mỗi thuật ngữ được cải tiến nhờ các quan hệ từ vựng giữa các thuật ngữ liên quan trong tài liệu. Chúng tôi đánh giá phương pháp đề xuất bằng các tài liệu được chọn từ Wikipedia. Kết quả cho thấy phương pháp đề xuất có hiệu quả đáng kể.
Minh Chau Huynh; Pham Duy Thanh Le; Trong Hai Duong (2015), "Cải tiến mô hình không gian vector TF/IDF bằng các quan hệ từ vựng", International Journal of Advanced Computer Research , 5, (21), pp. 334-346

