top of page

Published Paper

2345-2773

Journal of Information and Telecommunication

Journal of Information and Telecommunication

EREL: Thuật toán Nhận dạng và Liên kết Thực thể

Nguyen Cuong Duc, and Trong Hai Duong

DOI:
Từ khoá:

Entity Recognition, Entity Linking, Natural Language Processing, Algorithm

Dương Trọng Hải

Hải Dương

Tóm tắt

Bài báo này giới thiệu thuật toán EREL tích hợp Nhận dạng Thực thể, Giải quyết Đồng tham chiếu (CR) và Khử nhập nhằng. Thuật toán nhận dạng các đề cập thực thể theo tên dài nhất dựa trên từ điển tên được xây dựng từ dữ liệu Wikipedia. CR được tích hợp vào thuật toán để cải thiện hiệu suất xử lý tên viết tắt hoặc rút gọn. Thuật toán sử dụng phương pháp mới trong khử nhập nhằng thực thể bằng cách sử dụng các đặc trưng mới như thông tin ngữ cảnh cấp thực thể và dữ liệu phân biệt chữ hoa/thường về đề cập trong khử nhập nhằng. Được kiểm tra trên bốn tập dữ liệu chuẩn trong khung GERBIL, EREL vượt trội so với các phương pháp Liên kết Thực thể hiện tại. EREL đạt điểm f vi mô là 0,83 trong cả hai nhiệm vụ Khử nhập nhằng theo Wikipedia và Chú thích theo Wikipedia.

Nguyen Cuong Duc, and Trong Hai Duong (2018), "EREL: Thuật toán Nhận dạng và Liên kết Thực thể", Journal of Information and Telecommunication , 2, (1), pp. 33-52, DOI: 10.1080/24751839.2017.1372073

bottom of page