DSpace

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: http://tainguyenso.dut.udn.vn/handle/DUT/713
Nhan đề: Ứng dụng cây hậu tố để so khớp độ giống nhau giữa các tài liệu
Nhan đề khác: Application suffix tree to match the similarity between documents
Tác giả: Huỳnh, Thị Xuân Diệu
Người hướng dẫn: Nguyễn, Thanh Bình, PGS.TS
Từ khoá: Cây hậu tố
Độ tương đồng văn bản
Bài toán tách câu
Khoảng cách Jaro
Thuật toán Ukkonen
Năm xuất bản: 2018
Nhà xuất bản: Trường Đại học Bách khoa - Đại học Đà Nẵng
Tóm tắt: Cây hậu tố là một cấu trúc dữ liệu quan trọng được sử dụng trong rất nhiều thuật toán xử lý xâu. Sức mạnh của cây hậu tố nằm ở khả năng biểu diễn tất cả các hậu tố của một xâu và cung cấp nhiều phép toán quan trọng giúp nâng cao tính hiệu quả của những thuật toán. Chính nhờ những tính chất đó mà cây hậu tố được sử dụng rất nhiều trong các lĩnh vực khác nhau như: xử lý văn bản, trích chọn và tìm kiếm thông tin, phân tích dữ liệu sinh học, đối sánh mẫu, nén dữ liệu… Để đánh giá mức độ giống nhau của văn bản, thường sử dụng các phép đo độ tương tự giữa các văn bản. Sự tương đồng giữa hai văn bản là sự giống nhau về nội dung giữa hai văn bản đó. Do đó, hai văn bản là bản sao hoặc gần giống nhau thì sẽ có nội dung giống nhau nhiều, hay độ tương đồng giữa hai văn bản là cao. Luận văn tập trung nghiên cứu, đề xuất phương pháp so sánh văn bản dựa trên cây hậu tố để ứng dụng trong bài toán tính độ tương đồng văn bản, cụ thể là đánh giá mức độ giống nhau của hai văn bản và của một văn bản truy vấn so với tập văn bản mẫu trong kho dữ liệu.
Mô tả: Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 71 trang
Định danh: http://tainguyenso.dut.udn.vn/handle/DUT/713
Bộ sưu tập: LV.Khoa học Máy tính

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
HuynhThiXuanDieu.TT.pdfTóm tắt464.91 kBAdobe PDFbook.png
 Đăng nhập để xem toàn văn
HuynhThiXuanDieu.TV.pdfToàn văn5.02 MBAdobe PDFbook.png
 Đăng nhập để xem toàn văn


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.

Google Scholar TM

Kiểm tra...