DSpace

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: http://tainguyenso.dut.udn.vn/handle/DUT/512
Nhan đề: Xây dựng hệ thống tự động phân loại văn bản tiếng Lào
Nhan đề khác: Automatic Lao Text Classification System
Tác giả: Phommaseng, Phanakhone
Người hướng dẫn: Đặng, Hoài Phương, TS
Từ khoá: Phân loại văn bản
Tách từ
Biểu thức chính quy
Tiếng Lào
Naïve Bayes
Năm xuất bản: 2018
Nhà xuất bản: Trường Đại học Bách khoa - Đại học Đà Nẵng
Tóm tắt: Hiện nay, công trình nghiên cứu phân loại văn bản tiếng Lào còn hạn chế, chủ yếu dựa trên máy vector hỗ trợ và mạng hàm bán kính xuyên tâm cơ sở. Phương pháp tách từ, trong các công trình nghiên cứu nói trên, hầu hết vẫn tồn tại vấn đề về việc xử lý nhập nhằng của tiếng Lào. Vì tiếng Lào có nhiều cách viết, cách nói và sử dụng từ không thống nhất, đặc biệt là đặc trưng của tiếng Lào không có dấu cách giữa các từ, do đó việc tách từ tiếng Lào sẽ rất khó khăn. Để khắc phục những hạn chế, tác giả đề xuất đề tài: “Xây dựng hệ thống tự động phân loại văn bản tiếng Lào” bằng cách biểu diễn văn bản thành vector các từ khóa, áp dụng Regular Expression kết hợp với khuôn mẫu từ đơn để tách từ đơn, ghép lại những từ đơn thành từ phức có từ dài nhất dựa trên tập từ phức, đồng thời sử dụng phương pháp Naïve Bayes để phân loại văn bản tiếng Lào.
Mô tả: Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 67 trang
Định danh: http://tainguyenso.dut.udn.vn/handle/DUT/512
Bộ sưu tập: LV.Khoa học Máy tính
LV.Khoa học Máy tính

Các tập tin trong tài liệu này:
Tập tin Mô tả Kích thước Định dạng  
PhommasengPhannakhone.TT.pdf.pdfTóm tắt1.22 MBAdobe PDFbook.png
 Đăng nhập để xem toàn văn
PhommasengPhannakhone.TV.pdf.PDFToàn văn2.38 MBAdobe PDFbook.png
 Đăng nhập để xem toàn văn


Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.

Google Scholar TM

Kiểm tra...