Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
http://tainguyenso.dut.udn.vn/handle/DUT/512
Nhan đề: | Xây dựng hệ thống tự động phân loại văn bản tiếng Lào |
Nhan đề khác: | Automatic Lao Text Classification System |
Tác giả: | Phommaseng, Phanakhone |
Người hướng dẫn: | Đặng, Hoài Phương, TS |
Từ khoá: | Phân loại văn bản Tách từ Biểu thức chính quy Tiếng Lào Naïve Bayes |
Năm xuất bản: | 2018 |
Nhà xuất bản: | Trường Đại học Bách khoa - Đại học Đà Nẵng |
Tóm tắt: | Hiện nay, công trình nghiên cứu phân loại văn bản tiếng Lào còn hạn chế, chủ yếu dựa trên máy vector hỗ trợ và mạng hàm bán kính xuyên tâm cơ sở. Phương pháp tách từ, trong các công trình nghiên cứu nói trên, hầu hết vẫn tồn tại vấn đề về việc xử lý nhập nhằng của tiếng Lào. Vì tiếng Lào có nhiều cách viết, cách nói và sử dụng từ không thống nhất, đặc biệt là đặc trưng của tiếng Lào không có dấu cách giữa các từ, do đó việc tách từ tiếng Lào sẽ rất khó khăn. Để khắc phục những hạn chế, tác giả đề xuất đề tài: “Xây dựng hệ thống tự động phân loại văn bản tiếng Lào” bằng cách biểu diễn văn bản thành vector các từ khóa, áp dụng Regular Expression kết hợp với khuôn mẫu từ đơn để tách từ đơn, ghép lại những từ đơn thành từ phức có từ dài nhất dựa trên tập từ phức, đồng thời sử dụng phương pháp Naïve Bayes để phân loại văn bản tiếng Lào. |
Mô tả: | Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 67 trang |
Định danh: | http://tainguyenso.dut.udn.vn/handle/DUT/512 |
Bộ sưu tập: | LV.Khoa học Máy tính LV.Khoa học Máy tính |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | |
---|---|---|---|---|
PhommasengPhannakhone.TT.pdf.pdf | Tóm tắt | 1.22 MB | Adobe PDF | Đăng nhập để xem toàn văn |
PhommasengPhannakhone.TV.pdf.PDF | Toàn văn | 2.38 MB | Adobe PDF | Đăng nhập để xem toàn văn |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.