Please use this identifier to cite or link to this item:
http://tainguyenso.dut.udn.vn/handle/DUT/307
Title: | Xây dựng hệ thống tự động phân loại văn bản tiếng Lào | Other Titles: | Automatic Lao Text Classification System | Authors: | Phommaseng, Phanakhone | Keywords: | Phân loại văn bản;Tách từ;Biểu thức chính quy;Tiếng Lào;Naïve Bayes | Issue Date: | 2018 | Publisher: | Trường Đại học Bách khoa - Đại học Đà Nẵng | Abstract: | Hiện nay, công trình nghiên cứu phân loại văn bản tiếng Lào còn hạn chế, chủ yếu dựa trên máy vector hỗ trợ và mạng hàm bán kính xuyên tâm cơ sở. Phương pháp tách từ, trong các công trình nghiên cứu nói trên, hầu hết vẫn tồn tại vấn đề về việc xử lý nhập nhằng của tiếng Lào. Vì tiếng Lào có nhiều cách viết, cách nói và sử dụng từ không thống nhất, đặc biệt là đặc trưng của tiếng Lào không có dấu cách giữa các từ, do đó việc tách từ tiếng Lào sẽ rất khó khăn. Để khắc phục những hạn chế, tác giả đề xuất đề tài: “Xây dựng hệ thống tự động phân loại văn bản tiếng Lào” bằng cách biểu diễn văn bản thành vector các từ khóa, áp dụng Regular Expression kết hợp với khuôn mẫu từ đơn để tách từ đơn, ghép lại những từ đơn thành từ phức có từ dài nhất dựa trên tập từ phức, đồng thời sử dụng phương pháp Naïve Bayes để phân loại văn bản tiếng Lào. |
Description: | Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 67 trang |
URI: | http://tainguyenso.dut.udn.vn/handle/DUT/307 |
Appears in Collections: | LV.Khoa học máy tính |
Files in This Item:
File | Description | Size | Format | Existing users please Login |
---|---|---|---|---|
PhommasengPhannakhone.TT.pdf.pdf | Tóm tắt | 1.22 MB | Adobe PDF | Request a copy |
PhommasengPhannakhone.TV.pdf.PDF | Toàn văn | 2.38 MB | Adobe PDF | Request a copy |
CORE Recommender
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.