DSpace

Please use this identifier to cite or link to this item: http://tainguyenso.dut.udn.vn/handle/DUT/512
Title: Xây dựng hệ thống tự động phân loại văn bản tiếng Lào
Other Titles: Automatic Lao Text Classification System
Authors: Phommaseng, Phanakhone
Advisor: Đặng, Hoài Phương, TS
Keywords: Phân loại văn bản
Tách từ
Biểu thức chính quy
Tiếng Lào
Naïve Bayes
Issue Date: 2018
Publisher: Trường Đại học Bách khoa - Đại học Đà Nẵng
Abstract: Hiện nay, công trình nghiên cứu phân loại văn bản tiếng Lào còn hạn chế, chủ yếu dựa trên máy vector hỗ trợ và mạng hàm bán kính xuyên tâm cơ sở. Phương pháp tách từ, trong các công trình nghiên cứu nói trên, hầu hết vẫn tồn tại vấn đề về việc xử lý nhập nhằng của tiếng Lào. Vì tiếng Lào có nhiều cách viết, cách nói và sử dụng từ không thống nhất, đặc biệt là đặc trưng của tiếng Lào không có dấu cách giữa các từ, do đó việc tách từ tiếng Lào sẽ rất khó khăn. Để khắc phục những hạn chế, tác giả đề xuất đề tài: “Xây dựng hệ thống tự động phân loại văn bản tiếng Lào” bằng cách biểu diễn văn bản thành vector các từ khóa, áp dụng Regular Expression kết hợp với khuôn mẫu từ đơn để tách từ đơn, ghép lại những từ đơn thành từ phức có từ dài nhất dựa trên tập từ phức, đồng thời sử dụng phương pháp Naïve Bayes để phân loại văn bản tiếng Lào.
Description: Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 67 trang
URI: http://tainguyenso.dut.udn.vn/handle/DUT/512
Appears in Collections:LV.Khoa học Máy tính
LV.Khoa học Máy tính

Files in This Item:
File Description SizeFormat 
PhommasengPhannakhone.TT.pdf.pdfTóm tắt1.22 MBAdobe PDFbook.png
 Sign in to read
PhommasengPhannakhone.TV.pdf.PDFToàn văn2.38 MBAdobe PDFbook.png
 Sign in to read


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Google Scholar TM

Kiểm tra...