Please use this identifier to cite or link to this item: http://tainguyenso.dut.udn.vn/handle/DUT/367
Title: Phân loại văn bản tin tức dùng máy vec-tơ hỗ trợ
Other Titles: Classification of news text using support vector machine
Authors: Ngô, Hải Nam
Keywords: Học máy;Phân loại văn bản;Máy học Supprt vector machine (SVM);Khai phá dữ liệu văn bản
Issue Date: 2019
Publisher: Trường Đại học Bách khoa - Đại học Đà Nẵng
Abstract: 
Luận văn này thực hiện nghiên cứu, đánh giá việc phân loại văn bản tin tức dựa trên phương pháp máy học Support vector machine (SVM) cùng với sự kết hợp giữa biểu diễn văn bản bằng mô hình túi từ BoW (Bag-of-Words) và thuật toán TF-TDF (Term frequency – Inverse document frequency). Một số phương pháp máy học và khai phá dữ liệu văn bản phổ biến được áp dụng để huấn luyện tập dữ liệu cho phân loại văn bản như SVM, Bayes đơn giản (Naïve Bayes), Cây quyết định (Decision tree).
Quá trình thực nghiệm phân loại văn bản tin tức với tập dữ liệu hơn 10.000 tin tức trong nhiều chủ đề được tổng hợp từ các nguồn báo chí trên Internet. Tập dữ liệu huấn luyện được trích xuất và tóm gọn trong một số chủ đề chính như: Thế giới, Giáo dục, Sức khỏe, Khoa học-Công nghệ…Kết quả thực nghiệm bước đầu đã khẳng định tính khả thi của mô hình khi kết quả phân loại đạt được độ chính xác khoảng 87%.
Description: 
Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 54 trang
URI: http://tainguyenso.dut.udn.vn/handle/DUT/367
Appears in Collections:LV.Khoa học máy tính

Files in This Item:
File Description SizeFormat Existing users please Login
NgoHaiNam.TT.pdfTóm tắt1.06 MBAdobe PDF
    Request a copy
NgoHaiNam.TV.pdfToàn văn4.3 MBAdobe PDF
    Request a copy
Show full item record

CORE Recommender

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.