Please use this identifier to cite or link to this item:
http://tainguyenso.dut.udn.vn/handle/DUT/367
Title: | Phân loại văn bản tin tức dùng máy vec-tơ hỗ trợ | Other Titles: | Classification of news text using support vector machine | Authors: | Ngô, Hải Nam | Keywords: | Học máy;Phân loại văn bản;Máy học Supprt vector machine (SVM);Khai phá dữ liệu văn bản | Issue Date: | 2019 | Publisher: | Trường Đại học Bách khoa - Đại học Đà Nẵng | Abstract: | Luận văn này thực hiện nghiên cứu, đánh giá việc phân loại văn bản tin tức dựa trên phương pháp máy học Support vector machine (SVM) cùng với sự kết hợp giữa biểu diễn văn bản bằng mô hình túi từ BoW (Bag-of-Words) và thuật toán TF-TDF (Term frequency – Inverse document frequency). Một số phương pháp máy học và khai phá dữ liệu văn bản phổ biến được áp dụng để huấn luyện tập dữ liệu cho phân loại văn bản như SVM, Bayes đơn giản (Naïve Bayes), Cây quyết định (Decision tree). Quá trình thực nghiệm phân loại văn bản tin tức với tập dữ liệu hơn 10.000 tin tức trong nhiều chủ đề được tổng hợp từ các nguồn báo chí trên Internet. Tập dữ liệu huấn luyện được trích xuất và tóm gọn trong một số chủ đề chính như: Thế giới, Giáo dục, Sức khỏe, Khoa học-Công nghệ…Kết quả thực nghiệm bước đầu đã khẳng định tính khả thi của mô hình khi kết quả phân loại đạt được độ chính xác khoảng 87%. |
Description: | Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 54 trang |
URI: | http://tainguyenso.dut.udn.vn/handle/DUT/367 |
Appears in Collections: | LV.Khoa học máy tính |
Files in This Item:
File | Description | Size | Format | Existing users please Login |
---|---|---|---|---|
NgoHaiNam.TT.pdf | Tóm tắt | 1.06 MB | Adobe PDF | Request a copy |
NgoHaiNam.TV.pdf | Toàn văn | 4.3 MB | Adobe PDF | Request a copy |
CORE Recommender
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.