Please use this identifier to cite or link to this item:
http://tainguyenso.dut.udn.vn/handle/DUT/386
Title: | Phân loại văn bản dựa trên CNC | Other Titles: | Convolutional noron network | Authors: | Trần, Thị Thúy Hà | Keywords: | Phân loại văn bản;Mạng nơ ron tích chập;Xử lý dữ liệu;Nhúng từ;Siêu tham số. | Issue Date: | 2021 | Publisher: | Trường Đại học Bách khoa - Đại học Đà Nẵng | Abstract: | Hiện nay, số lượng văn bản quá lớn, sử dụng phương pháp phân loại dữ liệu thủ công là điều không khả thi bởi có vô số văn bản cần phân loại. Mặt khác máy tính chỉ có thể hiểu được dữ liệu đầu vào ở dạng số mà phần lớn lượng thông tin hiện nay lại ở dạng văn bản – một dạng của ngôn ngữ tự nhiên nên vấn đề đặt ra ở đây là làm sao để chuyển dữ liệu ở dạng ký tự về dữ liệu dạng số sau đó tổ chức huấn luyện máy tính có thể hiểu để phân loại thông tin có hiệu quả cao nhất, nhanh chóng phân loại được thông tin theo thể loại đã định trước. Trước hết đã là bài toán phân loại thì chúng ta có thể dùng các thuật toán phân loại như: Naive Bayes, Decision Tree (Random Forest), Véc tơ Support Machine (SVM), Convolution Nơron Network (CNN), Recurrent Nơron Network (RNN)… Theo một số khảo sát, nghiên cứu thì kỹ thuật mạng Nơron tích chập - CNN được đánh giá là có độ chính xác tốt với tính nhất quán dữ liệu khá cao và vượt trội hơn các kỹ thuật khác ở thời gian huấn luyện dữ liệu. |
Description: | Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 83 tr |
URI: | http://tainguyenso.dut.udn.vn/handle/DUT/386 |
Appears in Collections: | LV.Khoa học máy tính |
Files in This Item:
File | Description | Size | Format | Existing users please Login |
---|---|---|---|---|
TranThiThuyHa.TT.PDF | Tóm tắt | 573.12 kB | Adobe PDF | Request a copy |
TranThiThuyHa.TV.PDF | Toàn văn | 6.09 MB | Adobe PDF | Request a copy |
CORE Recommender
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.