DSpace

Please use this identifier to cite or link to this item: http://tainguyenso.dut.udn.vn/handle/DUT/2775
Title: Phân loại văn bản dựa trên CNC
Other Titles: Convolutional noron network
Authors: Trần, Thị Thúy Hà
Advisor: Võ, Trung Hùng, PGS.TS
Keywords: Phân loại văn bản
Mạng nơ ron tích chập
Xử lý dữ liệu
Nhúng từ
Siêu tham số.
Issue Date: 2021
Publisher: Trường Đại học Bách khoa - Đại học Đà Nẵng
Abstract: Hiện nay, số lượng văn bản quá lớn, sử dụng phương pháp phân loại dữ liệu thủ công là điều không khả thi bởi có vô số văn bản cần phân loại. Mặt khác máy tính chỉ có thể hiểu được dữ liệu đầu vào ở dạng số mà phần lớn lượng thông tin hiện nay lại ở dạng văn bản – một dạng của ngôn ngữ tự nhiên nên vấn đề đặt ra ở đây là làm sao để chuyển dữ liệu ở dạng ký tự về dữ liệu dạng số sau đó tổ chức huấn luyện máy tính có thể hiểu để phân loại thông tin có hiệu quả cao nhất, nhanh chóng phân loại được thông tin theo thể loại đã định trước. Trước hết đã là bài toán phân loại thì chúng ta có thể dùng các thuật toán phân loại như: Naive Bayes, Decision Tree (Random Forest), Véc tơ Support Machine (SVM), Convolution Nơron Network (CNN), Recurrent Nơron Network (RNN)… Theo một số khảo sát, nghiên cứu thì kỹ thuật mạng Nơron tích chập - CNN được đánh giá là có độ chính xác tốt với tính nhất quán dữ liệu khá cao và vượt trội hơn các kỹ thuật khác ở thời gian huấn luyện dữ liệu.
Description: Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 83 tr
URI: http://tainguyenso.dut.udn.vn/handle/DUT/2775
Appears in Collections:LV.Khoa học Máy tính

Files in This Item:
File Description SizeFormat 
TranThiThuyHa.TT.PDFTóm tắt573.12 kBAdobe PDFbook.png
 Sign in to read
TranThiThuyHa.TV.PDFToàn văn6.09 MBAdobe PDFbook.png
 Sign in to read


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Google Scholar TM

Kiểm tra...