Please use this identifier to cite or link to this item: http://tainguyenso.dut.udn.vn/handle/DUT/386
Title: Phân loại văn bản dựa trên CNC
Other Titles: Convolutional noron network
Authors: Trần, Thị Thúy Hà
Keywords: Phân loại văn bản;Mạng nơ ron tích chập;Xử lý dữ liệu;Nhúng từ;Siêu tham số.
Issue Date: 2021
Publisher: Trường Đại học Bách khoa - Đại học Đà Nẵng
Abstract: 
Hiện nay, số lượng văn bản quá lớn, sử dụng phương pháp phân loại dữ liệu thủ công là điều không khả thi bởi có vô số văn bản cần phân loại. Mặt khác máy tính chỉ có thể hiểu được dữ liệu đầu vào ở dạng số mà phần lớn lượng thông tin hiện nay lại ở dạng văn bản – một dạng của ngôn ngữ tự nhiên nên vấn đề đặt ra ở đây là làm sao để chuyển dữ liệu ở dạng ký tự về dữ liệu dạng số sau đó tổ chức huấn luyện máy tính có thể hiểu để phân loại thông tin có hiệu quả cao nhất, nhanh chóng phân loại được thông tin theo thể loại đã định trước. Trước hết đã là bài toán phân loại thì chúng ta có thể dùng các thuật toán phân loại như: Naive Bayes, Decision Tree (Random Forest), Véc tơ Support Machine (SVM), Convolution Nơron Network (CNN), Recurrent Nơron Network (RNN)… Theo một số khảo sát, nghiên cứu thì kỹ thuật mạng Nơron tích chập - CNN được đánh giá là có độ chính xác tốt với tính nhất quán dữ liệu khá cao và vượt trội hơn các kỹ thuật khác ở thời gian huấn luyện dữ liệu.
Description: 
Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 83 tr
URI: http://tainguyenso.dut.udn.vn/handle/DUT/386
Appears in Collections:LV.Khoa học máy tính

Files in This Item:
File Description SizeFormat Existing users please Login
TranThiThuyHa.TT.PDFTóm tắt573.12 kBAdobe PDF
    Request a copy
TranThiThuyHa.TV.PDFToàn văn6.09 MBAdobe PDF
    Request a copy
Show full item record

CORE Recommender

Page view(s) 10

1
checked on Nov 6, 2024

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.