DSpace

Please use this identifier to cite or link to this item: http://tainguyenso.dut.udn.vn/handle/DUT/2280
Title: Xây dựng nền tảng thu thập và xử lý dữ liệu tiếng nói
Other Titles: Building the collecting and processing voice data system
Authors: Lê, Tùng Dương
Advisor: Ninh, Khánh Duy, TS
Keywords: Xử lý dữ liệu tiếng nói
Tiếng Việt
Dữ liệu lớn
Thuật toán tính tỉ lệ tín hiệu trên nhiễu
Thuật toán VUS
Thuật toán WADA.
Issue Date: 2020
Publisher: Trường Đại học Bách khoa - Đại học Đà Nẵng
Abstract: Ở Việt Nam việc xử lý tiếng Việt đã có nhiều công trình nghiên cứu và thử nghiệm, tuy nhiên, các kết quả vẫn còn hạn chế. Ngoài ra, đất nước Việt Nam có nhiều vùng miền, dân tộc với giọng nói và âm điệu khác nhau, dẫn đến sự bất tiện khi giao tiếp bằng tiếng Việt giữa các vùng miền và dân tộc với nhau. Mục tiêu của luận văn này là nhằm xây dựng kho dữ liệu lớn phục vụ cho các nghiên cứu về xử lý tiếng nói tiếng Việt - một hệ thống theo mô hình client/server. Trong đó, phía client là app trên điện thoại di động thông minh cho phép thu thập dữ liệu tiếng nói và thông tin người cung cấp dữ liệu đơn giản và thuận tiện. Phía server là hệ thống lưu trữ tập trung, cho phép lưu trữ và quản lý số lượng lớn mẫu ghi âm tiếng nói và một số công cụ thuật toán cho phép hỗ trợ xử lý tiếng nói. Luận văn nghiên cứu những ý tưởng cơ bản và các phương pháp được sử dụng trong mô hình thu thập, lưu trữ và quản lý dữ liệu tiếng nói lớn, từ đó xây dựng một hệ thống phần mềm có khả năng thu thập dữ liệu tiếng nói phân tán, xử lý sơ bộ mẫu và lưu trữ dữ liệu sẵn sàng phục vụ xử lý tiếng nói theo phương pháp dữ liệu lớn. Nội dung thực hiện tập trung vào nghiên cứu, cài đặt và đánh giá hiệu quả thuật toán tính tỉ lệ tín hiệu trên nhiễu (SNR) của tín hiệu tiếng nói trên miền thời gian dùng để gán nhãn các tín hiệu tiếng nói thu thập được; đồng thời xây dựng hệ thống phần mềm nhằm thu thập CSDL tiếng nói phục vụ cho các nghiên cứu về xử lý tiếng nói. Kết quả của nghiên cứu này là một cơ sở dữ liệu tiếng nói lớn đã được gán nhãn với độ chính xác cao sẵn sàng phục vụ các hệ thống xử lý tiếng nói của người Việt trong tương lai.
Description: Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 82 trang
URI: http://tainguyenso.dut.udn.vn/handle/DUT/2280
Appears in Collections:LV.Khoa học Máy tính

Files in This Item:
File Description SizeFormat 
LeTungDuong.TT.PDFTóm tắt1.21 MBAdobe PDFbook.png
 Sign in to read
LeTungDuong.TV.PDFToàn văn7.6 MBAdobe PDFbook.png
 Sign in to read


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Google Scholar TM

Kiểm tra...