Please use this identifier to cite or link to this item:
http://tainguyenso.dut.udn.vn/handle/DUT/319
Title: | Xây dựng nền tảng thu thập và xử lý dữ liệu tiếng nói | Other Titles: | Building the collecting and processing voice data system | Authors: | Lê, Tùng Dương | Keywords: | Xử lý dữ liệu tiếng nói;Tiếng Việt;Dữ liệu lớn;Thuật toán tính tỉ lệ tín hiệu trên nhiễu;Thuật toán VUS;Thuật toán WADA. | Issue Date: | 2020 | Publisher: | Trường Đại học Bách khoa - Đại học Đà Nẵng | Abstract: | Ở Việt Nam việc xử lý tiếng Việt đã có nhiều công trình nghiên cứu và thử nghiệm, tuy nhiên, các kết quả vẫn còn hạn chế. Ngoài ra, đất nước Việt Nam có nhiều vùng miền, dân tộc với giọng nói và âm điệu khác nhau, dẫn đến sự bất tiện khi giao tiếp bằng tiếng Việt giữa các vùng miền và dân tộc với nhau. Mục tiêu của luận văn này là nhằm xây dựng kho dữ liệu lớn phục vụ cho các nghiên cứu về xử lý tiếng nói tiếng Việt - một hệ thống theo mô hình client/server. Trong đó, phía client là app trên điện thoại di động thông minh cho phép thu thập dữ liệu tiếng nói và thông tin người cung cấp dữ liệu đơn giản và thuận tiện. Phía server là hệ thống lưu trữ tập trung, cho phép lưu trữ và quản lý số lượng lớn mẫu ghi âm tiếng nói và một số công cụ thuật toán cho phép hỗ trợ xử lý tiếng nói. Luận văn nghiên cứu những ý tưởng cơ bản và các phương pháp được sử dụng trong mô hình thu thập, lưu trữ và quản lý dữ liệu tiếng nói lớn, từ đó xây dựng một hệ thống phần mềm có khả năng thu thập dữ liệu tiếng nói phân tán, xử lý sơ bộ mẫu và lưu trữ dữ liệu sẵn sàng phục vụ xử lý tiếng nói theo phương pháp dữ liệu lớn. Nội dung thực hiện tập trung vào nghiên cứu, cài đặt và đánh giá hiệu quả thuật toán tính tỉ lệ tín hiệu trên nhiễu (SNR) của tín hiệu tiếng nói trên miền thời gian dùng để gán nhãn các tín hiệu tiếng nói thu thập được; đồng thời xây dựng hệ thống phần mềm nhằm thu thập CSDL tiếng nói phục vụ cho các nghiên cứu về xử lý tiếng nói. Kết quả của nghiên cứu này là một cơ sở dữ liệu tiếng nói lớn đã được gán nhãn với độ chính xác cao sẵn sàng phục vụ các hệ thống xử lý tiếng nói của người Việt trong tương lai. |
Description: | Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 82 trang |
URI: | http://tainguyenso.dut.udn.vn/handle/DUT/319 |
Appears in Collections: | LV.Khoa học máy tính |
Files in This Item:
File | Description | Size | Format | Existing users please Login |
---|---|---|---|---|
LeTungDuong.TT.PDF | Tóm tắt | 1.21 MB | Adobe PDF | Request a copy |
LeTungDuong.TV.PDF | Toàn văn | 7.6 MB | Adobe PDF | Request a copy |
CORE Recommender
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.