MELP Vocoder được phát triển trong hai nhân dân tệ kích thích cơ sở mô hình LPC truyền thống. Nó được dựa trên mô hình LPC, nhưng với ưu đãi hỗn hợp trong các hình thức của việc cải thiện nguồn kích thích, do đó nó có thể phản ánh tốt hơn tính năng thoại. Thuật toán sử dụng được khoanh vùng kích thích hỗn hợp, xung không tuần hoàn, thích ứng bộ lọc nâng cao quang phổ và các xung rời rạc và công nghệ quan trọng khác để cải thiện tổng hợp âm thanh. Thuật toán đầu vào tiếng nói có các yêu cầu sau:
1) tỷ lệ lấy mẫu 8kHz, mỗi 180 điểm lấy mẫu với chiều dài khung là 22.5ms, mỗi khung hình là lượng tử hóa 54 bit, tổng tỷ lệ 2.4kbps.
2) Đề xuất hiệu chuẩn bài phát biểu đầu vào băng thông MELP Vocoder là 100 ~ 3800Hz. Mặc dù cũng là một tín hiệu rộng băng tần, nhưng hiệu suất có thể bị suy giảm.
3) mẫu A / D chuyển đổi tạo ra giữa -32.768-32.767, tức là mỗi giá trị mẫu với 16bit lượng tử. Ngoài ra, đầu vào Vocoder và tăng sản lượng để phù hợp, sao cho đầu ra của mức độ giọng nói và lời nói đầu vào phù hợp.
Ở tốc độ thấp, việc sử dụng tần số phổ vạch (LSF) và kỹ thuật lượng tử hóa vector, thuật toán MELP có thể được mã hóa với một số dự đoán 25bit tuyến tính. Bằng cách này, bạn có thể đến với nhiều tham số truyền động cơ-bit. MELP thông số kích thích bao gồm: Pitch, các thông số mô hình phân loại, dải tỷ lệ pha trộn, các thông số quang phổ sóng hài còn lại và đạt được. Bảng 2.1 là một phân bổ chút đồ MELP encoder [2].
phân tích MELP bằng sơ đồ khối tổng hợp thể hiện trong hình 2-2 [7]. Như có thể thấy từ hình, MELP Vocoder chia thành hai phần phân tích và tổng hợp. Analyzer để phân tích của các phân đoạn tín hiệu tiếng nói ban đầu, mỗi đoạn bằng giọng nói thông số tính năng khai thác và lượng tử hóa mã hóa, nhận được truyền đi hay lưu trữ các ký hiệu kỹ thuật số; tổng hợp sẽ cho kết quả phân tích giải mã được mã hóa bằng cách sử dụng các thông số của tín hiệu tiếng nói được xây dựng lại.
đang được dịch, vui lòng đợi..
