PDA

View Full Version : Hỏi về dsPIC30f6014 với nhận dạng tiếng nói


highland81
31-03-2008, 01:54 AM
Chào các bạn!
Mình đang làm về đề tài nhận dạng tiếng nói sử dụng dsPIC30F6014. Mục đích của mình là sử dụng kit dsPICDEM 1.1 Development Board để nhận dạng hai từ "Đóng" và "Cắt" để điều khiển đèn Led, với tham số đặc trưng của tiếng nói phân tích là các hệ số MFCC và mô hình nhận dạng là HMM. Qua tìm hiểu về code mẫu của nhận dạng tiếng nói là file ASR_demo mình thấy có thể thay thế các giá trị của các vecto đặc trưng (feature vector) có sẵn trong đó bằng các vecto (MFCC) mà mình đã phân tích liệu có được không?Các bạn nào đã làm rồi xin chỉ dẫn cho đôi điều! Cảm ơn rất nhiều.

fanmoto
05-04-2008, 07:09 PM
Chào bạn ! Mình cũng đang "loay hoay" với cái đề tài này,chỉ khác là mình phải tự xây dựng mạch.Mình chưa hiểu ý định của bạn lắm nhưng theo như mình biết thì ASR_demo sử dụng các hàm trong thư viện "Speech Recognition Word Library".Thư viện này hỗ trợ các ứng dụng nhận dạng tiếng nói(English only) với các từ nhận dạng nằm trong một tập đã có sẵn gọi là "Master Word Library"(gồm 100 từ đã được liệt kê trong tài liệu đi kèm).Để sử dụng thư viện bạn cần tạo một file chứa mã ASCII của các từ nhận dạng nằm trong tập Master Word và một file lưu Vector Codebook và mô hình HMM của các từ tương ứng.Hai file này mình không chỉnh sửa bằng tay được mà phải dùng một phần mềm riêng là "Microchip Speech Recognition Word Library Builder"(chạy trên windows).
Với ASR_demo thì họ đã tạo sẵn các file là "demoLib_int.s" và "demoLib_voc.s".Và do đó nó chỉ có thể nhận dạng được các từ đó là :

CONTROL ,// word 1 (keyword)
ALARM ,// word 2
LIGHT ,// word 3
OFF ,// word 4
ONE ,// word 5
SECURITY ,// word 6
START ,// word 7
TEMPERATURE ,// word 8
THREE ,// word 9
TWO ,// word 10

Mình cũng chỉ biêt có vậy thôi.Mong các bạn quan tâm cùng trao đổi.

highland81
07-04-2008, 02:52 AM
Chào bạn!
Cảm ơn bạn đã trao đổi cùng. Đây là đề tài có vẻ khá mới cho nên ít nguồn tài liệu trên mạng (mình nghĩ vậy). Mình cũng đang cố tìm cái Speech Recognition Library Builder mà chưa tìm được! Như bạn đã nói thì không thể modify cái code mẫu của thư viện bằng tay được vì vậy mình phải tự xây dựng cái thư viện cho các từ của mình mà cái này lại cần phải sử dụng Speech Recognition Library Builder.
Mình đang làm về nhận dạng từ riêng biệt (isolated word) dựa trên các hệ số MFCC mình phân tích từ các file.wav thu âm, và từ các hệ số này dùng mô hình HMM để nhận dạng ra từ đó. Nếu bạn cũng đang làm về đề tài này rất vui được trao đổi cùng bạn.
Thân mến!

kstn
04-07-2008, 10:09 AM
Tôi và bạn tôi đã xây dựng đc 1 kit dùng dsPic30f6014 để nhận dạng từ đơn. Chúng tôi làm cả mạch adc đọc từ micro và nhận dạng sử dụng mô hình filter bank + giải thuật VQ. Kết quả bước đầu cũng nhận dạng tốt khoảng 3 từ. Tuy nhiên vấn đề chúng tôi gặp phải là thiếu RAM. Không biết bạn đã đạt đc những kết quả gì.Nếu bạn viết được giải thuật HMM hay LPC bằng C thì rất đáng tham khảo.

kstn
04-07-2008, 10:16 AM
Tôi nghĩ chỉ nhận dạng 2 từ Đóng & Cắt thôi thì hơi lãng phí sức mạnh của con 6014. Bạn có thể nhận dạng 2 tử bằng cách tính hàm năng lượng thời gian ngắn hoặc tính khoảng cách Ơclit so với 1 mẫu chuẩn. Những mô hình như HMM người ta dùng cho nhận dạng nhiều âm hay connected word. Dù sao nếu bạn làm đc thì có thể mở rộng ra nhiều từ.