"Rozpoznawanie sygnału mowy w obecności zakłóceń"
[badania własne]
Realizatorzy:
- dr hab. K. Ślot
- mgr inż. P. Korbel
Okres realizacji: 2003
Celem podjętych prac była analiza możliwości poprawy jakości rozpoznawania izolowanych słów języka polskiego, w warunkach istnienia zakłóceń pochodzących od innych mówców. Rozważaną drogą poprawy jakości rozpoznawania było odpowiednie wykorzystanie informacji pochodzącej z liniowej matrycy mikrofonów. Przyjętą metodą postępowania była próba modyfikacji metryki wykorzystywanej w algorytmie nieliniowego dopasowania czasowego, uzależniająca wynik porównania od pasma częstotliwości. Sformułowana hipoteza badawcza stanowiła, że możliwe będzie uzyskanie poprawy jakości rozpoznawania w wyniku wykorzystania częściowej przestrzennej separacji źródeł sygnału mowy, oferowanego przez charakterystykę liniowej matrycy mikrofonów. Dla sprawdzenia postawionej hipotezy zaproponowano modyfikację metryki używanej w rozpoznawaniu słów metodą DTW, zakładającą zmniejszenie znaczenia informacji pochodzącej z niskich pasm częstotliwości sygnału mowy. Efektem prowadzonych prac było uzyskanie bardzo nieznacznej poprawy jakości rozpoznawania, i w konsekwencji, stwierdzenie konieczności zastosowania bardziej złożonych metod analizy i przetwarzania sygnału mowy zakłócanego w rozważany sposób.