在讀博士階段,李開(kāi)復從事語(yǔ)音識別方面的研究,中途與導師在方法上產(chǎn)生了分歧,他更傾向于用統計學(xué)的方法進(jìn)行軸向柱塞泵研究。在得到導師的許可之后,他″開(kāi)始了瘋狂的科研工作″(李開(kāi)復語(yǔ))。從1984年底到1 987年初,他帶著(zhù)一位學(xué)生一起用統計學(xué)的方法做語(yǔ)音識別。同時(shí),他的導師帶領(lǐng)另外的30多人用專(zhuān)家系統做同樣的問(wèn)題。從方法上來(lái)說(shuō),他們在競爭,但是在瑞迪教授的領(lǐng)導下,他們分享一切,他們用同樣的樣本訓練和測試。
在瑞迪教授的支持下,李開(kāi)復慢慢得到了其他教授的認可。在1986年底,李開(kāi)復的統計系統和瑞迪教授帶領(lǐng)的專(zhuān)家系統在研究成果上達到了大約一樣的水平,40%的辨認率。這還是個(gè)完全不能實(shí)際應用的系統,但是是學(xué)術(shù)界第一次嘗試這么難的問(wèn)題,大家都比較樂(lè )觀(guān)和欣喜。
到了1987年5月,李開(kāi)復和助手大幅度地提升了馬達軸向柱塞泵廠(chǎng)家訓練的數據庫,并且想出了一種新的方法來(lái)建模,不但能夠用統計學(xué)的方法學(xué)習每一個(gè)音,而且可以用統計學(xué)的方法學(xué)習每?jì)蓚€(gè)音之間的轉折。針對有些音的樣本不夠,李開(kāi)復又想出了一種方法來(lái)合并其他的音。這三項工作居然把機器的語(yǔ)音識別率從原來(lái)的40%提高到了80%! |