99久久国产综合精品五月天-午夜福利在线一区亚洲-久久婷婷丁香七月色综合-日韩免费一区免费二区

服務(wù)熱線:400-0033-166
萬商云集 - 企業(yè)數(shù)字化選用平臺

企業(yè)首選的

數(shù)字選用平臺

DeepMind最近做了個新軟件 它能讀懂唇語

2016-11-10 08:34:33 閱讀(765 評論(0)


AlphaGo背后的DeepMind最近有了新動向,它與哈佛大學(xué)的研究人員合作研發(fā)出了一套可以讀懂唇語的軟件。


在哈佛大學(xué)最新發(fā)表的論文中,他們研發(fā)的這個唇語閱讀軟件LipNet準(zhǔn)確率高達(dá)93.4%。這個準(zhǔn)確率遠(yuǎn)高于此前研發(fā)出來的其他唇語設(shè)備。


哈佛大學(xué)的研究人員稱,這是因為他們采用了不同的方法來訓(xùn)練LipNet的算法。為了讓它能更準(zhǔn)確的理解唇語,他們給計算機(jī)輸入了近3萬個帶有情境的視頻片段,每個片段有3秒時長,然后訓(xùn)練算法去匹配每個片段中每條句子對應(yīng)的唇形和發(fā)音,而不是讓其匹配每個單詞的唇形和發(fā)音。


DeepMind最近做了個新軟件 它能讀懂唇語


通過這個訓(xùn)練,他們的算法就能根據(jù)上下文情境,從單個單詞的提示就能預(yù)測出整個句子。


但論文中提到如此高的準(zhǔn)確率也遭受了質(zhì)疑。因為在該研究中,他們用來訓(xùn)練算法使用的視頻片段是經(jīng)過精心挑選的。


這些視頻中的人臉必須面向屏幕,說話時唇形要很明顯,而使用的句法必須是標(biāo)準(zhǔn)的。但在真實的語言環(huán)境下,人們說話時所使用的句法并不是完全標(biāo)準(zhǔn)的。


Open AI的人工智能方面的專家Jack Clark稱,如果要想將這項技術(shù)應(yīng)用到實際情境中,至少還需要在三個方面進(jìn)行改進(jìn),包括增加人們實際對話場景的視頻片段,實現(xiàn)多個角度識別唇語以及讓算法能預(yù)測更多的短語組合或句式。


他還提到稱,如果能在實際情境下應(yīng)用,它會很有用,比如用到助聽器中,或者被用來提高人工智能識別語音的準(zhǔn)確度和反應(yīng)速度上。


也有批評認(rèn)為,它的應(yīng)用也對公民的言論自由造成了威脅。


不過目前來看,這一切現(xiàn)在看起來還有點遠(yuǎn)。


未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明出處