3月14日,微軟宣布,其研發(fā)的機(jī)器翻譯系統(tǒng),在通用新聞報道測試集newstest2017的中英測試集上,達(dá)到了可與人工翻譯媲美的水平。這是首個在新聞報道的翻譯質(zhì)量和準(zhǔn)確率上可比肩人工翻譯的翻譯系統(tǒng)。
為了確保翻譯結(jié)果準(zhǔn)確且達(dá)到人類的翻譯水平,微軟研究團(tuán)隊邀請了雙語語言顧問,將微軟機(jī)翻結(jié)果與兩個不同的人工翻譯結(jié)果進(jìn)行比較。
微軟技術(shù)院士,負(fù)責(zé)微軟語音、自然語言和機(jī)器翻譯工作的黃學(xué)東稱,這是對自然語言處理領(lǐng)域最具挑戰(zhàn)性任務(wù)的一項重大突破?!霸跈C(jī)器翻譯方面達(dá)到與人類相同的水平是所有人的夢想,我們沒有想到這么快就能實現(xiàn)?!彼硎?,“消除語言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來為此付出的努力?!?/P>
微軟技術(shù)院士黃學(xué)東
機(jī)器翻譯是科研人員攻堅了數(shù)十年的研究領(lǐng)域,曾經(jīng)很多人都認(rèn)為機(jī)器翻譯根本不可能達(dá)到人類翻譯的水平。盡管此次突破意義非凡,但這仍不代表人類已經(jīng)完全解決了機(jī)器翻譯的問題,只能說離終極目標(biāo)又近了一步。
微軟機(jī)器翻譯團(tuán)隊研究經(jīng)理Arul Menezes解釋:當(dāng)一種語言(比如中-英)擁有較多的訓(xùn)練數(shù)據(jù),且翻譯的是常見的大眾類新聞詞匯時,人工智能加持下的機(jī)器翻譯表現(xiàn)可以與人類媲美。
近兩年來,深度神經(jīng)網(wǎng)絡(luò)的使用讓機(jī)器翻譯的表現(xiàn)取得了實質(zhì)性突破。相較于以往,機(jī)器翻譯結(jié)果變得更加自然流暢。
微軟將他們的最新研究成果——對偶學(xué)習(xí)(Dual Learning)和推敲網(wǎng)絡(luò)(Deliberation Networks)應(yīng)用在了此次取得突破的機(jī)器翻譯系統(tǒng)中。微軟亞洲研究院副院長、機(jī)器學(xué)習(xí)組負(fù)責(zé)人劉鐵巖介紹道,“這兩個技術(shù)的研究靈感其實都來自于我們?nèi)祟惖淖鍪路绞?。?/P>
其中,對偶學(xué)習(xí)使得中文句子翻譯成英文之后,系統(tǒng)會將相應(yīng)的英文結(jié)果再翻譯回中文,并與原始的中文句子進(jìn)行比對。從這個比對中,機(jī)器會學(xué)習(xí)有用的反饋信息,對翻譯模型進(jìn)行修正。
推敲網(wǎng)絡(luò)則類似于人們寫文章時不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、完善翻譯的結(jié)果,從而使翻譯質(zhì)量得到大幅提升。
微軟亞洲研究院副院長、機(jī)器學(xué)習(xí)組負(fù)責(zé)人劉鐵巖
周明帶領(lǐng)的自然語言計算組,多年來一直致力于攻克機(jī)器翻譯——這一自然語言處理領(lǐng)域最具挑戰(zhàn)性的研究任務(wù)?!胺g沒有唯一的標(biāo)準(zhǔn)答案,它更像是一種藝術(shù),因此需要更加復(fù)雜的算法和系統(tǒng)去應(yīng)對?!敝苊鞅硎尽?/P>
此次newstest2017新聞報道測試集,包括約2000個句子,由專業(yè)人員從報紙樣本翻譯而來。微軟團(tuán)隊每次會隨機(jī)挑選數(shù)百個句子翻譯。
為了驗證機(jī)器翻譯是否可以媲美人類翻譯,測試經(jīng)歷了極為復(fù)雜的驗證過程。這是因為,沒有所謂“正確的”翻譯結(jié)果,即使是兩位專業(yè)的翻譯人員,對同一個句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。表達(dá)同一個句子的“正確的”方法不止一種。
周明解釋:“這也是為什么機(jī)器翻譯比單純的語音識別復(fù)雜得多,人們可能用不同的詞語來表達(dá)完全相同的意思,但未必能準(zhǔn)確判斷哪一個更好?!?/P>
相比之下,判斷語音識別能否媲美人類則相當(dāng)簡單:標(biāo)準(zhǔn)答案是唯一的。
這種沒有標(biāo)準(zhǔn)答案的任務(wù),使得機(jī)器翻譯成為一個極有挑戰(zhàn)、同時極富意義的問題。劉鐵巖表示,我們不知道哪一天,機(jī)器翻譯才能在面臨任何語種、任何類型的文本時,都能在“信、達(dá)、雅”上媲美專業(yè)翻譯人員的水準(zhǔn)。但總體而言,他對技術(shù)的進(jìn)展表示樂觀,因為整個學(xué)術(shù)界在持續(xù)發(fā)明大量的新技術(shù)、新模型和新算法,
“我們可以預(yù)測的是,新技術(shù)的應(yīng)用一定會讓機(jī)器翻譯的結(jié)果日臻完善?!蔽④泩F(tuán)隊還表示,此次技術(shù)突破將被應(yīng)用到微軟的商用多語言翻譯系統(tǒng)產(chǎn)品中。
2024-10-30 10:21
2024-10-30 10:14
2024-10-29 09:48
2024-10-28 08:36
2024-10-28 08:21
2024-10-26 11:08
2024-10-26 10:09
2024-10-23 09:13
2024-10-21 14:35
2024-10-21 09:45