微軟亞洲研究院於 2019 年 WMT 國際機器翻譯大賽勇奪八項冠軍

文章來源:Media OutReach Limited   發表時間:2019/05/22 瀏覽次數:855

微軟亞洲研究院參與共 11 項機器翻譯任務挑戰

 

香港,中國 Media OutReach - 2019522 - 微軟亞洲研究院日前在國際享負盛名的機器翻譯比賽 WMT192019 Fourth Conference on Machine Translation取得一共 8 項機器翻譯挑戰的冠軍殊榮。今年, WMT 共設有 19 項機器翻譯類別,微軟亞洲研究院參與了其中 11 項的機器翻譯挑戰。

 

微軟亞洲研究院奪得冠軍的 8 項翻譯挑戰為:中文-英語、英語-芬蘭語、英語 - 德語、英語 - 立陶宛語、法語 - 德語、德語 - 英語、德語 - 法語,和俄語 - 英語。此外,微軟亞洲研究院亦在另外 3 項挑戰中獲得第二名成績,包括:英語 - 哈薩克語、芬蘭語 - 英語、及立陶宛語 - 英語。

 

作為全球領先的機器翻譯比賽之一,WMT 是頂尖研究者展示其解決方案及了解機器翻譯技術持續發展的平台。2019 14 WMT 機器翻譯比賽吸引了全球超過 50 支隊伍參與,當中包括科技公司、領先學術機構及大學,務求一展他們機器翻譯的實力。

 

今年比賽旨在評估目前英語以外語言的機器翻譯技術,以及檢視翻譯歐洲語言所面臨的挑戰,例如較少資源和形態豐富的語言等。

 

改善多維算法達致更好的機器翻譯結果

微軟亞洲研究院副院長劉鐵岩指出:今年,微軟亞洲研究院團隊在系統上運用創新算法,以顯著提升機器翻譯結果的質素。這些創新算法改善了平台的各方面,包括學習機制、預先訓練、優化網絡架構數據增強等,令系統表現更佳。

 

是次使用的創新算法包括:

  • 多體對偶學習(Multi-agent Dual LearningMADL
  • 屏蔽序列到序列預訓練(Masked sequence to sequence pre-training,MASS)
  • 自動神經網絡架構優化(Automatic neural architecture optimization,NAO)
  • 軟性上下文數據增強(Soft contextual data augmentation,SCA)

 

這是繼 2018 微軟亞洲研究院和微軟研究院美國實驗室的研究人員,共同在一個稱為 newstest2017 的常用新聞報導測試集上達致人類翻譯水平次取得重大成就newstest2017 由業界和學術合作夥伴開發,並於 WMT17 上發布。微軟亞洲研究院和微軟研究院美國實驗室研發的系統,媲美人類翻譯的質素和準確度,將 newstest2017 新聞文章的句子從中文翻譯成英語。

 

劉鐵岩續指:「機器翻譯領域將繼續演變,並發展出更好的算法、數據集和技術。然而,我們今天大部分研究都是受到人類行事的方法啟發。語言即複雜又精細,人們可使用不同詞語來表達完全相同的概念。因此,開發多維算法對於發展機器翻譯系統非常重要。這樣才可確保機器翻譯能提供更精準的結果。我們在 WMT19 取得的成果將有助這領域的進一步發展,希望機器翻譯能在未來幾年間繼續進步。」

 

Microsoft Translator 其中一個結合研究成果的例子Microsoft Translator 是一種多語言機器翻譯雲服務,當中結合部分由全球微軟研究團隊開發的解決方案,以提高其準確性。目前,研究團隊亦計劃整合在今年 WMT 挑戰賽上所運用的新算法,以改善其產品。

關於Microsoft

Microsoft (Nasdaq "MSFT" @microsoft) 致力於發展智能雲端與智能裝置時代的數碼轉型,其使命是幫助全球每個人和企業成就更多、實現更多。

以上新聞投稿內容由Media OutReach Limited全權自負責任,若有涉及任何違反法令、違反本網站會員條款、有侵害第三人權益之虞,將一概由Media OutReach Limited承擔法律及損害賠償之責任,與台灣產經新聞網無關。