9月6日,傳神公司殷白恩老師線上講學(xué),為學(xué)院2022級(jí)翻譯專業(yè)新生帶來(lái)了一場(chǎng)以人機(jī)共譯在商用環(huán)境下的應(yīng)用為主題的講座。本次講座通過(guò)騰訊會(huì)議舉行,由外國(guó)語(yǔ)學(xué)院殷燕教授主持。
講座第一部分,殷白恩老師簡(jiǎn)短的介紹了機(jī)器翻譯技術(shù)的發(fā)展歷程、人機(jī)共譯落地的過(guò)程和AI當(dāng)前發(fā)展階段。殷老師告訴大家只有了解機(jī)器發(fā)展歷程、人機(jī)共譯的六大步驟及當(dāng)前AI發(fā)展的階段和未來(lái)發(fā)展走向,我們才能更加清楚未來(lái)要做的具體的事情。
隨著科學(xué)技術(shù)發(fā)展,特別是計(jì)算機(jī)的發(fā)展,機(jī)器翻譯共分為基于規(guī)則的機(jī)器翻譯、基于實(shí)例的機(jī)器翻譯、基于統(tǒng)計(jì)的機(jī)器翻譯和基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯。殷白恩老師指出,機(jī)器翻譯還有很大的發(fā)展空間。其次,人機(jī)共譯落地的過(guò)程主要有六大步驟,而目前AI技術(shù)發(fā)展處于能夠代替人類學(xué)習(xí)、初步感知人類行為的階段,比如學(xué)習(xí)的機(jī)器人小度、蘋(píng)果的Siri。每一次AI發(fā)展都很艱難,需要海量數(shù)據(jù)的積累。
講座第二部分,在確定同學(xué)們對(duì)機(jī)器翻譯有了更加清楚的理解后,殷白恩老師開(kāi)始詳細(xì)介紹定向引擎及其結(jié)果評(píng)測(cè)這是機(jī)器翻譯的基礎(chǔ)和核心。定向引擎有專屬的人工篩選的種子語(yǔ)料,這些語(yǔ)料是某些垂直領(lǐng)域的典型核心文本。谷歌引擎、百度引擎和有道等市面上的通用引擎和定向引擎的區(qū)別較大。通用引擎可以使用戶快速獲取基本信息和語(yǔ)義,而定向引擎更加準(zhǔn)確,能夠直接達(dá)到用戶使用目的,盡量可以作為成果交給用戶。殷白恩老師舉了一個(gè)例子來(lái)方便大家理解,同樣翻譯100句話,通用引擎傾向于把100句話全部的大致意思譯出,追求每句話都是70到80分,總體結(jié)果為80分,而定向引擎傾向于把100句話中30句完全譯為100分。
講座第三部分,殷白恩老師詳細(xì)講解了譯前術(shù)語(yǔ)提取的四大步驟,分別為閱讀原稿找到關(guān)鍵詞匯、查證詞匯原文的確切含義、初步擬定術(shù)語(yǔ)譯文、術(shù)語(yǔ)譯文查證。術(shù)語(yǔ)影響譯文準(zhǔn)確性,譯者大都學(xué)語(yǔ)言,不能夠理解各領(lǐng)域的關(guān)鍵術(shù)語(yǔ),人工提取術(shù)語(yǔ)時(shí),比如馬達(dá)頭,每個(gè)字全都認(rèn)識(shí),卻不知道具體意思。同樣對(duì)于機(jī)器翻譯也較難。比如,蘭州牛肉拉面,機(jī)器可能會(huì)識(shí)別為蘭州、牛肉和拉面三個(gè)詞。因此,需要提前定義術(shù)語(yǔ),這使譯文更加準(zhǔn)確和譯后工作更加高效,特別是在大規(guī)模協(xié)同工作場(chǎng)景下,保證最終譯文質(zhì)量。。人工術(shù)語(yǔ)提取缺點(diǎn)在于短時(shí)間內(nèi)難以通讀全文,效率低、容易遺漏且個(gè)體差異性極大。而比如,“夏天衣服能穿多少穿多少”和“冬天衣服能穿多少穿多少”,這兩句機(jī)器翻譯會(huì)有很大障礙。AI提取術(shù)語(yǔ)能夠快速提取全篇關(guān)鍵詞匯,統(tǒng)計(jì)詞頻并匹配歷史術(shù)語(yǔ)庫(kù)譯文,減少重復(fù)勞動(dòng)的同時(shí),隨著數(shù)據(jù)積累不斷提升自動(dòng)提取的精準(zhǔn)度。
同學(xué)們?cè)隈雎?tīng)講座中秩序井然,表示出了對(duì)人機(jī)互譯知識(shí)極大的學(xué)習(xí)興趣。講座結(jié)束后,同學(xué)們紛紛表示這次講座受益匪淺,學(xué)到了關(guān)于機(jī)器翻譯原理和過(guò)程,不僅對(duì)譯者單獨(dú)翻譯以及機(jī)器翻譯的局限有了深入了解,更是對(duì)人機(jī)互譯發(fā)展的未來(lái)走向有了更加清晰的認(rèn)識(shí)。同學(xué)們了解了很多以前沒(méi)有接觸到的翻譯知識(shí),希望能夠經(jīng)常聽(tīng)到這樣的講座。
專家簡(jiǎn)介:殷白恩,傳神語(yǔ)聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司知識(shí)資產(chǎn)部總監(jiān)、語(yǔ)聯(lián)網(wǎng)研究院人機(jī)共譯首席研究員,多所高校的校外行業(yè)導(dǎo)師,主要負(fù)責(zé)公司知識(shí)資產(chǎn)建設(shè)、管理和運(yùn)營(yíng)工作,長(zhǎng)期從事國(guó)際工程,多媒體、軍工等行業(yè)翻譯實(shí)踐工作,編撰工程行業(yè)路橋隧道專業(yè)英中字典,撰寫(xiě)開(kāi)源情報(bào)專題研究報(bào)告60余項(xiàng),在核心期刊發(fā)表多篇學(xué)術(shù)論文。
(審稿:劉建偉)