机器翻译市场需求调研报告
????????????? ????機(jī)器翻譯市場(chǎng)需求調(diào)研報(bào)告
該文章屬原創(chuàng),如轉(zhuǎn)載請(qǐng)于作者聯(lián)系!
王文峰? 劉鳴洋
1 機(jī)器翻譯的現(xiàn)狀
1.1機(jī)器翻譯及其發(fā)展歷程
機(jī)器翻譯(machine translation),又稱自動(dòng)化翻譯,是利用計(jì)算機(jī)把一種自然語言轉(zhuǎn)變成另一種自然語言的過程。用以完成這一過程的軟件叫做機(jī)器翻譯系統(tǒng)。是一種高級(jí)的人工智能技術(shù), 它是計(jì)算機(jī)科學(xué)、數(shù)學(xué)和語言學(xué)等多學(xué)科共同參與研制的結(jié)晶。機(jī)器翻譯之所以成為可能,一是因?yàn)閮煞N語言之間存在著可譯性,二是因?yàn)槿说姆g過程具有可模擬性。
機(jī)器翻譯并不是一個(gè)簡(jiǎn)單的過程。它并不僅僅是選定文本的各個(gè)單詞的翻譯而是用目標(biāo)語言把給定的句子或文本的所有單詞都進(jìn)行翻譯,以達(dá)到對(duì)整篇文章的理解。自然語言根據(jù)各自的形態(tài)學(xué),語法結(jié)構(gòu)和語義學(xué)分成不同的語言,并且這些語言還包含了很多的模糊性。(所以機(jī)器翻譯很難達(dá)到一個(gè)理想的程度)
最早的機(jī)器翻譯起源于1933年,蘇聯(lián)人P.P.特羅絳斯基提出借助機(jī)器進(jìn)行翻譯的詳細(xì)步驟,并設(shè)計(jì)出由一條帶和一塊臺(tái)板依靠機(jī)械原理進(jìn)行翻譯工作的樣機(jī)。1954年,美國喬治敦大學(xué)和國際商用機(jī)器公司(IBM)首次聯(lián)合試驗(yàn)使用電腦機(jī)譯系統(tǒng),將250個(gè)詞的俄文材料譯成英文,這次試驗(yàn)的成功標(biāo)志著機(jī)器翻譯系統(tǒng)的真正誕生。
從20世紀(jì)60年代中后期到整個(gè)70年代,整個(gè)機(jī)器翻譯領(lǐng)域處于一個(gè)相對(duì)平穩(wěn)發(fā)展的時(shí)期,而在某些國家,特別是加拿大和歐盟,機(jī)器翻譯的研究卻取得了比較顯著的進(jìn)步。尤其是在加拿大,由于雙語文化的影響,政府積極支持機(jī)器翻譯的研發(fā)工作,1976年,加拿大蒙特利爾大學(xué)與加拿大聯(lián)邦政府翻譯局聯(lián)合開發(fā)了提供天氣預(yù)報(bào)服務(wù)的實(shí)用性機(jī)器翻譯系統(tǒng)TAUM-METEO,該系統(tǒng)的成功開發(fā)標(biāo)志著機(jī)器翻譯已經(jīng)在某些領(lǐng)域達(dá)到了實(shí)用化的程度。 進(jìn)入20世紀(jì)80年代以來,由于計(jì)算機(jī)科學(xué)、語言學(xué)研究的發(fā)展,特別是計(jì)算機(jī)硬件技術(shù)的大幅度提高以及人工智能在自然語言處理上的應(yīng)用,機(jī)器翻譯在全世界范圍內(nèi)開始復(fù)蘇,并在隨后的90年代取得了長(zhǎng)足的進(jìn)步。
我國從1956年也開始了機(jī)器翻譯的研究,在“六五”、“七五”、“八五”和高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)期間國家均把機(jī)器翻譯列入重點(diǎn)發(fā)展項(xiàng)目。早期機(jī)器翻譯主要以研究機(jī)構(gòu)的學(xué)術(shù)開發(fā)為主,到了1992年,我國邁出了機(jī)器翻譯軟件商品化的步伐。中國軟件與技術(shù)服務(wù)股份有限公司(以下簡(jiǎn)稱“中軟公司”)在 JFYⅢ翻譯系統(tǒng)之上成功推出了“譯星”1號(hào)軟件產(chǎn)品,從而帶動(dòng)我國機(jī)器翻譯進(jìn)入了一個(gè)發(fā)展熱潮期。
?
1.2機(jī)器翻譯的方法
機(jī)器翻譯領(lǐng)域的的研究方法基本上可以分為兩大類,即基于規(guī)則(Rule-Based)和基于語料庫(Corpus-Based)的方法?;谝?guī)則的方法又可以分為基于轉(zhuǎn)換的方法和基于中間語言的方法,基于語料庫的方法又可以分為基于統(tǒng)計(jì)的方法和基于實(shí)例的方法。傳統(tǒng)的基于規(guī)則的方法又可以稱為理性主義方法,與之相對(duì),基于語料庫的方法又可以稱為經(jīng)驗(yàn)主義方法。
基于規(guī)則的方法:機(jī)器翻譯的主流方法一直是基于規(guī)則的方法。國際上有影響的機(jī)器翻譯系統(tǒng)基本上都需要規(guī)則的貢獻(xiàn),即使在多種技術(shù)并存的系統(tǒng)中也有規(guī)則,基于規(guī)則的機(jī)器翻譯技術(shù)思想是被普遍接受的、成熟的,也是到目前為止應(yīng)用最廣的方法。其優(yōu)勢(shì)在于可以很準(zhǔn)確的描述語言的特征規(guī)律,符合理性思維。但是,語言規(guī)則的產(chǎn)生需要大量的人力,而且大量的語言規(guī)則直接往往存在著不可避免的沖突。另外,規(guī)則方法在保證規(guī)則的完備性和適應(yīng)性方面也存在著不足。
基于統(tǒng)計(jì)的方法:基本思想是,把機(jī)器翻譯看成是一個(gè)信息傳輸?shù)倪^程,用一種信道模型對(duì)機(jī)器翻譯進(jìn)行解釋。它為我們提供了很好的從已有的語言資源中自動(dòng)得到我們所需要的語言信息的工具。基于統(tǒng)計(jì)的方法不需要依賴大量知識(shí),直接靠統(tǒng)計(jì)結(jié)果進(jìn)行歧義消解處理和譯文的選擇,避開了語言理解的諸多難題,但是語料的選擇和處理工程量巨大,而且存在著數(shù)據(jù)稀疏問題。因此通用領(lǐng)域的機(jī)器翻譯系統(tǒng)很少以統(tǒng)計(jì)方法為主。,
?? 基于實(shí)例的方法:其基本思想是,在已有的源語言實(shí)例句庫中,待翻譯句子按照類比原理匹配出最相似的實(shí)例句,取出實(shí)例句對(duì)應(yīng)的目標(biāo)語句子,進(jìn)行適當(dāng)?shù)母脑?#xff0c;最終取得待翻譯句子所相應(yīng)的目標(biāo)語句子。其特點(diǎn)是不需要對(duì)源語言進(jìn)行任何的分析,僅僅是通過類比進(jìn)行翻譯。基于實(shí)例的機(jī)器翻譯對(duì)于相同或相似的文本的翻譯有非常顯著的效果,隨著例句庫規(guī)模的增加,其作用也越來越顯著。對(duì)于實(shí)例庫中已有的文本,可以直接獲得高質(zhì)量的翻譯結(jié)果。對(duì)與實(shí)例庫中存在的實(shí)例十分相似的文本,可以通過類比推理,并對(duì)翻譯結(jié)果進(jìn)行少量的修改,構(gòu)造近似的翻譯結(jié)果。但由于語料庫規(guī)模的限制,基于實(shí)例的機(jī)器翻譯很難達(dá)到較高的匹配率。因而到目前為止,還很少有機(jī)器翻譯系統(tǒng)采用純粹的基于實(shí)例的方法,一般都是把基于實(shí)例的機(jī)器翻譯作為多翻譯引擎中的一個(gè),以提高翻譯的正確率。?
?機(jī)器翻譯除了上述三種主流方法之外,還有基于模式的、基于神經(jīng)網(wǎng)絡(luò)的、基于對(duì)話的、基于原則的等等機(jī)器翻譯方法。
?
1.3 機(jī)器翻譯產(chǎn)品及現(xiàn)有水平(存在的問題)
總體上說,機(jī)器翻譯產(chǎn)品可以歸為如下幾類,一是傳統(tǒng)的文本自動(dòng)翻譯產(chǎn)品;二是網(wǎng)頁翻譯,它常常與網(wǎng)上搜索引擎捆綁在一起;三是機(jī)器輔助翻譯產(chǎn)品,它主要是幫助專業(yè)翻譯人員提高翻譯效率;四是電子版的雙語詞典,如著名的金山詞霸,它主要是幫助熟悉外語的用戶在計(jì)算機(jī)上閱讀外語信息;五是口語自動(dòng)翻譯。
基于個(gè)人的機(jī)器翻譯系統(tǒng)從1990年代初期開始出現(xiàn),Systran Pro(專業(yè)版),Systran Classic(家庭版)環(huán)球銜接公司(Globalink)研制的Power Translator,語言工程公司(Language Engineering Corporation)研制的Logo Vista等,從大型機(jī)系統(tǒng)改造而來的有Systran Pro(專業(yè)版),Systran Classic(家庭版),Langescheidt(源自METAL)等,國內(nèi)的系統(tǒng)有譯星、通譯、環(huán)宇通、華建譯通、東方快譯、金山譯霸等。
基于網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)從1990年代中期開始大量出現(xiàn),目前提供在線機(jī)器翻譯服務(wù)的知名公司有:Systran,Logos,Fujitsu,LANT,AltaVista,CompuServe以及國內(nèi)著名的華建、桑夏等公司。
采取翻譯記憶(TM)技術(shù)的計(jì)算機(jī)輔助翻譯系統(tǒng)目前成為專業(yè)翻譯市場(chǎng)的首選,最為典型的是德國TRADOS公司的Translator’s Workbench和國內(nèi)交大銘泰公司的雅信CAT等。
大規(guī)模的口語翻譯系統(tǒng)許多人多年的努力,將有為數(shù)眾多的口語翻譯的應(yīng)用被作為小領(lǐng)域自然語言的應(yīng)用,例如,數(shù)據(jù)庫的詢問(尤其是財(cái)政和股票市場(chǎng)數(shù)據(jù)),商業(yè)談判的相互交往,公司內(nèi)部交流等等。
現(xiàn)今發(fā)達(dá)國家已開發(fā)出的文字翻譯機(jī)器,有日本理光公司推出的數(shù)字式翻譯復(fù)印機(jī)能逐字逐句地把英文譯成日文,每分鐘約?可翻譯半頁信紙打印稿,還可發(fā)送圖文傳真。
語音翻譯方面,日本ATR研究所、美國梅隆大學(xué)和德國西門子公?司共同研究,已于1993年試驗(yàn)成功自動(dòng)翻譯電話,并進(jìn)行了10多分鐘對(duì)話。日本還研制成功一種通過計(jì)算機(jī)與?通信網(wǎng)絡(luò)連接的自動(dòng)翻譯電話。此外,一種用5種語言(英、法、德意和西班牙)進(jìn)行交談的語音翻譯機(jī)也已被推出,它內(nèi)存有1萬個(gè)單詞,6.5萬個(gè)短語,發(fā)出的聲音標(biāo)準(zhǔn)、清晰、易懂。
最近美國又有公司推出一種旅游用的名為"WORLD?MATE"的袖珍翻譯機(jī)器,它準(zhǔn)備了2250個(gè)常用短語(15種語言,每種各150個(gè)短語),幾乎能幫助你到世界各國旅游而不會(huì)發(fā)生語言障礙。?
可以看到,機(jī)器翻譯經(jīng)過幾十年的發(fā)展,取得了很大的進(jìn)展,特別是作為人們的輔助翻譯工具,機(jī)器翻譯已經(jīng)得到大多數(shù)人的認(rèn)可。但是,至今仍然沒有一個(gè)完善、實(shí)用、全面、高質(zhì)量的自動(dòng)翻譯系統(tǒng)出現(xiàn)。目前的機(jī)器翻譯還只是基于對(duì)語言的表層的句法分析,沒有對(duì)語言進(jìn)行深層的語義分析,缺乏對(duì)自然語言的深入認(rèn)識(shí),因此翻譯結(jié)果很難達(dá)到預(yù)期的目標(biāo)。
機(jī)器翻譯存在的主要問題:
l???????? 一句一句處理,上下文缺乏聯(lián)系;
l???????? 對(duì)源語言的分析只是求解句法關(guān)系,完全不是意義上的理解;
l???????? 缺乏領(lǐng)域知識(shí),從計(jì)算機(jī)到醫(yī)學(xué),從化工到法律都通用,就換專業(yè)詞典;
l???????? 譯文轉(zhuǎn)換是基于源語言的句法結(jié)構(gòu)的,受源語言的句法結(jié)構(gòu)的束縛;
l???????? 翻譯只是句法結(jié)構(gòu)的和詞匯的機(jī)械對(duì)應(yīng)
?
2 機(jī)器翻譯的需求與用戶分析
2.1基本需求
第一種傳統(tǒng)型,它要求翻譯結(jié)果和人(翻譯家)翻得一樣好,即翻譯結(jié)果達(dá)到出版水平;第二種需求對(duì)翻譯質(zhì)量的要求稍低一些,尤其是對(duì)文體的要求較低,用戶這時(shí)最感興趣的是了解某篇文章的基本內(nèi)容,因此希望翻譯速度越快越好;第三種需求是對(duì)話雙方一對(duì)一的交談(打電話或者在Internet聊天室里聊天)或無需寫在紙上的演講(如外交場(chǎng)合的談話);第四種需求是在信息檢索、信息抽取、數(shù)據(jù)庫訪問等多語言系統(tǒng)里所需進(jìn)行的翻譯。
? ???? 第一種機(jī)器翻譯需求是為了傳播思想。自機(jī)器翻譯系統(tǒng)出現(xiàn)之日起,這種需求可以說在某種程度上得到了滿足。然而,要想達(dá)到用戶需要的質(zhì)量,機(jī)器翻譯輸出結(jié)果常常還需要由翻譯家修改或進(jìn)行"后編輯"。在很多情況下,這些修改都是必需的,因此機(jī)器翻譯系統(tǒng)實(shí)際上只是產(chǎn)生了一個(gè)"草稿型"譯文。因?yàn)榇藭r(shí)對(duì)翻譯質(zhì)量要求不高。翻譯家不打算而且也很反感被要求"粗略"地翻譯科學(xué)技術(shù)資料。當(dāng)一個(gè)人只是想大致了解一下某篇文章的內(nèi)容,并不想知道該文的一切細(xì)節(jié),而且他也并不討厭看到譯文文體拙劣、語法錯(cuò)誤百出時(shí),機(jī)器翻譯足可滿足這種需求。
第二種需求是為了了解信息而使用機(jī)器翻譯系統(tǒng),這一需求實(shí)際上已經(jīng)作為第一種需求的副產(chǎn)品得到了實(shí)現(xiàn)。既然機(jī)器翻譯系統(tǒng)尚不能直接產(chǎn)生高質(zhì)量的譯文,因此用戶能從未經(jīng)編輯的譯文中找出或猜出他們需要的東西也是很有幫助的,畢竟翻譯出一部分總比一點(diǎn)沒有翻譯要好。在這種情況下,盡管機(jī)器翻譯的譯文結(jié)果很糟糕,但隨著PC價(jià)格越來越低廉,這類機(jī)器翻譯系統(tǒng)的需求量也大大增加了。翻譯工作者會(huì)望而卻步,因?yàn)楣ぷ髁刻?#xff0c;且重復(fù)度太高,而且還要保持術(shù)語的一致性。簡(jiǎn)而言之,機(jī)器翻譯適合于處理大量的、重復(fù)度高的技術(shù)資料、軟件本地化手冊(cè)、實(shí)時(shí)天氣預(yù)報(bào)等資料,而人工翻譯在語言非重復(fù)性的復(fù)雜文本方面有著無可替代的作用。
第三種需求是以交流信息為目的的機(jī)器翻譯。由于信息更新速度很快,不可能由人來翻譯,用戶需要馬上得出翻譯結(jié)果以便傳達(dá)信息的基本內(nèi)容。例如基于Internet的在線翻譯系統(tǒng),它能實(shí)時(shí)進(jìn)行翻譯,但翻譯質(zhì)量難盡人意。有些機(jī)器翻譯系統(tǒng)目前正在探索,機(jī)器翻譯自然"地扮演自己的角色。另一種用于人際交流的機(jī)器翻譯系統(tǒng)是口語翻譯系統(tǒng),它可以用在電話交談、商務(wù)會(huì)談等場(chǎng)合。目前有很多專家正在研發(fā)這類系統(tǒng),其難點(diǎn)在于語音合成和自動(dòng)翻譯。這一領(lǐng)域的研究盡管進(jìn)展緩慢,但我們?nèi)匀豢梢韵M麑碓诜浅J芟薜念I(lǐng)域里應(yīng)用在線口語機(jī)器翻譯系統(tǒng)。但對(duì)個(gè)人信件來說,機(jī)器翻譯可能會(huì)用得越來越多。而對(duì)電子郵件、網(wǎng)絡(luò)頁面的信息提取以及基于計(jì)算機(jī)的信息服務(wù)來說,機(jī)器翻譯可能是唯一可行的解決方案。常用信息的訪問和發(fā)布對(duì)于一些具有重復(fù)性卻有效期較短的信息,如股票價(jià)格,天氣預(yù)報(bào)以及財(cái)務(wù)信息等,可以使用機(jī)器翻譯來完成。如,加拿大政府利用機(jī)器翻譯系統(tǒng),將天氣報(bào)告內(nèi)容從英語自動(dòng)翻譯為法語。
第四種機(jī)器翻譯需求是信息訪問系統(tǒng)提出的。在這里,機(jī)器翻譯軟件被集成到一系列子系統(tǒng)中,這些子系統(tǒng)包括如下幾類數(shù)據(jù)庫的全文搜索和檢索系統(tǒng),一般是科學(xué)、醫(yī)學(xué)和技術(shù)期刊雜志的電子版,或文獻(xiàn)信息檢索系統(tǒng);從文本,特別是新聞報(bào)道中提取信息;對(duì)文本進(jìn)行綜述的系統(tǒng);查詢非文本數(shù)據(jù)庫系統(tǒng)。
目前,這方面有幾個(gè)項(xiàng)目正在歐洲進(jìn)行,目的是使所有歐盟成員國都能訪問數(shù)據(jù)和信息源,無論用什么源語言。
2.2 機(jī)器翻譯用戶分類
根據(jù)以上需求,我們可以把翻譯軟件用戶分為普通用戶和專業(yè)用戶:針對(duì)普通用戶的翻譯軟件要為用戶提供計(jì)算機(jī)應(yīng)用過程中的閱讀或?qū)懽鲙椭?#xff0c;這類軟件的通用性較強(qiáng),市場(chǎng)份額也較大;而針對(duì)專業(yè)用戶的翻譯軟件必須具有較強(qiáng)的專業(yè)適用性和語言分析功能。
普通用戶不希望使用相對(duì)復(fù)雜TM,不想自己創(chuàng)建翻譯數(shù)據(jù)庫;他們不需要計(jì)算百分之幾的準(zhǔn)確率,只是想漢化一些非中文版的軟件,簡(jiǎn)單翻譯一下外國網(wǎng)站,或者簡(jiǎn)要了解一篇文章的大概意思,對(duì)于這類用戶,金山詞霸、東方快車、中軟譯星和華建等一類的MT軟件仍然是他們關(guān)心的對(duì)象。
專業(yè)用戶主要使用TM(Translation Memory,翻譯記憶),主要面向?qū)I(yè)翻譯人員和機(jī)構(gòu)設(shè)計(jì),主要是起翻譯得輔助作用,其口號(hào)“相同的句子永遠(yuǎn)不需要翻譯第二遍” 從而提高了工作效率。比較有名氣的雅信CAT、塔多思等。
?
?
????????????????????????????????????????????????????????????????????????????????????????????????????????
3 機(jī)器翻譯的市場(chǎng)分析
3.1機(jī)器翻譯市場(chǎng)總體概況
隨著科學(xué)技術(shù)的發(fā)展,計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)已經(jīng)深入我們工作、生活的每一個(gè)方面。?而語言不通妨礙了因特網(wǎng)時(shí)代普通人之間的信息交流,同時(shí)也促進(jìn)了軟件信息翻譯服務(wù)市場(chǎng)持續(xù)快速發(fā)展。目前,中國翻譯市場(chǎng)的年產(chǎn)值約為120億元人民幣,但去年中國翻譯服務(wù)市場(chǎng)的營業(yè)額尚不足2億元。很顯然,二者很不相稱。?翻譯軟件可以幫助人們實(shí)現(xiàn)無障礙溝通的夢(mèng)想。預(yù)計(jì)到2010年,全球翻譯類軟件市場(chǎng)可達(dá)400億美元,對(duì)于所有翻譯件廠商來說,這絕對(duì)是一個(gè)巨大的成長(zhǎng)空間和機(jī)會(huì)。中國加入世界貿(mào)易組織(WTO)后,國內(nèi)外市場(chǎng)交流與融合步伐進(jìn)一步加快,翻譯市場(chǎng)正以前所未有的速度迅猛發(fā)展。2008年北京奧運(yùn)、2010年上海世博會(huì)的舉行更給翻譯市場(chǎng)帶來難得的發(fā)展機(jī)遇。據(jù)資料顯示,目前全球年翻譯產(chǎn)值超過130億美元,亞太地區(qū)占30%,中國市場(chǎng)約為127億人民幣。美國權(quán)威機(jī)構(gòu)對(duì)世界翻譯市場(chǎng)的調(diào)查顯示,翻譯市場(chǎng)的規(guī)模將在2005年達(dá)到227億美元,而中國將達(dá)到200億元人民幣的銷售額。國內(nèi)做機(jī)器翻譯比較好的公司有中軟譯星,華建集團(tuán),金山快譯。國外做的比較好的有systran、google在線翻譯、Babel Fish Translation、http://worldlingo.com/wl/translate 、http://www.systransoft.com/。
3.2市場(chǎng)上的機(jī)器翻譯軟件
目前國內(nèi)的機(jī)器翻譯軟件主要有三大類:詞典翻譯類、漢化翻譯類和專業(yè)翻譯類。
詞典類翻譯軟件相當(dāng)于一種電子詞典,它可以迅速查詢英文單詞或詞組的詞義,并提供單詞的發(fā)音,為用戶了解單詞或詞組含義提供了便利。這類軟件占主導(dǎo)地位的是金山軟件公司的《金山詞霸》?!督鹕皆~霸》堪稱是多快好省的電子詞典,它可以迅速查詢英文單詞或詞組的詞義,并提供單詞的發(fā)音,為用戶了解單詞或詞組含義提供了極大的便利。
漢化翻譯軟件主要滿足用戶漢化英文軟件、英文網(wǎng)頁,實(shí)現(xiàn)對(duì)屏幕英文信息的了解和文章的初步翻譯等,對(duì)信息獲取、了解文章大意有實(shí)際作用。典型代表是北京實(shí)達(dá)銘泰公司開發(fā)的《東方快車2000》,它首先提出了“智能漢化”的概念,改變了過去“即時(shí)漢化”的不足,也使人們對(duì)翻譯軟件有了更新的認(rèn)識(shí),使翻譯軟件的輔助翻譯作用更加明顯?!稏|方快車 2000》為用戶提供了“智能漢化集成環(huán)境”,為不會(huì)英語或英語水平不高的人提供了“語言障礙的全面解決方案”,包括內(nèi)碼轉(zhuǎn)換、動(dòng)態(tài)漢化和電子詞典等,很好地滿足了用戶漢化英文軟件、英文網(wǎng)頁,實(shí)現(xiàn)對(duì)屏幕英文信息的了解和文章的初步翻譯等,對(duì)信息獲取、了解文章大意有相當(dāng)實(shí)際的作用。
專業(yè)翻譯系統(tǒng)以譯星、雅信譯霸為代表,是面對(duì)專業(yè)或行業(yè)用戶的翻譯軟件。這類軟件具有傳統(tǒng)語法規(guī)則的翻譯內(nèi)核,其自動(dòng)翻譯的可讀性效果如何,一直是翻譯軟件企業(yè)的努力方向。在自動(dòng)翻譯方面,譯星具有一定的優(yōu)勢(shì),但其專業(yè)翻譯的質(zhì)量與人們的實(shí)用性還有很大差距,所以,在好長(zhǎng)一段時(shí)間里,專業(yè)翻譯軟件一直處于徘徊不前的狀態(tài)。
?
預(yù)計(jì)到2005年,全球翻譯類軟件市場(chǎng)可達(dá)300億美元,對(duì)于所有翻譯軟件廠商來說,這絕對(duì)是一個(gè)巨大的成長(zhǎng)空間和機(jī)會(huì)。而對(duì)于中國的翻譯軟件廠商來說,這是夢(mèng)升騰的地方。
3.2 機(jī)器翻譯產(chǎn)品的應(yīng)用
(1)、企業(yè)級(jí)市場(chǎng):更大的蛋糕(企業(yè)版)
隨著中國與國際貿(mào)易往來、商務(wù)談判、交流合作的日益頻繁,翻譯軟件企業(yè)級(jí)市場(chǎng)前景應(yīng)該是非常廣闊的,因?yàn)樾枰g的東西越來越多,需求在迅速增長(zhǎng),企業(yè)如果還只是依據(jù)一己的力量來翻譯往來文件和信函,是遠(yuǎn)遠(yuǎn)不能適應(yīng)和滿足需要的,甚至很可能會(huì)降低效率,貽誤商機(jī)。而且隨著人們正版意識(shí)的增強(qiáng)和政府扶持力度的加大,翻譯軟件企業(yè)級(jí)市場(chǎng)將不象一些人所斷言的那樣是個(gè)成熟產(chǎn)業(yè)和夕陽產(chǎn)品,而是醞釀著大發(fā)展的勃勃生機(jī)。軟件企業(yè)的發(fā)展方向,更多的是從單機(jī)產(chǎn)品走向企業(yè)應(yīng)用和服務(wù),從渠道競(jìng)爭(zhēng)轉(zhuǎn)向創(chuàng)新競(jìng)爭(zhēng)。確實(shí),對(duì)于諸多翻譯軟件開發(fā)公司來說,更大和更有誘惑力的地方是企業(yè)級(jí)市場(chǎng)。這個(gè)市場(chǎng)非常大,競(jìng)爭(zhēng)也相當(dāng)激烈。翻譯解決方案靈活多樣,可幫助小型企業(yè)改進(jìn)多語信息的管理方式,同時(shí)簡(jiǎn)化員工、客戶和合作伙伴之間的通信。
對(duì)于小企業(yè)而言,要不斷努力提高效率和生產(chǎn)力,來理解和管理多語內(nèi)容并與世界各地的客戶接洽。但因?yàn)閱螜C(jī)軟件的利潤(rùn)比較低,所以未來將以為企業(yè)和廠商提供翻譯解決方案為主要方向。能滿足中小型企業(yè)翻譯需求和預(yù)算能力的桌面產(chǎn)品,可提供可信賴的翻譯以幫助企業(yè)在當(dāng)今多語市場(chǎng)中保持競(jìng)爭(zhēng)力。為當(dāng)今專業(yè)翻譯師設(shè)計(jì)的桌面產(chǎn)品,其中的語言及后期編輯工具包內(nèi)容眾多,可創(chuàng)建并管理多語文檔以獲得最佳的翻譯品質(zhì)。該服務(wù)器端翻譯產(chǎn)品可用于公司內(nèi)部網(wǎng)、外部網(wǎng)或局域網(wǎng),既能讓員工以獨(dú)立或協(xié)作方式翻譯、編輯和管理多語言文檔?;诜?wù)器的即時(shí)聯(lián)機(jī)翻譯服務(wù)可對(duì)您的網(wǎng)站和應(yīng)用程序本地化企業(yè)解決方案。當(dāng)今,隨著發(fā)展節(jié)奏不斷加快和競(jìng)爭(zhēng)日益加劇,各企業(yè)為謀求發(fā)展出路,紛紛將目光投向了國際市場(chǎng),并制定了快速進(jìn)入市場(chǎng)的戰(zhàn)略和應(yīng)對(duì)客戶需求的一攬子計(jì)劃。毋庸置疑,語言在這其間扮演了重要角色。由于需要翻譯的信息量在不斷增加,因此創(chuàng)建、編輯、發(fā)布和維護(hù)多語言信息也需要投入更多的精力。一個(gè)企業(yè)的網(wǎng)站、技術(shù)文檔、知識(shí)庫、政策和其它信息倘若無法向遍布世界各地的員工、客戶和合作伙伴傳達(dá)或者他們無法理解,則這些信息就毫無價(jià)值可言。
(2) 個(gè)人和辦公室工作者(單機(jī)版)
主要為個(gè)人和辦公室工作者使用,主要特點(diǎn)是預(yù)算較低,快速翻譯文本、網(wǎng)頁、電子郵件等。突破語言障礙,快速翻譯個(gè)人文本、網(wǎng)頁, 消息價(jià)格也較為便宜,可以鑲?cè)胛谋竞虸NTERNET。文件、電子郵件、網(wǎng)頁、報(bào)表。在用戶詞典的基礎(chǔ)上可以自己增加專業(yè)詞條。
(3) 在線服務(wù)
網(wǎng)頁翻譯工具其實(shí)就是在線網(wǎng)頁翻譯服務(wù)的程序版本,它可以隨時(shí)將需要翻譯的內(nèi)容翻譯為你所需要的語言。有了如此方便的工具,以后在瀏覽外文網(wǎng)站時(shí)就算不能完美理解其內(nèi)容,但起碼也能大致明白其意思了。要使用網(wǎng)頁翻譯工具必須連接到互聯(lián)網(wǎng)。訪客可以用自己的母語來瀏覽網(wǎng)站。也可以選擇詞典,翻譯本地的文檔,翻譯網(wǎng)頁,也可以轉(zhuǎn)換為私有文件、網(wǎng)頁, 和純文本。 在幾秒鐘內(nèi), 您的轉(zhuǎn)換被顯示在您的瀏覽器或被發(fā)送到電子郵件。也可以選擇詞典,翻譯本地的文檔,翻譯網(wǎng)頁,全球每天40萬人使用在線服務(wù),多語種交互,已建成投付使用的機(jī)器翻譯解答系統(tǒng)。此系統(tǒng)可以直接把她們的翻譯按鈕鑲?cè)胱约旱木W(wǎng)站。為了滿足日益增長(zhǎng)的即時(shí)多語信息需求,為個(gè)人和各類企業(yè)提供網(wǎng)頁、書面文本和 Microsoft Office 文件的隨選翻譯服務(wù)。這些訂購用戶可為其客戶、雇員及網(wǎng)站訪客提供服務(wù),即無需安裝其他軟件即可在個(gè)人電腦上將信息實(shí)時(shí)翻譯成多種語言。聯(lián)機(jī)服務(wù)以高容量服務(wù)器網(wǎng)絡(luò)為依托,提供低成本高效益、服務(wù)于客戶的翻譯解決方案。您可通過 Internet 訪問“聯(lián)機(jī)服務(wù)”,并且無需 IT 工作人員協(xié)助即可輕松設(shè)置在線服務(wù)選項(xiàng)。
(4) 網(wǎng)絡(luò)服務(wù)器版
網(wǎng)絡(luò)服務(wù)器是運(yùn)行在Linux 、windows的一套可升級(jí)的客戶服務(wù)器軟件(其它Unix 平臺(tái)可利用) 。這種系統(tǒng)以及延伸的過濾器可以進(jìn)行查尋、處理電子郵件、網(wǎng)上聊天等和包含HTML 和RTF 過濾的支持為XML 、SGML 和其它類型文件,包括翻譯記憶服務(wù)器、術(shù)語管理服務(wù)器、全球化流程管理服務(wù)器、全球化內(nèi)容管理服務(wù)器。該服務(wù)器端翻譯產(chǎn)品可用于公司內(nèi)部網(wǎng)、外部網(wǎng)或局域網(wǎng),既能讓員工以獨(dú)立或協(xié)作方式翻譯、編輯和管理多語言文檔。該服務(wù)器端翻譯產(chǎn)品可用于公司內(nèi)部網(wǎng)、外部網(wǎng)或局域網(wǎng),既能讓員工以獨(dú)立或協(xié)作方式翻譯、編輯和管理多語言文檔?;诜?wù)器的即時(shí)聯(lián)機(jī)翻譯服務(wù)可對(duì)您的網(wǎng)站和應(yīng)用程序(如搜索工具)進(jìn)行實(shí)時(shí)的多語言本地化。通過即時(shí)在線翻譯服務(wù),用戶可實(shí)時(shí)翻譯您網(wǎng)站(或門戶)中的文本或網(wǎng)頁內(nèi)容,使其成為用戶喜愛訪問的網(wǎng)站(或門戶)。通過即時(shí)聯(lián)機(jī)翻譯服務(wù),您可用桌上型電腦實(shí)時(shí)翻譯純文本、網(wǎng)頁和個(gè)人文件。
(5) 網(wǎng)站和商品的多語化
確保您網(wǎng)站的所有訪客都能通過所提供的翻譯服務(wù),選擇用其母語來讀取所需的網(wǎng)頁內(nèi)容,包括搜索工具、電子商務(wù)平臺(tái)和其它服務(wù)。還可以聯(lián)機(jī)翻譯服務(wù)可對(duì)您的網(wǎng)站和應(yīng)用程序(如搜索工具)進(jìn)行實(shí)時(shí)的多語言本地化。
(6)客戶支持知識(shí)庫的本地化
公司是提供在線客戶支持還是通過內(nèi)部知識(shí)庫提供客戶支持?提供多語支持信息和知識(shí)庫,有助于客戶實(shí)時(shí)獲取所需語言的產(chǎn)品支持??膳c您的企業(yè)內(nèi)容管理系統(tǒng)、數(shù)據(jù)庫或其它應(yīng)用程序整合使用。
有數(shù)據(jù)顯示,去年中國翻譯服務(wù)市場(chǎng)的營業(yè)額尚不足2 億元。很顯然,這與飛速發(fā)展的中國市場(chǎng)是很不相稱的。隨著中國與國際貿(mào)易往來、商務(wù)談判、交流合作的日益頻繁,翻譯軟件企業(yè)級(jí)市場(chǎng)前景應(yīng)該是非常廣闊的。
4 機(jī)器翻譯的前景預(yù)測(cè)
4.1機(jī)器翻譯軟件的未來需求
如何針對(duì)用戶需求,開發(fā)不同應(yīng)用層次的翻譯軟件是軟件面臨的主要挑戰(zhàn),用戶的需求是推動(dòng)技術(shù)發(fā)展的原動(dòng)力。
面臨挑戰(zhàn)的另一個(gè)應(yīng)用領(lǐng)域是將用戶的輸入譯成用戶所知甚少或未知的外國語,這時(shí)用戶并不想充當(dāng)雙語翻譯家的角色。機(jī)器翻譯系統(tǒng)可以給出大致"粗略"的譯文,至少可以告訴用戶大致說的是什么。但對(duì)那些不知道目標(biāo)語言的翻譯,目前還沒有什么解決辦法。最近日本研制出一些廉價(jià)的產(chǎn)品,可以對(duì)特定的"外語授權(quán)(foreign language authoring)"提供服務(wù)。例如,寫一封商務(wù)信函(基于標(biāo)準(zhǔn)短語和文件模板),但對(duì)其他領(lǐng)域或較長(zhǎng)的文件,因?yàn)?#34;規(guī)矩套路"很少,所以還不能編寫。目前有幾個(gè)研究小組正在研究交互式系統(tǒng),發(fā)送者按照模板要求編寫文檔,如果輸入文件足夠"正規(guī)化",機(jī)器翻譯系統(tǒng)就能保證語法和語言風(fēng)格的正確輸出。
同樣,將機(jī)器翻譯技術(shù)與信息訪問、信息提取和文摘軟件結(jié)合在一起的嘗試也處于研究階段,目前市場(chǎng)上還沒有商用產(chǎn)品,但開發(fā)商已經(jīng)意識(shí)到其潛在的市場(chǎng)。例如,AVENTINUS項(xiàng)目是專門為警察部隊(duì)在輯毒和執(zhí)法方面開發(fā)的,用歐盟任何一種語言都可以訪問中央數(shù)據(jù)庫并查詢關(guān)于毒品、犯罪和嫌疑犯的信息。目前,世界各國對(duì)這類跨語言應(yīng)用的興趣越來越大。最吸引人的應(yīng)用是"跨語言信息檢索",即允許用戶用自己的語言搜索外語數(shù)據(jù)庫。在這一系統(tǒng)中,大部分工作集中于如何建立和操作合適的翻譯字典,以便將查詢?cè)~串與數(shù)據(jù)庫文檔中的詞和詞組相匹配。相信在不久的將來會(huì)有這方面的商用軟件出現(xiàn)。
未來還有一種應(yīng)用是公眾迫切需要的,這就是口語翻譯。但從商業(yè)角度或者研究角度看,全自動(dòng)口語翻譯還是一件十分遙遠(yuǎn)的事情??谡Z翻譯下一個(gè)10年可以預(yù)測(cè)發(fā)展最廣泛的是口語翻譯。目前的研究項(xiàng)目(ATR、C-STAR、JANUS、Verbmobil等等)都是在80年代末和90年代初開始的。實(shí)際應(yīng)用在下個(gè)世紀(jì)前可能不現(xiàn)實(shí)。這些系統(tǒng)都限制在小領(lǐng)域中。不管期望值多么高,再用20年時(shí)間或更長(zhǎng),出現(xiàn)實(shí)用的,面向非受限領(lǐng)域的口語機(jī)器翻譯都是不可能的。比較實(shí)際的情況應(yīng)該是受限領(lǐng)域的應(yīng)用,比如財(cái)經(jīng)和股票市場(chǎng)數(shù)據(jù)的查詢系統(tǒng),商業(yè)談判的交互式系統(tǒng),公司內(nèi)部交際系統(tǒng)等等。 ?? 口語翻譯可能是目前機(jī)器翻譯研究中最富有創(chuàng)新意義的領(lǐng)域,吸引了最多的資金和公眾注意力。但觀察家們并不相信這一領(lǐng)域在近期能取得迅速進(jìn)展,因?yàn)闀嬲Z機(jī)器翻譯花了數(shù)十年才達(dá)到現(xiàn)在的水平??谡Z翻譯方面的另一項(xiàng)努力始于1993年5月由德國科學(xué)技術(shù)部出資支持的VERBMOBIL項(xiàng)目。該項(xiàng)目的目標(biāo)是開發(fā)一個(gè)便攜式商務(wù)談判的輔助工具,好幾所德國大學(xué)參與了這項(xiàng)對(duì)話語言學(xué)、言語識(shí)別和機(jī)器翻譯設(shè)計(jì)的基礎(chǔ)性研究工作。目前系統(tǒng)原型的開發(fā)已經(jīng)接近尾聲,很快將有演示產(chǎn)品出現(xiàn)。
機(jī)器翻譯系統(tǒng)正在開拓新的領(lǐng)域:幫助需要用外語寫作的作家生成文章草稿、在線電視解說詞翻譯、翻譯數(shù)據(jù)庫信息等。中國GDP的持續(xù)增長(zhǎng),PC和手機(jī)用戶的增加,internet的高速發(fā)展,語言翻譯、手機(jī)翻譯、互聯(lián)網(wǎng)翻譯(電子郵件、跨語言的查找和搜索引擎結(jié)果的翻譯等等)、多語言寫作和生成技術(shù)等等的需求會(huì)持續(xù)增加。這樣,隨著市場(chǎng)和收費(fèi)系統(tǒng)的完善,翻譯軟件的銷量會(huì)大幅度提高。
4.2 嵌入式讓翻譯軟件機(jī)器翻譯又一春
幾年前,翻譯軟件等面向個(gè)人的應(yīng)用軟件在IT市場(chǎng)非常活躍。但由于盜版猖獗,這類軟件價(jià)格日益走低,軟件的嵌入式得出現(xiàn),開辟了一個(gè)更大的市場(chǎng)。聽說某種嵌入式翻譯軟件品牌的人并不多,甚至很多它的使用者都不知道。為客戶持續(xù)地提供翻譯產(chǎn)品和翻譯服務(wù),包括國際短信翻譯網(wǎng)關(guān)及其平臺(tái)、翻譯引擎、全文翻譯器、電子詞典、移動(dòng)應(yīng)用軟件開發(fā)、移動(dòng)產(chǎn)品測(cè)試等。這就是嵌入式軟件的一個(gè)特點(diǎn),它總是在幕后為用戶服務(wù)。在學(xué)習(xí)機(jī)、手機(jī)上、翻譯機(jī)、旅游機(jī)、智能手機(jī)、數(shù)字電視、以及汽車電子的嵌入式應(yīng)用,是這次機(jī)遇中難遇的切入點(diǎn);機(jī)遇與挑戰(zhàn)并存。
首先一個(gè)市場(chǎng)是數(shù)字電視市場(chǎng)。中國有8000萬戶有線電視網(wǎng)用戶、1億以上有線電話網(wǎng)用戶、3億多臺(tái)彩色電視機(jī)、7000多萬臺(tái)VCD/DVD機(jī),據(jù)估計(jì),未來十年是機(jī)頂盒的黃金時(shí)期,十年間總量可達(dá)到1~1.5億臺(tái),總產(chǎn)量將達(dá)到600~1500億元人民幣。
第二個(gè)市場(chǎng)是移動(dòng)通信市場(chǎng)。中國是全球第二大手機(jī)消費(fèi)國,今年,中國手機(jī)的用戶將達(dá)到7000萬,據(jù)預(yù)計(jì),明年,中國將成為全球第一大手機(jī)消費(fèi)國;國內(nèi)GSM手機(jī)定點(diǎn)廠家已達(dá)到14家,如果每個(gè)手機(jī)定點(diǎn)廠家的年產(chǎn)量達(dá)到100萬臺(tái)(盈利點(diǎn)),則總產(chǎn)量將達(dá)到1400萬臺(tái)。
第三個(gè)市場(chǎng)是掌上電腦(PDA)。計(jì)算機(jī)正在向微型化和專業(yè)化方向發(fā)展,PDA在5年內(nèi)總銷量將達(dá)到3000萬臺(tái),總產(chǎn)值達(dá)到300億元。
機(jī)器翻譯(整句翻譯)引擎還應(yīng)用在電子詞典產(chǎn)品、學(xué)習(xí)機(jī)產(chǎn)品、手機(jī)等PDA產(chǎn)品,還可在學(xué)習(xí)機(jī)領(lǐng)域進(jìn)行平臺(tái)的移植。隨著中外交流的發(fā)展,中國GDP的持續(xù)增長(zhǎng),PC和手機(jī)用戶的增加,internet的高速發(fā)展,語言翻譯、手機(jī)翻譯、互聯(lián)網(wǎng)翻譯(電子郵件、跨語言的查找和搜索引擎結(jié)果的翻譯等等)、多語言寫作和生成技術(shù)等等的需求會(huì)持續(xù)增加。這樣,隨著市場(chǎng)和收費(fèi)系統(tǒng)的完善,翻譯軟件的銷量會(huì)大幅度提高。
5.對(duì)未來市場(chǎng)機(jī)器翻譯的一些看法
綜合以上分析,可以看出機(jī)器翻譯的市場(chǎng)前景極其廣闊,結(jié)合具體的調(diào)研談一下自己的看法。
(1)嵌入式軟件市場(chǎng)前景廣闊,目前市場(chǎng)上的機(jī)器翻譯軟件眾多,而且都有了一定的積累和客戶群。而國內(nèi)開發(fā)的各種專業(yè)翻譯軟件,操作方便程度及翻譯準(zhǔn)確性、可讀性都相差不大,翻譯機(jī)理大同小異。而嵌入式機(jī)器翻譯軟件是未來機(jī)器翻譯軟件的一個(gè)新的突破點(diǎn)。
(2)尋求合作,充分利用我們?cè)谧匀惶幚矸矫娴膬?yōu)勢(shì)和成果,與一些大的技術(shù)公司尋求合作,共同開發(fā)。以華建為例,與臺(tái)灣HTC(中文名稱為“宏達(dá)國際”)集團(tuán)合作生產(chǎn)中文WinCE掌上電腦,為其提供嵌入式軟件,該電腦半年內(nèi)銷量即達(dá)30多萬臺(tái),產(chǎn)值達(dá)到10億元,成為世界銷量第一的中文WinCE產(chǎn)品。與中國電信、中國聯(lián)通、中國吉通、魯能集團(tuán)等合作建設(shè)網(wǎng)站,并為其提供網(wǎng)絡(luò)集成平臺(tái)。
(3)應(yīng)當(dāng)把技術(shù)和應(yīng)用相結(jié)合,關(guān)鍵是如何把現(xiàn)有資源利用起來。根據(jù)用戶需要的改變隨時(shí)改變自己的研究方向,同時(shí)也要學(xué)會(huì)培育市場(chǎng),引導(dǎo)市場(chǎng)。
(4)任何一種軟件,只要能滿足某一部分人需求就是好東西。不能過于追求大而全,從技術(shù)上來說。以德國的TRADOS為例,它的成功并不僅僅是靠技術(shù),而是其按專業(yè)定制,細(xì)分市場(chǎng)的營銷模式, 高端產(chǎn)品取決于軟件水平,而低端則取決于價(jià)格,做好低端市場(chǎng)是非常必要的。
由此可見,機(jī)器翻譯具有極其廣闊的應(yīng)用前景。機(jī)器翻譯技術(shù)具有巨大的應(yīng)用需求,隨著經(jīng)濟(jì)全球化時(shí)代的到來,如何克服語言障礙已經(jīng)成為國際社會(huì)共同面對(duì)的問題??梢哉f,多年來機(jī)器翻譯始終是國際學(xué)界、商界甚至軍界共同角逐的必爭(zhēng)之地。機(jī)器翻譯技術(shù)被列為21世紀(jì)世界十大科技難題的第一位。世界上各發(fā)達(dá)國家聚集各路高手,不惜以億萬重金投資,都試圖率先突破機(jī)譯的難關(guān),搶占翻譯機(jī)器的巨大市場(chǎng)。
總結(jié)
以上是生活随笔為你收集整理的机器翻译市场需求调研报告的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SAP增强 BADI屏幕增强实例(MIG
- 下一篇: gardner环 matlab,【mat