从语言沟通看AI离真正的智能还有多远

时间:2023-06-07 19:06:03 公文范文 来源:网友投稿

摘 要:谈及AI时代,人类将面对史无前例的失业潮,然而当这个时代初露光芒的时候,展现的却是辅助人类更好完成工作的能力。在使用的过程中,有些行业的表现符合期待值,有些行业的表现揭示了这一个时代或许远未来到。

关键词:AI;满足;实现;翻译;开发

作者简介:郭衡广(1988.8-),男,汉族,湖南省衡阳市人,对外经济贸易大学英语学院,研究生在读,研究方向:外国语言学及应用语言学。

[中图分类号]:H08 [文献标识码]:A

[文章编号]:1002-2139(2018)-26--02

每隔一段时间,总会因为一件新发明普及应用,引发新一轮失业恐慌。寒暑历经千载,从未有过比AI更令人紧张焦虑的冲击。它不仅以更彻底,更深刻,更广泛地姿态进入日常生活,还以更受欢迎的形式永久取代了一个又一个传统行业。持续几十年的告诫——“机器将取代人类”不再是饭后笑谈,随着AI一代代更新,这句告诫正一步步成为可能。

这种可能最初认定为一只没有耳朵的蓝色机器猫。因为它幽默风趣,携带各种稀奇古怪的发明,总能恰到好处满足主角的愿望,比人类更加智能,更能适应各种环境变换。它创作不久就风靡全球,大众甚至把它奉为AI的终极形态。画面与好莱坞商业电影差距巨大,有些许争执,但其影响力无可非议。动画片中许多发明在上个世纪80年代看起来是天方夜谭,如今已经一一实现,并且比当年设想的构造更加先进,比如3D打印机,立体全息投影,全球定位系统等等。

每一件发明都完美贴合设想的背后,基于有效顺畅的沟通,才能让机器猫快速准确处理人类语言信息,并适当给出最完美的方案。若发生卡顿,那么一切都不会实现。这恰恰是所有发明中最难以实现的部分。人之所以为人,是因为人类有自我意识,能思考,能创造,能产生喜怒哀乐,用理智去适应和造福世界。而机器猫更像是一种辅助程序,执行任何即时命令,让人类生活的障碍与挫折变成打怪升级的小关卡。

迄今为止,使用频率最接近与机器猫沟通的智能程序是Siri。无论使用者是中国人还是美国人或者来自他地区的公民,架起智能程序与人类沟通的桥梁必须通过语言来实现。无论是早期只能哼哼歌的siri,还是更趋人性化的siri,通过特定的算法和结构,仅可以高效的完成人类交给的单一任务。触发任务并非全语音操控,必须在即时语音对讲之前,点击特定的功能选项,说出一段完整的简单句。比如对siri说“找寻附近的银行”,它将以当前GPS定位为基准,搜出符合目标语言的所有选项。语句再复杂一点,增加几个修饰语,如“找寻附近有快递的银行”,它将显示两种结果,一种结果是附近快递和银行在同一个系统的邮政银行,另一种就是离快递很近的银行。在中国,正确答案显然是前一种。因为银行设点常常处于城市的繁华地段,快递网点更多位于租金低廉的偏僻地带。看起来有点挫折,然而表现结果至少做出了快速反应。将语句的难度再进行提高,加入地方特色或者行业术语等等,如“找寻附近可做跨境购付无纸化的银行”,它将一遍一遍重复:“请再说一次,我听不懂您的意思。”

中文也许不是开发者所擅长的语言,那么换成开发者所在国家的母语,其结果依旧难以让人满意。按住语音输入虚拟话筒,发出指令“How to get the nearest bank?(找寻最近的银行)”它搜索英语的速度比中文快很多,词条识别准确,夹杂一段诙谐流利的调侃:“Be careful your wife(小心枕边人)”。如同使用中文时一样的操作,给输入的语句加一点限定词:“How to get the nearest bank with express?(哪有银行办理快递业务)”。它瞬间秒回附近所有的快递和银行网点,显然它将express和bank识别为2个独立的单位。再加入指定更加明显的地域背景:“How to the nearest bank between a hospital and a hotel”,它将不知所云,并迅速流利地迸出一套非常官方的說辞:“I don’t know where you are, but you can show me . Go to Settings, tap Privacy, tap LocationServices and turn it on. Then scroll to Siri and turn that on, too.(请提供最正确的定位。依次进入设置-隐私-定位,重新点开siri进行操作)”。相比中文,Siri处理英语的信息变得更加丰富流畅,结果依旧存在盲区,难以传递最合适最准确的答案。虽然联网让Siri拥有庞大的语库,但增加的便利有限。

无论上述任何一种语句都必须完整无停顿输入,如果在语句输入后,Siri捕捉到了呼吸声,或者人下意识的语气叹词,比如嘿嘿、哈哈、呵呵等,它将自我检索许多不受控制的词汇,从而提供一大堆偏离原指令的选项。

仅仅是测试siri不能完全概括目前AI所达到的高度。翻译是目前遭受AI挑战最瞩目的行业。双语转换一直当做不可企及的高峰,不同语言之间存在大量独特的根植于本土文化的特有词汇,属于不可转译的范畴。

谷歌作为世界上AI技术最发达的公司之一,开发了GNMT(神经网络机器翻译技术),宣布其可以模仿人类思考,翻译的误差率降低了55%~85%。据统计表明,英语使用者遍布全球3/5的国家地区,中文使用者超过18亿人,占据全球接近1/3的人口,中英互译是AI翻译的核心业务。从短句至长句依次检验AI中英互译达到何种水平。

第一组为中文翻译为英语的短语:

皮皮虾!我们走!

Mantis shrimps! Let’s go!

小心夹手!

Careful grip!

请出示邀请函!

Please show your invitation!

第二组为英语翻译为中文的短语:

After death!Your doctor!

死后!你的医生!

Heads up! Watch out!

抬头!小心!

Why do you want a Visa for?

为什么要签证?

AI第二组的表现明显比第二组提高了准确率,但仍让人难以满意。“皮皮虾”在中国人眼中,特指体型弱小,战斗力强大的生物。骑上皮皮虾走路表达自身无可比拟的运气征服了强大的生物。正确的译句应该是“I am a lucky dog”。Your doctor并不是指一个人的医生,而是指曾经有位医生,总是在人死后才到。全句引义为雨后送伞。GNMT遇到约定俗成的言语表达时,总是倾向于翻译字面的意思,忽略了文化背景,所以造成了目标语言原意丢失。

而其翻译简单警告标示亦有点不伦不类。“小心夹手”为省略主语的动宾结构,提醒人手远离狭小缝隙的地方,以免发生危险。Careful grip指小心抓取,与原意相去甚远,起到警告相反的作用。将第二组的“Heads up!Watch out!”改为“Fingers off!Watch out!”,或许更接近原意。

再将其置于日常生活应用场景中,得益于网络越来越发达,语料库有足够的匹配选项,两组短句翻译非常准确。如果放到元素比较多的语境之中,GNMT展示了另一幅面孔。例如:

据北京市住建委员会网站显示,2018年北京将有三个房地产项目获批预售证,均位于朝阳区,分别为远洋山水、金隅时代、时代庄园。

According to the website of the Beijing Municipal Housing and Construction Committee, in 2018, three real estate projects in Beijing will be approved for pre-sales, all located in Chaoyang District, namely Ocean Landscape, Jinluo Times and Times Manor.

根據语境,“远洋山水”、“金隅时代”、“时代庄园”都是楼盘名称,应当使用拼音直译。至于名称背后传递的意境,GNMT完全从字面上翻译,缺失了原意的美好。

随着全球经济合作越来越频繁,双语交流已经远远满足不了需求,三种语言及以上的多语交流频频发生。GNMT以掌握语言的数量占据绝对性的压倒优势,至于效果,依旧要打上一点折扣。输入“难以说出口的事情往往是最重要的”,其提供的英语译句即“Things that are difficult to say are often the most important”,法语译句即“Les choses difficiles à dire sont souvent les plus importantes”。

对AI来说,最难的不是技术,而是意识。无论是Siri或者GNMT,虽然各有侧重,但依旧无法清晰区分语言各要素在不同的国家,不同的位置,含义与词性已经发生了改变,只能逐字逐句一一对应翻译,内在的逻辑关系往往置之不理。字词的翻译准确率高,结构却很松散,亦不符合语法习惯。“Things that are difficult to say are often the most important”的正确译文为“Those hard to say are always the most important”。“Les choses difficiles à dire sont souvent les plus importantes”的正确译文为“Les choses qui sont difficiles à dire sont souvent les plus importantes”。

如今的AI是一种“弱智AI”,虽然在制造业领域,AI正以推古拉朽之势,让一家家企业改良了生产设备,优化了人才结构。但与人类沟通不是基于理解语言,而是不断对单一词语的解码与编码,无法拥有人类的思考能力,也无法获悉每种文明背后的深厚底蕴,只能依照脚本,运行设定好的情节。单语、双语和多语之中的交流,经常产生误解,难以实现无障碍问答。

至于制造“高智AI”仍遵循“科幻先于科学”的规律。在科幻作品中,它拥有人类一样的分析判断能力,能根据不同场景,快速学习掌握周围的信息,可以是人类情感伴侣,也有可能站在生物链最顶端。而此刻,形形色色伫立在各个角落的智能设备,或缩在标题栏左侧的智能程序,以及爱不释手的智能玩具,咿咿呀呀如同婴儿一般,重复着机械简单的工作,或许还没到形成思考的概念。

参考文献:

[1]张天蓉,《从掷骰子到阿尔法狗:趣谈概率》,清华大学出版社,2018年6月.

[2]张玉宏,《深度学习之美:AI时代的数据处理与佳实践》作者:张玉宏,电子工业出版社,2018年6月.

[3]黄美灵《Spark MLlib机器学习:算法、源码及实战详解》,电子工业出版社,2016年3月.

[4]郑泽宇,梁博文,顾思宇,《TensorFlow 实战Google深度学习框架》,电子工业出版社,2018年2月.

[5]唐旭日,张际标,《计算机辅助翻译基础》,武汉大学出版社,2017年7月1日.

[6]杰里米·芒迪(英),《翻译学导论:理论与应用》(第3版),外语教学与研究出版社,2014年9月1日.

[7]彭萍,《实用英汉对比与翻译(英汉双向)》,中央编译出版社,2012年10月.

[8]David·W·Ferguson,《我可能学的是假英语》,石油工业出版社,2018年2月.

推荐访问:沟通 还有多远 语言 智能 AI