Stron w wątku: < [1 2 3] > |
90%的人觉得机器翻译的内容有用是宣傳還是事實? Autor wątku: Kemp9
|
Kemp9 Chiny Local time: 20:50 chiński > angielski + ... NOWY TEMAT 我想了想,你的观点可能十年后就不对了。 | Sep 18, 2013 |
clearwater wrote: 我还是老观点,语言是活的,机器或技术是死的。 等真正能解决歧义句的理解和厘清句子的上下逻辑关系,那才能说机器翻译真正向前迈出了一大步。 总不至于机器翻译给我们列出N种翻译的可能性,再让译者逐一细辨别,从中选出正确的那个版本。即便这个,也够麻烦的了。 语言中同一个单词有N层意思或用法,更何况还会出现新的意思或用法,机器或技术总不至于能够穷尽吧。 2004年,经济学家Frank Levy和Richard Murnane在《新的劳动分工》一书中认为,有很多工作是不可能被机器取代的。比如驾车、复杂沟通等等。和算术不同,这些工作不是执行现有规则,而是规则不明确的领域,机器是不可能完成的。 而仅仅六七年后,2011年10月,Google 的自动汽车已累计行驶 30万公里,途经都市、高速路和山路。今年上半年,内华达州的机动车驾驶管理处甚至给Google无人驾驶汽车颁发了车牌。当然,Google说这个项目至少还要十年才能商用。—————— 我想了想,你的观点可能十年后就不对了。 | | |
Kemp9 Chiny Local time: 20:50 chiński > angielski + ... NOWY TEMAT
lbone wrote: 主要问题是中西跨语系,比较难的文字让活人来翻译能对上90%都不容易,能轻松翻对90%的文字,这种文字本身就比较简单,换谁都能翻对。 要想机器做中英、英中翻译能做到实用水平,那估计要等到机器人和活人真假难辨的时代了。 | | |
Yan Yuliang Local time: 20:50 angielski > chiński + ...
如果建立一个数学模型,把驾车相关参数全部都列出来,你会发现这些参数都是“硬”的,可以通过技术途径获得,并且可以通过运算得出确定结果的。 复杂沟通则截然相反,语言的解释和对应关系是“软”的。同样的单词,在不同的语境下可能有不同的意思,而且这些意思是无法穷尽的,也无法通过逻辑规则来判断的。因此,你无法通过技术途径,得出一个准确的... See more 如果建立一个数学模型,把驾车相关参数全部都列出来,你会发现这些参数都是“硬”的,可以通过技术途径获得,并且可以通过运算得出确定结果的。 复杂沟通则截然相反,语言的解释和对应关系是“软”的。同样的单词,在不同的语境下可能有不同的意思,而且这些意思是无法穷尽的,也无法通过逻辑规则来判断的。因此,你无法通过技术途径,得出一个准确的结果。也就是说,你无法建立一套规则或者一个模型,然后输入一种语言,就可以输出另一种语言。这在理论上是无法实现的。 因此,现在的机器翻译,是通过对海量材料的分析,寻求其匹配度;对于无法匹配的部分,再辅以语法规则和词典进行补充。但语言的多变性、演变性决定了这种匹配永远不可能达到很高的准确率。 10年?我觉得100年都不可能。 Bill Gates在上个时机就提出了智能家庭的概念,这个在技术上完全可行的,到今天都没有推广开来。更何况从最基本的技术原理上就是不可行的。 Kemp9 wrote: clearwater wrote: 我还是老观点,语言是活的,机器或技术是死的。 等真正能解决歧义句的理解和厘清句子的上下逻辑关系,那才能说机器翻译真正向前迈出了一大步。 总不至于机器翻译给我们列出N种翻译的可能性,再让译者逐一细辨别,从中选出正确的那个版本。即便这个,也够麻烦的了。 语言中同一个单词有N层意思或用法,更何况还会出现新的意思或用法,机器或技术总不至于能够穷尽吧。 2004年,经济学家Frank Levy和Richard Murnane在《新的劳动分工》一书中认为,有很多工作是不可能被机器取代的。比如驾车、复杂沟通等等。和算术不同,这些工作不是执行现有规则,而是规则不明确的领域,机器是不可能完成的。 而仅仅六七年后,2011年10月,Google 的自动汽车已累计行驶 30万公里,途经都市、高速路和山路。今年上半年,内华达州的机动车驾驶管理处甚至给Google无人驾驶汽车颁发了车牌。当然,Google说这个项目至少还要十年才能商用。—————— 我想了想,你的观点可能十年后就不对了。 ▲ Collapse | | |
Jinhang Wang Chiny Local time: 20:50 angielski > chiński + ... 我觉得 15-20 年内英译中翻译会取得飞跃性发展 | Sep 18, 2013 |
30年内没戏 lbone wrote: 主要问题是中西跨语系,比较难的文字让活人来翻译能对上90%都不容易,能轻松翻对90%的文字,这种文字本身就比较简单,换谁都能翻对。 要想机器做中英、英中翻译能做到实用水平,那估计要等到机器人和活人真假难辨的时代了。 而欧洲语言之间的机器翻译可能会达到实用性的水平。 机器中译英则比较难些。 让我们拭目以待。
[Edited at 2013-09-18 07:34 GMT] | |
|
|
Yan Yuliang Local time: 20:50 angielski > chiński + ...
如果是日常的对话,“实用”是指互相能听懂对方。 如果是复杂的技术文档,“实用”是指用户能按照文档解决技术问题。 如果是文学作品,“实用”是指读者能体验到文字的美妙、文字间的人文关怀与哲学思考等等。 ... ... 在商业社会,尤其是正式沟通文档的翻译,我的看法是:机器永远是不可信赖的。 但如果是非正式的文档或仅为互相了解,�... See more 如果是日常的对话,“实用”是指互相能听懂对方。 如果是复杂的技术文档,“实用”是指用户能按照文档解决技术问题。 如果是文学作品,“实用”是指读者能体验到文字的美妙、文字间的人文关怀与哲学思考等等。 ... ... 在商业社会,尤其是正式沟通文档的翻译,我的看法是:机器永远是不可信赖的。 但如果是非正式的文档或仅为互相了解,目前的机器翻译,已经能够解决很多问题了。 J.H. Wang wrote: 而欧洲语言之间的机器翻译可能会达到实用性的水平。 机器中译英则比较难些。 让我们拭目以待。 [Edited at 2013-09-18 07:34 GMT] ▲ Collapse | | |
Jinhang Wang Chiny Local time: 20:50 angielski > chiński + ... 个人对机器翻译抱乐观态度 | Sep 18, 2013 |
Yan Yuliang wrote: 如果是日常的对话,“实用”是指互相能听懂对方。 如果是复杂的技术文档,“实用”是指用户能按照文档解决技术问题。 如果是文学作品,“实用”是指读者能体验到文字的美妙、文字间的人文关怀与哲学思考等等。 ... ... 在商业社会,尤其是正式沟通文档的翻译,我的看法是:机器永远是不可信赖的。 但如果是非正式的文档或仅为互相了解,目前的机器翻译,已经能够解决很多问题了。 J.H. Wang wrote: 而欧洲语言之间的机器翻译可能会达到实用性的水平。 机器中译英则比较难些。 让我们拭目以待。 [Edited at 2013-09-18 07:34 GMT] 虽然有困难,但是我相信在不会很久的一天,机器翻译会比大多数人工翻译做得好。 想一想"深蓝"吧。:-) http://www.people.com.cn/GB/historic/0511/1558.html | | |
Yan Yuliang Local time: 20:50 angielski > chiński + ...
J.H. Wang wrote: Yan Yuliang wrote: 如果是日常的对话,“实用”是指互相能听懂对方。 如果是复杂的技术文档,“实用”是指用户能按照文档解决技术问题。 如果是文学作品,“实用”是指读者能体验到文字的美妙、文字间的人文关怀与哲学思考等等。 ... ... 在商业社会,尤其是正式沟通文档的翻译,我的看法是:机器永远是不可信赖的。 但如果是非正式的文档或仅为互相了解,目前的机器翻译,已经能够解决很多问题了。 J.H. Wang wrote: 而欧洲语言之间的机器翻译可能会达到实用性的水平。 机器中译英则比较难些。 让我们拭目以待。 [Edited at 2013-09-18 07:34 GMT] 虽然有困难,但是我相信在不会很久的一天,机器翻译会比大多数人工翻译做得好。 想一想"深蓝"吧。:-) http://www.people.com.cn/GB/historic/0511/1558.html 国际象棋实际上就是一堆数据和规则而已,电脑能超过人脑并不稀奇。 而语言的理解,涉及到模糊理解,并非准确的数字能够替代的。在对人脑的研究有重大突破之前,依赖现有的计算机技术是做不到的。 | | |
Jinhang Wang Chiny Local time: 20:50 angielski > chiński + ... 我所谓的 “实用” 的定义 | Sep 19, 2013 |
Yan Yuliang wrote: 如果是日常的对话,“实用”是指互相能听懂对方。 如果是复杂的技术文档,“实用”是指用户能按照文档解决技术问题。 如果是文学作品,“实用”是指读者能体验到文字的美妙、文字间的人文关怀与哲学思考等等。 ... ... 在商业社会,尤其是正式沟通文档的翻译,我的看法是:机器永远是不可信赖的。 但如果是非正式的文档或仅为互相了解,目前的机器翻译,已经能够解决很多问题了。 我说的“实用”,就是机器翻译能够达到或超过一般的人工翻译的水平,进而能够部分或全部取代人工翻译。我认为,就欧洲语言之间的翻译来说,这个梦想更容易变成现实。
[Edited at 2013-09-19 10:58 GMT] | |
|
|
Jinhang Wang Chiny Local time: 20:50 angielski > chiński + ...
Yan Yuliang wrote: 在商业社会,尤其是正式沟通文档的翻译,我的看法是:机器永远是不可信赖的。 但如果是非正式的文档或仅为互相了解,目前的机器翻译,已经能够解决很多问题了。 哈哈,我觉得,从发展的眼光而言,机器变得越来越可信赖了。而且,在越来越多的领域,机器会变得比人更可信赖。 | | |
Jinhang Wang Chiny Local time: 20:50 angielski > chiński + ...
Yan Yuliang wrote: 而语言的理解,涉及到模糊理解,并非准确的数字能够替代的。在对人脑的研究有重大突破之前,依赖现有的计算机技术是做不到的。 按照我的理解,要发展机器翻译技术,应该加强对语言本身、逻辑、数学、计算机技术等领域的研究。 当然,对人脑研究的重大突破有可能将机器翻译提升到“终结者”的水平。 | | |
Kemp9 Chiny Local time: 20:50 chiński > angielski + ... NOWY TEMAT 从而机器翻译会越来越接近完美,但可能永远不及人类。 | Sep 22, 2013 |
Yan Yuliang wrote: 如果建立一个数学模型,把驾车相关参数全部都列出来,你会发现这些参数都是“硬”的,可以通过技术途径获得,并且可以通过运算得出确定结果的。 复杂沟通则截然相反,语言的解释和对应关系是“软”的。同样的单词,在不同的语境下可能有不同的意思,而且这些意思是无法穷尽的,也无法通过逻辑规则来判断的。因此,你无法通过技术途径,得出一个准确的结果。也就是说,你无法建立一套规则或者一个模型,然后输入一种语言,就可以输出另一种语言。这在理论上是无法实现的。 因此,现在的机器翻译,是通过对海量材料的分析,寻求其匹配度;对于无法匹配的部分,再辅以语法规则和词典进行补充。但语言的多变性、演变性决定了这种匹配永远不可能达到很高的准确率。 10年?我觉得100年都不可能。 Bill Gates在上个时机就提出了智能家庭的概念,这个在技术上完全可行的,到今天都没有推广开来。更何况从最基本的技术原理上就是不可行的。 Kemp9 wrote: clearwater wrote: 我还是老观点,语言是活的,机器或技术是死的。 等真正能解决歧义句的理解和厘清句子的上下逻辑关系,那才能说机器翻译真正向前迈出了一大步。 总不至于机器翻译给我们列出N种翻译的可能性,再让译者逐一细辨别,从中选出正确的那个版本。即便这个,也够麻烦的了。 语言中同一个单词有N层意思或用法,更何况还会出现新的意思或用法,机器或技术总不至于能够穷尽吧。 2004年,经济学家Frank Levy和Richard Murnane在《新的劳动分工》一书中认为,有很多工作是不可能被机器取代的。比如驾车、复杂沟通等等。和算术不同,这些工作不是执行现有规则,而是规则不明确的领域,机器是不可能完成的。 而仅仅六七年后,2011年10月,Google 的自动汽车已累计行驶 30万公里,途经都市、高速路和山路。今年上半年,内华达州的机动车驾驶管理处甚至给Google无人驾驶汽车颁发了车牌。当然,Google说这个项目至少还要十年才能商用。—————— 我想了想,你的观点可能十年后就不对了。 同样的单词,在不同的语境下可能有不同的意思,而且这些意思是无法穷尽的,也无法通过逻辑规则来判断的。——我觉得这个确实是难点,但是应不是无法穷尽与判断的,Siri of Iphone 应该能判断一些句子,我想如果进一步升级以及结合深蓝等涉及的超级计算机技术,是有可能突破的,不过总体上看来确实很复杂,科学家彭罗斯根据数学家哥德尔的不完备定理,有争议地推断,意识过程是不可计算的,即无法实现强人工智能,即强AI。(量子之谜:物理学遇到意识 ; P293)。而哥德尔根据不完备定理及广义相对论,推断出没有时间的结论及时间旅行的可能性及哥德尔宇宙等(《没有时间的世界》)。所以从这个角度看,确实100年后也难以实现,不过我还是觉得人类还是尽量地无限接近地山寨出人类机器人,从而机器翻译会越来越接近完美,但可能永远不及人类。最近看到的一个新闻: 在数十年以前,IBM就为自动化翻译奠定了基础,但当时该公司所从事的项目毫无进展,不久以后就被放弃了。也正因如此,在奥驰及其同事在谷歌开始展开相关工作的头几年时间里,自动化翻译还只是一个“纯粹的研究项目”。但在最近,他们已经取得了重大的进展;按奥驰的话来说,这种进展可以说是一种“量子跃迁”般的重大突破。 当两种语言之间的结构相似且可用数据数量庞大时,谷歌翻译通常能有更好的表现。举例来说,英语和西班牙语之间的互译就是如此。但是,英语与日语之间的互译则没那么好。“不幸的是,英语和德语恰好是难以互译的一对语言。”奥驰说道。“这真让我头大。” | | |
Kemp9 Chiny Local time: 20:50 chiński > angielski + ... NOWY TEMAT 人基本没脑袋的(virtually no brain),但是有126的IQ,“and graduating with first-class h | Sep 22, 2013 |
J.H. Wang wrote: Yan Yuliang wrote: 而语言的理解,涉及到模糊理解,并非准确的数字能够替代的。在对人脑的研究有重大突破之前,依赖现有的计算机技术是做不到的。 按照我的理解,要发展机器翻译技术,应该加强对语言本身、逻辑、数学、计算机技术等领域的研究。 当然,对人脑研究的重大突破有可能将机器翻译提升到“终结者”的水平。 我看过一本书说科学杂志报道有个人基本没脑袋的(virtually no brain),但是有126的IQ,“and graduating with first-class honors in mathematics".( P13) | |
|
|
Yan Yuliang Local time: 20:50 angielski > chiński + ...
同一语系之间的机器翻译,表现可能更好,因为语言规则相似度更高。 “量子跃迁”的重大突破?我很怀疑。说实话,写这篇报道的记者对机器翻译有多少了解?关于新技术的报道,往往是吹嘘的居多。而对于他人语言的引用,往往因为缺乏语境,而容易误导。 http://news.zol.com.cn/article/161521.html 相比较而言,这里的减少人工翻译10%的工作量,我认为更加可信。 Kemp9 wrote: 在数十年以前,IBM就为自动化翻译奠定了基础,但当时该公司所从事的项目毫无进展,不久以后就被放弃了。也正因如此,在奥驰及其同事在谷歌开始展开相关工作的头几年时间里,自动化翻译还只是一个“纯粹的研究项目”。但在最近,他们已经取得了重大的进展;按奥驰的话来说,这种进展可以说是一种“量子跃迁”般的重大突破。 当两种语言之间的结构相似且可用数据数量庞大时,谷歌翻译通常能有更好的表现。举例来说,英语和西班牙语之间的互译就是如此。但是,英语与日语之间的互译则没那么好。“不幸的是,英语和德语恰好是难以互译的一对语言。”奥驰说道。“这真让我头大。” | | |
Kemp9 Chiny Local time: 20:50 chiński > angielski + ... NOWY TEMAT 这样的概率法应该不是根本的解决之道。 | Sep 22, 2013 |
Yan Yuliang wrote: 同一语系之间的机器翻译,表现可能更好,因为语言规则相似度更高。 “量子跃迁”的重大突破?我很怀疑。说实话,写这篇报道的记者对机器翻译有多少了解?关于新技术的报道,往往是吹嘘的居多。而对于他人语言的引用,往往因为缺乏语境,而容易误导。 http://news.zol.com.cn/article/161521.html 相比较而言,这里的减少人工翻译10%的工作量,我认为更加可信。 Kemp9 wrote: 在数十年以前,IBM就为自动化翻译奠定了基础,但当时该公司所从事的项目毫无进展,不久以后就被放弃了。也正因如此,在奥驰及其同事在谷歌开始展开相关工作的头几年时间里,自动化翻译还只是一个“纯粹的研究项目”。但在最近,他们已经取得了重大的进展;按奥驰的话来说,这种进展可以说是一种“量子跃迁”般的重大突破。 当两种语言之间的结构相似且可用数据数量庞大时,谷歌翻译通常能有更好的表现。举例来说,英语和西班牙语之间的互译就是如此。但是,英语与日语之间的互译则没那么好。“不幸的是,英语和德语恰好是难以互译的一对语言。”奥驰说道。“这真让我头大。” 我也觉得他是打广告的。。。后面的文段就承认不完美了。其原理: 谷歌翻译团队遵循自己的专长:海量数据处理和统计分析。“我们的系统所做的就是对比现有的翻译文本,自我学习,比如某个单词和某些词语的组合在另一种语言中最常见的翻译是什么,”奥克说,“最终我们计算的是翻译的可能性。”现有参照数据越庞大,这套系统就越准确。因此,只有在互联网出现之后,计算机翻译才成为可能。 这样的概率法应该不是根本的解决之道。 | | |
Jinhang Wang Chiny Local time: 20:50 angielski > chiński + ... 对于中文与外文之间的互译,我深以为然 | Sep 22, 2013 |
Kemp9 wrote: 这样的概率法应该不是根本的解决之道。 理由是,网上的译文质量一般都比较差,从而不太可能从中统计出高质量的译文,无论算法多完美。 | | |
Stron w wątku: < [1 2 3] > |