Read Write Web上有一个很好的帖子,讲述语义技术不是什么,澄清了我的一些疑问,在这里与大家分享(不是翻译):
- 语义描述需要结构化方式,但语义数据不是简单的结构化数据。否则语义网早就可以依靠RDBMS实现了。关系型数据库是典型的结构化数据,但机器并不知道表结构中存储的是什么,没有任何语义标注机制,返回的结果也是靠人来解释的。
- “智能语言处理”并不是语义技术。诸如同义词环、词根匹配、自动智能分词等语言处理技术与语义技术有一定联系,但并不是一回事。
- 句法处理技术也不是语义技术。中文信息处理中大量采用习惯的语法规则,但是能够处理一种语言和“读懂”一种语言是不同的概念,处理只是根据事先设定好的规则,而“读懂”需要有知识的关联,甚至逻辑的判断。
- 统计规律也与语义技术无关(这一点似乎争议很大)。Google的Pagerank是通过链接统计得出的排序规则,准确度很高(相对而言),但却与语义没有任何关系。是不是结合一点点语义就能够有更好的效果呢?很多希望成为谷歌杀手的后起公司都在尝试,但至今尚未有成功迹象。
- 语义搜索是一种理想,实现这种理想是一项工程。好的想法不一定都能实现,特别是对于Web这样一个正在生长的复杂系统来说。
注:Hakia是一个“语义搜索引擎”。
Tags: Hakia, 语义技术, 语义搜索