社会生成标签的语义关系抽取:元数据生成方法

陈淼,刘小忠,秦健

摘要


大量的社会语义学资源同时呈现了这两种情况
元数据利用其信息能力的机遇和挑战
内容表示。其中一个挑战是缺乏上下文信息
这些标签在检索和自动处理中使用。这篇论文
报道了一项研究,该研究使用Flickr的用户生成标签作为社交的一个例子
语义源探索丰富主题元数据的新方法。的
提出的方法包括使用Flickr标签作为源,谷歌搜索结果作为
共现标记的上下文及其关系,以及自然语言
处理和机器学习作为处理技术。初步
实验根据谷歌搜索结果构建了一个上下文句子集合,该集合为
然后通过自然语言处理和机器学习算法进行处理。这
新方法在关联分配方面取得了较好的准确率
组的标签。本文进一步探讨了这一研究的方法论意义
使用社会语义学来丰富主题元数据的新方法。

全文:

PDF