标题: | 为什么AI≠自动索引:什么是可能的,什么是不可能的 |
主办及主持: | 约瑟夫·布希 |
日期: | 2021-10-13 14:00 |
自动索引只与训练集或域可用的规则一样好。重要的是要了解预先训练过的算法所训练的内容类型。考虑什么类型的内容很容易用于训练算法——什么是流行的,什么是可用的。学术和历史内容无法以机器学习所需的大量可消费格式提供。但也有例外,如科学和医学,这些领域有大量的文献资料。这个小组将讨论自动分类的当前状态,涵盖研究数据、艺术史和科学出版等领域。我们的目标是就如何采取有意义的步骤来构建可持续自动化索引所需的基础设施提供实用的建议。