元数据设计、实施和最佳实践方面的创新

专题:人工智能为何≠自动索引:什么是可能的,什么是不可能的

标题: 为什么AI≠自动索引:什么是可能的,什么是不可能的
主办及主持: 约瑟夫·布希
日期: 2021-10-13 14:00

说:
汉斯Brandhorst
汉斯Brandhorst
摩涅莫辛涅
汉斯·布兰德霍斯特(Hans Brandhorst,莱顿,14-07-1956),独立艺术历史学家,Iconclass系统和Arkyves的编辑。他和Etienne Posthumus一起创建了在线Iconclass浏览器和Arkyves网站。他发表了插图手稿、象征和装置、肖像和分类,以及数字人文。他曾在莱顿大学(Leiden University)接受艺术史培训,自20世纪80年代以来一直使用Iconclass作为肖像学者。他是乌得勒支大学(Utrecht University)团队的一员,该团队在20世纪90年代开发了该系统的计算机版本。自2000年以来,他一直担任在线Iconclass系统的编辑。他的主要研究重点是一个简单的问题“我在看什么?”他的理论工作涉及人文学者,特别是肖像学者,如何合作和丰富彼此的研究成果,而不是重复和重复努力的问题。他认为,要做到这一点,使用共享词汇来描述文化文物的内容(Iconclass)是一个重要条件。除了Iconclass和Arkyves的编辑,Hans Brandhorst还参与了为Brill Publishers编写的Kirschbaum 's lexkon der Christlichen Ikonographie的数字化工作,他是Journal Visual Resources的编辑顾问委员会成员。最近,他与André van de Waal共同创立了“亨利·范德瓦尔基金会”(Henri van de Waal Foundation),致力于借助人工智能(Artificial Intelligence)和机器学习(Machine Learning)等现代技术进行肖像研究。


乔奎姆更多洛佩兹
乔奎姆更多洛佩兹
巴萨的超级计算中心
Joaquim Moré López博士是计算机语言学高级研究员和专家。他在加泰罗尼亚开放大学(the Open University of Catalonia)获得知识与信息社会博士学位。他的主要专业领域是机器翻译,信息提取,文本挖掘,自然语言处理,知识工程和意见挖掘。他正在积极的二元同步通信Oficina Tecnica德行为的计划Nacional de Impulso las Tecnologias▽Lenguaje,由西班牙Ministerio de Asuntos期中y Transformacion数字化,利用HPC利用自然语言处理的可能性为公共和私人机构。他为圣乔治自行车项目中与自然语言处理相关的问题提供了解决方案。


玛吉Hlava
马约莉Hlava
访问的创新
她在美国国家航空航天局工作了5年,每周在线搜索多达20个小时,使用系统并给出反馈。Margie曾任美国能源部国家能源信息中心及其附属机构NEICA的信息主任,在那里她曾担任信息主任的职位,之后她将团队私有化为Access Innovations。Margie开发了Data Harmony软件套件,以提高搜索的准确性和一致性,同时简化编辑和索引任务中的文书方面。她最近的创新是在一个名为Access Integrity的新应用程序中,将这些系统应用于医疗记录,以确保医疗索赔合规。Margie曾在NISO董事会任职7年,担任SLA标准委员会主席9年,并于2001年至2016年担任NFAIS标准委员会主席。她在同义词典和受控词汇(Z39.19)、都柏林核心(Z39.85)、DOI (Z39.84)的NISO标准的工作中发挥了重要作用,并贡献了元数据,它形成了CrossRef的基础,作者贡献的信用分类法和其他。她曾担任NFAIS主席并两次在该董事会任职,曾担任美国信息科学与技术协会(ASIS&T)主席,文件摘要主席,ASIDIC主席,IIA与SPA合并成为SIIA时的财务主管。她还回馈当地社区,在新墨西哥信息共享、哈贝尔住宅联盟、新墨西哥数据流和哈贝尔社会博物馆和图书馆的董事会任职。Margie的工作获得了众多奖项的认可,包括ASIS&T的沃森戴维斯奖、SLA John Cotton Dana和SLA总裁奖、SLA Fellow的认可,以及阿尔伯克基商业技术第一女性的影响力。2014年2月,她获得了NFAIS的Miles Conrad讲师职位。 In November 2014, she received the ASIS&T Award of Merit. She was elected to the Hubbell Hall of Fame in June 2019. She is the author of multiple books and more than 200 articles, including the The Taxobook, a three-volume collection on the history and implementation of taxonomies. She holds two U.S. patents encompassing 21 patent claims.


Maria-Cristina Marinescu
Maria-Cristina Marinescu
巴萨的超级计算中心


Mingfang吴
Mingfang吴
澳大利亚研究数据共享(ARDC)
吴明芳博士,澳大利亚研究数据共享中心(ARDC)高级研究数据专家。她在交互信息检索、搜索日志分析、支持探索性搜索和企业搜索的接口等领域进行了研究。她最近的研究重点是作为研究数据联盟(RDA)倡议的一部分的数据发现范式,以及改进澳大利亚国家研究数据目录的数据发现服务,以及一些数据管理相关的主题,如数据来源,数据版本和数据质量。


Osma Suominen
Osma Suominen
芬兰国家图书馆
Osma Suominen是芬兰国家图书馆的一名信息系统专家。他目前致力于自动主题索引,特别是Annif工具和Finto AI服务,以及以关联数据的形式出版书目数据。他也是Finto的创造者之一。fi同义词典和本体服务,并在Finto中使用的Skosmos词汇浏览器的领先开发。Osma Suominen在阿尔托大学(Aalto University)获得了博士学位,同时在FinnONTO系列项目中从事语义门户和受控词汇表质量的研究。

文摘:

自动索引只与训练集或域可用的规则一样好。重要的是要了解预先训练过的算法所训练的内容类型。考虑什么类型的内容很容易用于训练算法——什么是流行的,什么是可用的。学术和历史内容无法以机器学习所需的大量可消费格式提供。但也有例外,如科学和医学,这些领域有大量的文献资料。这个小组将讨论自动分类的当前状态,涵盖研究数据、艺术史和科学出版等领域。我们的目标是就如何采取有意义的步骤来构建可持续自动化索引所需的基础设施提供实用的建议。