元数据设计、实施和最佳实践方面的创新

专题:人工智能为何≠自动索引:什么是可能的,什么是不可能的

标题: 为什么AI≠自动索引:什么是可能的,什么是不可能的
主办及主持: 约瑟夫·布希
日期: 2021-10-13 14:00

说:
汉斯·布兰德霍斯特
汉斯·布兰德霍斯特
摩涅莫辛涅
汉斯·布兰德霍斯特(Leiden,1956年7月14日),独立艺术史学家,Iconclass系统和Arkyves的编辑。他与Etienne Posthumus一起创建了在线Iconclass浏览器和Arkyves网站。他出版过照明手稿、徽章和装置、图像学和分类以及数字人文学科。他曾在莱顿大学接受艺术史培训,自20世纪80年代以来一直使用Iconlass作为图像创作者。他是乌得勒支大学团队的一员,该团队在20世纪90年代创建了该系统的计算机版本,自2000年以来,他一直担任在线Iconclass系统的编辑。他的主要研究重点是一个简单的问题:“我在看什么?”?"在图像学意义上。他的理论工作涉及人文学者,特别是图像学家,如何合作和丰富彼此的研究成果,而不是重复和重复。他认为,要实现这一点,使用共享词汇描述文化艺术的内容cts-Iconclass-是一个重要条件。除了担任Iconclass和Arkyves的编辑之外,Hans Brandhorst还参与了Kirschbaum为Brill Publishers编写的《基督地衣》(Lexikon der Christlichen)Ikonographie的数字化工作,他是《视觉资源》杂志的编辑顾问委员会成员。最近,他与Andrévan de一起成立了瓦尔,“亨利范德瓦尔基金会”,致力于图像学研究的现代技术,如人工智能和机器学习的帮助。


乔奎姆更多洛佩兹
乔奎姆更多洛佩兹
巴萨的超级计算中心
Joaquim MoréLópez博士是计算语言学的高级研究员和专家。他有博士学位。在加泰罗尼亚开放大学的知识和信息社会。他的主要专业领域是机器翻译、信息提取、文本挖掘、自然语言处理、知识工程和观点挖掘。他正积极参与由西班牙亚松托斯经济和数字转型部赞助的国家动力计划(National de Pulso a las Tecnologías del Lenguaje)的理学学士(BSC),利用HPC为公共和私人机构开发自然语言处理的可能性。他在圣乔治自行车项目中为自然语言处理相关问题提供解决方案。


玛吉·赫拉瓦
马乔里·赫拉瓦
接入创新
她在美国国家航空航天局工作了5年,每周在线搜索多达20个小时,使用系统并给出反馈。Margie曾任美国能源部国家能源信息中心及其附属机构NEICA的信息主任,在那里她曾担任信息主任的职位,之后她将团队私有化为Access Innovations。Margie开发了Data Harmony软件套件,以提高搜索的准确性和一致性,同时简化编辑和索引任务中的文书方面。她最近的创新是在一个名为Access Integrity的新应用程序中,将这些系统应用于医疗记录,以确保医疗索赔合规。Margie曾在NISO董事会任职7年,担任SLA标准委员会主席9年,并于2001年至2016年担任NFAIS标准委员会主席。她在同义词典和受控词汇(Z39.19)、都柏林核心(Z39.85)、DOI (Z39.84)的NISO标准的工作中发挥了重要作用,并贡献了元数据,它形成了CrossRef的基础,作者贡献的信用分类法和其他。她曾担任NFAIS主席并两次在该董事会任职,曾担任美国信息科学与技术协会(ASIS&T)主席,文件摘要主席,ASIDIC主席,IIA与SPA合并成为SIIA时的财务主管。她还回馈当地社区,在新墨西哥信息共享、哈贝尔住宅联盟、新墨西哥数据流和哈贝尔社会博物馆和图书馆的董事会任职。Margie的工作获得了众多奖项的认可,包括ASIS&T的沃森戴维斯奖、SLA John Cotton Dana和SLA总裁奖、SLA Fellow的认可,以及阿尔伯克基商业技术第一女性的影响力。2014年2月,她获得了NFAIS的Miles Conrad讲师职位。 In November 2014, she received the ASIS&T Award of Merit. She was elected to the Hubbell Hall of Fame in June 2019. She is the author of multiple books and more than 200 articles, including the The Taxobook, a three-volume collection on the history and implementation of taxonomies. She holds two U.S. patents encompassing 21 patent claims.


玛丽亚·克里斯蒂娜·马里内斯库
玛丽亚·克里斯蒂娜·马里内斯库
巴萨的超级计算中心


吴明芳
吴明芳
澳大利亚研究数据共享(ARDC)
吴明芳博士是澳大利亚研究数据共享中心(ARDC)的高级研究数据专家。她在交互式信息检索、搜索日志分析、支持探索性搜索和企业搜索的界面等领域进行了研究。她最近的研究重点是作为研究数据联盟(RDA)倡议的一部分的数据发现范式,以及改进澳大利亚国家研究数据目录的数据发现服务,以及一些数据管理相关主题,如数据来源、数据版本控制和数据质量。


奥斯玛·索米宁
奥斯玛·索米宁
芬兰国家图书馆
Osma Suominen是芬兰国家图书馆的一名信息系统专家。他目前致力于自动主题索引,特别是Annif工具和Finto AI服务,以及以关联数据的形式出版书目数据。他也是Finto的创造者之一。fi同义词典和本体服务,并在Finto中使用的Skosmos词汇浏览器的领先开发。Osma Suominen在阿尔托大学(Aalto University)获得了博士学位,同时在FinnONTO系列项目中从事语义门户和受控词汇表质量的研究。

文摘:

自动标引只与训练集或领域可用的规则一样好。重要的是要了解预先训练的算法的内容是如何被训练的。考虑什么类型的内容容易被用来训练一个算法,哪些是流行的,哪些是可用的。可在机器学习所需的大量可消费格式中提供。也有例外情况,如科学和医学,其中有大量记录良好的收藏。该小组将讨论自动分类的当前状态,包括研究数据、艺术史和科学出版。The目标是就如何采取有意义的步骤建设可持续自动化索引所需的基础设施提供切实可行的建议。