回应:Nishad的要点

Karen Coyle 回应:Nishad的要点
  • 下一个消息(通过线程):[Application-profiles-ig]定义和形式
  • 信息分类:(日期)(线程)(主题)(作者)

  • Tom等人,在会议上,John建议在引用名称空间的地方使用名称空间列。我在会议期间模拟了[1]的一个示例,但事实是,单个行可能使用多个名称空间(即属性和值类型)。尽管我所做的是试图将名称空间与它被前缀引用的行对齐,但似乎没有理由名称空间列自己在一行中;而且,每个id/名称空间对只需要引用一次。我意识到它可能在视觉上不协调,但这个[2]似乎是另一种可能性,其中id/域名在任何一行中陈述一次,但在正确的列。kc [1]https://github.com/kcoyle/RDF-AP/blob/master/test.csv[2]https://github.com/kcoyle/RDF-AP/blob/master/test2.csv在4/8/20上午6:54,Thomas Baker写道:>嗨Nishad,>>在你的要点[1],我真的很喜欢这个想法>前缀在CSV的顶部!>>最初,我喜欢将每一行分配为a的想法>"type",原则上允许三种类型的东西:>>*配置文件本身的URI(“BASE”)>*命名空间的声明前缀>*语句(与实体关联的属性/值对)。>>...共享一组列。>>但是,我同意Phil关于名称空间的观点>uri并不适合“属性”。如果我们想>遵循RFC 4180[2],“通用格式和MIME类型的CSV>(2005),这意味着我们定义了一个头文件(或>隐式消息头):>>将包含对应于>文件,并应包含相同数量的字段>文件其余部分的记录…>>换句话说,如果前缀要被容纳进>平的,rfc4180兼容的格式,我没有办法>至少再添加一个列(这里是“namespace”)。>>然后让ID列作为的标识符>“基本”id、“前缀”id、“实体”id和“语句”>身份证似乎有点牵强。>>我仍然不确定为什么声明需要有>语句的标识符(例如。, B9“标题”,B10>“发布日期”)。在你的要点:>>*“实体”ID B11 ('person')被引用>第8行中的值('@person')。>>* "statement" id(如果我理解正确的话>function)——'title', 'pubDate', 'name', 'email',>'birthDate'——实际上没有被任何引用>CSV中的其他单元格。>>我创造了一个反义词,可以重新排列事物>这要看我怎么看了。>>我很抱歉这是最后一刻才送来的,但是>也许我们可以简单地分享屏幕,然后讨论>在调用。>>一会儿聊!>汤姆>>[1]https://gist.github.com/nishad/1339d3962002eea3f9282e4ef4b2b09c>[2]https://tools.ietf.org/html/rfc4180>[3]https://gist.github.com/tombaker/4c54606ef0dd033b6f306e23764ea384>>2020年3月26日星期四05:27:53PM +0000, Nishad thalhas写道:>>日期:2020年3月26日星期四17:27:53 +0000>>来自:Nishad thalhas <nishad thalhath.org>>>:“application-profiles-ig lists.www.voudr.com>><application-profiles-ig lists.www.voudr.com>>>主题:[Application-profiles-ig]对CSV格式的一些建议>>内容类型:multipart /替代;>>边界= " _000_0036F9E8BAD64FFAA2DB2D1ED0C15AA6thalhathorg_ ">>列表档案:<https://lists.www.voudr.com/pipermail/application-profiles-ig/>>>发送者:Application-profiles-ig>><application-profiles-ig-bounces lists.www.voudr.com>>>>>亲爱的凯伦、汤姆和大家:>>>>基于上次会议[1],提出的简单CSV[2]格式,ShEx statements[3], SimpleDSP[4],以及简单格式[5]的形式主义,我想对简单CSV格式提出一些最小的改变。>>>>由于这些基于CSV的创作格式具有SimpleDSP的共同特征,如果我们能够避免它的注意事项,将会很有帮助。>>>>这个想法是让它更符合标准的CSV,利用ShEx的潜力。此外,它还可以在不同的序列化格式之间转换。>>>>我的建议的一个例子是[6]:https://gist.github.com/nishad/1339d3962002eea3f9282e4ef4b2b09c>>>>以下是拟议的改动:>>1.根据rfc4180[7],每个记录位于单独的行上>>2.一个通用的标题行和列的顺序是不相关的,但表示使用概要文件词汇表的组件。>>3.一个可选的'type'行,用于指示记录的类型。在真正简单的概要文件中,或者没有前缀或实体的概要文件中,并不需要它。>>4.'type'可以是任何BASE、前缀、实体或属性。默认值是'property',如果没有给出,则返回默认值。>>5.可选'ValueType', (Literal, Nonliteral, IRI)默认为'Literal',并映射到shex: nodeconconstraint。对于更简单的概要文件,这也是一个可选的行,但是对于高级概要文件的RDF、ShEx、ShExR和OWL表达式很方便。>>6.'Value'是可选的,默认为'text'或'xsd:string'。'value'可以只是一个数据类型,也可以是一个用ShExC表示的ShEx约束字符串。例如,shex:IRIStem, 'xsd:float mininclu3.14 maxinclu9.0 '或'xsd:string ["foo" "bar"]'>>7.统一的ID,便于转换为ShEx, RDF,或JSON-LD。统一ID更适合于设计高效的解析器和转换器。>>>>优点是:>>1.从实现者的角度来看,每个单元都可以用命名标签来处理,这对于模板和适应复杂的用例来说要容易得多。>>2.CSV可以与任何数据序列化格式(如JSON、NDJSON或YAML)互操作,没有任何损失。>>3.根据用例,工作表可以使用自定义行水平扩展。不过,它并没有打破DCAP-2的定义。>>4.标题标签有助于在类似格式(如ShExstatements)之间创建简单的转换。>>5.类型声明使得每个记录都是可操作的,而无需编程开销。>>6.每个元素(包括前缀)都可以在一个有效的CSV中声明。>>7.它不需要对当前CSV格式的简单概要文件进行任何更改,只需要合并ID字段。>>>>我的进一步建议是将“值”拆分为“数据类型”和“约束”,这样格式就可以进一步互操作。此外,Constraints还可以使用ShExC文本约束字符串来记录复杂的规则,否则这些规则很难用表格格式表示。>>>>simpleCSV的所有其他属性都被维护,例如未转义的'@'作为ID的指针。所有在“entity”后面声明的属性都属于“entity”。只有在有效的CSV中表示完整的元数据应用程序配置文件时,才需要所有这些最小的更改。>>>>Nishad>>>>[1]https://github.com/dcmi/dcap/blob/master/meetings/2020/2020-03-18.dcap_zoom_call.md>>[2]https://github.com/dcmi/dcap/blob/master/prototypes/simple/simpleInstance.csv>>[3]https://github.com/johnsamuelwrites/ShExStatements>>[4]https://metabridge.jp/tutorial_dsp.html>>[5]https://github.com/dcmi/dcap/blob/master/prototypes/simple/formalisms.md>>[6]https://gist.github.com/nishad/1339d3962002eea3f9282e4ef4b2b09c>>[7]https://tools.ietf.org/html/rfc4180#section-2>>>——Karen Coylekcoyle kcoyle.nethttp://kcoyle.netskype: kcoylenet


    关于Application-profiles-ig邮件列表的更多信息