论文部分内容阅读
【摘要】在数字化图书馆的建设过程中,图书资料存储方式的自动化转换实现了图书资料的科学化存储,全面提高了图书馆的工作效率。本文对HTML表格向XML文档转换的图书资料存储方式进行分析和研究,以促进图书馆工作效率的提升,仅供相关人员参考。
【关键词】图书资料;存储方式;自动化转换;HTML表格;XML文档
图示资料是社会科技文化信息交流的重要方式,在数字化、网络化大环境下,传统的图书资料存储方式难以满足社会群体对知识获取的实际需求,因此改善图书资料存储方式和服务模式,实现HTML表格向XML文档的自动化转换,有助于提高图书资料的实际应用效果,从而推进数字化图书馆的建设发展。
一、HTML表格数据向关系数据库存储的转换
当前图书资料管理过程中,HTML表格主要是通过HTML文档来由数个标题组成,并且每一行中包含多个单元格,通过table来对其进行描述。单元格内部包含多元的数据信息,通过科学化的分类,来保证图书资料管理更具便捷性和高效性,促进图书资料管理效率的提升。随着网络化、数字化技术的有效应用,HTML表格的有效利用,使得图书资料数据管理更具规范性和可操作性,推进HTML表格图书资料管理逐步迈向规范化的发展道路,在一定程度上减轻图书资料管理人员的工作量,并提高图书资料检索的便捷性,如表1所示。
表1 新书架题录索引
(一)识别HTML表格的表头。表头是HTML表格来对不同图书资料进行准确识别的重要方式,通过合理的表头格式设置,数据信息显示准确,图书资料识别的精准度更高,便于图书资料管理系统自动按照有限顺序来对图书资料信息进行排列。常见的表头设置中,主要以字体、字号、数据等来进行显示,并在合理设置标准程序的基础上,结合行和列的特征值来对格式化的平均值进行精准的计算,以计算结果来对HTML表头来对图书资料进行准确的识别。在HTML表格中,假设每个单元格的特征值为0,每个单元格的字号为k,则可以得出不同的单元格特征值A。在加以准确计算后,能够对表格的行头和列头的特征值进行有效的区分,以任意两列的特征值为基础,可以计算出列头和数据的分解线。在明确HTML表格行头和列头的基础上,应当在HTML表格的右上角表明单元格的属性,并及时加以修改,进一步明确数据单元格的实际属性,从而促进图书资料存储的总体效果的提升,为图书资料的检索和调阅提供更大的便利。
(二)HTML表格数据转储于数据库文件。在明确HTML表格中各数据单元格及其相应表头属性的基础上,可以结合表头的属性和单元数据属性来对HTML表格的属性进行系统化分析,在采用有关数据库中数据理解HTML表格属性值语言层次的基础上,以HTML表格规范化后的表格属性值作为主要数据资料,并对其进行准确的记录,以保证图书资料存储的有效性。
二、数据库文件到XML文档的转换
(一)相关转换规则。2.1.1表属性向XML文档转换的规则。自开始标签直至结束标签的部分可以看作为XML元素,除此之外也包含其他文本、元素或二者的混合物。总的来看,元素具有一定的属性,若以表元素的特征描述作为关系属性,则能够实现索引属性值向表格元素和子元素属性的转化,以主键、外键和索引为例,在索引属性值实际变化范围较窄的情况下,图书资料检索则更具便捷性。2.1.2表属性向XML子元素转换的规则。若表属性为元素的组成部分表述,则可以将表属性向XML子元素转化,在全键状态下,所有的表属性都能够像XML子元素转化。表属性向XML子元素的转化,可以在表具有嵌套特征的情况下实现转化。除此之外,若表元组应该转化为XML子元素的条件下,可以将每一个元组作为表元素,将其中属性值作为子元素,此种条件下,即便关系表没有全键,也能够实现表属性向XML子元素的转化。2.1.3基本信息保存的规则。就数据文件向XML文档转换的总体情况来看,转换具有一定的特殊性,并不是一一对应的,其中部分信息不能够实现直接转换,需要加以特殊处理。通常情况下,选取合适位置对附加相关文件进行特别标准,最大程度上实现无损转换,促进关系表的重组,为图书资料存储方式的转换提供可靠的基础,便于XML文档的高效化管理。以一个根元素来创建一个表,并以表中的每一列创建一个属性,进一步明确表中的主键和外键之间关系,促进表元素中子元素的形成,从而为关系数据库提供可靠的理论依据和数据支撑。
(二)转换的实现。早在SQLServer2005中就已经提供了FORXML子元素用来实现数据库到表格的转换,其本质还是通过ransact-SQL语句来实现。经过重新编写程序语言之后的SQL检索语句中增加FORXML子句来检索数据,实现XML转换,并生成XML文档,成为管理图书资料手段的一大飞跃。当时有3种模式指定检索生成XML的现实样式,其中有Raw,Auto和Explicit。
三、当今世界文化发展的趋势
(一)网络数字化是现代社会发展的前提。现在是一个信息时代社会,社会的角落充斥着网络。互联网几乎将整个世界连接在一起,成为一个大的网络家庭。看看我们的周围,若是没有了网络数字化科技的支持,在这个社会我们几乎寸步难行。科技是社会进步的前提,图书资料网络数字化正是对这种现象的表现,同时也体现了图书资料网络数字化对促进社会发展的重要性和必要性。图书资料的储存应该采用HTML表格,将复杂的图书储存模式彻底颠覆,减轻上作人员的工作压力,减少出错机率。
(二)图书资料网络信息化成为图书馆的必要选择。图书馆是图书资料的最为重要的载体,也是人们获取知识的主要途径,传统的图书馆服务由于自身的局限性不能给予人们对现代文化知识的需求,而图书资料网络信息化能有效的解决传统图书馆在其时间、地理、人文上的限制问题。
四、结束语
在数字化图书馆建设过程中,HTML表格数据转化为XML文档是一种高效化的图书资料转换方式,在没有标出表头信息的HTML表格以及相对复杂的嵌套表格中能够得到有效的应用,简化了图书馆内资料存储相关劳动,促进图书资料管理总体工作效率的提升,推进图书馆的稳定发展。
【关键词】图书资料;存储方式;自动化转换;HTML表格;XML文档
图示资料是社会科技文化信息交流的重要方式,在数字化、网络化大环境下,传统的图书资料存储方式难以满足社会群体对知识获取的实际需求,因此改善图书资料存储方式和服务模式,实现HTML表格向XML文档的自动化转换,有助于提高图书资料的实际应用效果,从而推进数字化图书馆的建设发展。
一、HTML表格数据向关系数据库存储的转换
当前图书资料管理过程中,HTML表格主要是通过HTML文档来由数个标题组成,并且每一行中包含多个单元格,通过table来对其进行描述。单元格内部包含多元的数据信息,通过科学化的分类,来保证图书资料管理更具便捷性和高效性,促进图书资料管理效率的提升。随着网络化、数字化技术的有效应用,HTML表格的有效利用,使得图书资料数据管理更具规范性和可操作性,推进HTML表格图书资料管理逐步迈向规范化的发展道路,在一定程度上减轻图书资料管理人员的工作量,并提高图书资料检索的便捷性,如表1所示。
表1 新书架题录索引
(一)识别HTML表格的表头。表头是HTML表格来对不同图书资料进行准确识别的重要方式,通过合理的表头格式设置,数据信息显示准确,图书资料识别的精准度更高,便于图书资料管理系统自动按照有限顺序来对图书资料信息进行排列。常见的表头设置中,主要以字体、字号、数据等来进行显示,并在合理设置标准程序的基础上,结合行和列的特征值来对格式化的平均值进行精准的计算,以计算结果来对HTML表头来对图书资料进行准确的识别。在HTML表格中,假设每个单元格的特征值为0,每个单元格的字号为k,则可以得出不同的单元格特征值A。在加以准确计算后,能够对表格的行头和列头的特征值进行有效的区分,以任意两列的特征值为基础,可以计算出列头和数据的分解线。在明确HTML表格行头和列头的基础上,应当在HTML表格的右上角表明单元格的属性,并及时加以修改,进一步明确数据单元格的实际属性,从而促进图书资料存储的总体效果的提升,为图书资料的检索和调阅提供更大的便利。
(二)HTML表格数据转储于数据库文件。在明确HTML表格中各数据单元格及其相应表头属性的基础上,可以结合表头的属性和单元数据属性来对HTML表格的属性进行系统化分析,在采用有关数据库中数据理解HTML表格属性值语言层次的基础上,以HTML表格规范化后的表格属性值作为主要数据资料,并对其进行准确的记录,以保证图书资料存储的有效性。
二、数据库文件到XML文档的转换
(一)相关转换规则。2.1.1表属性向XML文档转换的规则。自开始标签直至结束标签的部分可以看作为XML元素,除此之外也包含其他文本、元素或二者的混合物。总的来看,元素具有一定的属性,若以表元素的特征描述作为关系属性,则能够实现索引属性值向表格元素和子元素属性的转化,以主键、外键和索引为例,在索引属性值实际变化范围较窄的情况下,图书资料检索则更具便捷性。2.1.2表属性向XML子元素转换的规则。若表属性为元素的组成部分表述,则可以将表属性向XML子元素转化,在全键状态下,所有的表属性都能够像XML子元素转化。表属性向XML子元素的转化,可以在表具有嵌套特征的情况下实现转化。除此之外,若表元组应该转化为XML子元素的条件下,可以将每一个元组作为表元素,将其中属性值作为子元素,此种条件下,即便关系表没有全键,也能够实现表属性向XML子元素的转化。2.1.3基本信息保存的规则。就数据文件向XML文档转换的总体情况来看,转换具有一定的特殊性,并不是一一对应的,其中部分信息不能够实现直接转换,需要加以特殊处理。通常情况下,选取合适位置对附加相关文件进行特别标准,最大程度上实现无损转换,促进关系表的重组,为图书资料存储方式的转换提供可靠的基础,便于XML文档的高效化管理。以一个根元素来创建一个表,并以表中的每一列创建一个属性,进一步明确表中的主键和外键之间关系,促进表元素中子元素的形成,从而为关系数据库提供可靠的理论依据和数据支撑。
(二)转换的实现。早在SQLServer2005中就已经提供了FORXML子元素用来实现数据库到表格的转换,其本质还是通过ransact-SQL语句来实现。经过重新编写程序语言之后的SQL检索语句中增加FORXML子句来检索数据,实现XML转换,并生成XML文档,成为管理图书资料手段的一大飞跃。当时有3种模式指定检索生成XML的现实样式,其中有Raw,Auto和Explicit。
三、当今世界文化发展的趋势
(一)网络数字化是现代社会发展的前提。现在是一个信息时代社会,社会的角落充斥着网络。互联网几乎将整个世界连接在一起,成为一个大的网络家庭。看看我们的周围,若是没有了网络数字化科技的支持,在这个社会我们几乎寸步难行。科技是社会进步的前提,图书资料网络数字化正是对这种现象的表现,同时也体现了图书资料网络数字化对促进社会发展的重要性和必要性。图书资料的储存应该采用HTML表格,将复杂的图书储存模式彻底颠覆,减轻上作人员的工作压力,减少出错机率。
(二)图书资料网络信息化成为图书馆的必要选择。图书馆是图书资料的最为重要的载体,也是人们获取知识的主要途径,传统的图书馆服务由于自身的局限性不能给予人们对现代文化知识的需求,而图书资料网络信息化能有效的解决传统图书馆在其时间、地理、人文上的限制问题。
四、结束语
在数字化图书馆建设过程中,HTML表格数据转化为XML文档是一种高效化的图书资料转换方式,在没有标出表头信息的HTML表格以及相对复杂的嵌套表格中能够得到有效的应用,简化了图书馆内资料存储相关劳动,促进图书资料管理总体工作效率的提升,推进图书馆的稳定发展。