The server is under maintenance between 08:00 to 12:00 (GMT+08:00), and please visit
later.
We apologize for any inconvenience caused
On Applications of "Metadata Model" to Data Extraction
Author(s): YANG Wenan, CHEN Xingyi(1.departmentofcomputerengineering, XUZHOU Instituteofarchitecturaltechnology, XUZHOU 221008, china, 2.SCHOOL Ofcomputerscienceandtechnology, BEIJING Postsandtelecommunicationsuniversity, BEIJING 100876, china)
Pages: 32-
36
Year: 2005
Issue:
1
Journal: Journal of Changchun Post and Telecommunication In
Keyword: 数据提取; 元数据模型; 格式说明文件; 可扩充标记语言;
Abstract: 大量分散的形式及不同格式的数据给现代数据处理带来了越来越大的困难。为统一数据形式以利于数据操作和处理,讨论了将形式多样的数据格式转换成统一的XML(extensibleMarkupLanguage)格式的问题。在计算机网络中,应用"元数据模型"技术,对数据源中不同格式文件数据,按照预先定义的XML模板,以格式说明文件结构统一描述,并提取数据或作进一步的处理,最后转换为XML格式输出。设计了具体的实现策略以及实现流程:实现了从TXT文件格式数据中提取数据转换成XML格式的代码,将TXT文件数据提取成XML格式的数据;完成了数据说明文件格式的设计,数据路径选择工具的开发,语言分析工具的设计开发等工作。结果表明:能满足同类产品的按行(line)为单位的源数据结构形式处理,还具有同类产品不具备的非行(字符串和关键字)提取处理功能。
Citations
No citation found