0

0

Java中将CSV数据转换为XML属性格式的教程

DDD

DDD

发布时间:2025-10-05 11:57:28

|

856人浏览过

|

来源于php中文网

原创

java中将csv数据转换为xml属性格式的教程

本教程详细介绍了如何使用Java将CSV文件中的数据转换为XML格式,特别是将CSV列值映射为XML元素的属性。通过利用JAXB(Java Architecture for XML Binding)框架,结合POJO(Plain Old Java Object)和特定注解,我们可以高效且准确地实现这种转换,避免将列值生成为独立的XML子元素。

1. 引言:CSV到XML属性转换的需求

在数据交换和存储中,CSV(Comma Separated Values)和XML(Extensible Markup Language)都是非常常见的数据格式。有时,我们需要将CSV格式的数据转换为XML,并且对XML的结构有特定的要求。一个常见的需求是将CSV文件中的每一行数据转换为XML的一个元素(例如 ),而该行中的每一列数据则作为这个XML元素的属性,而不是独立的子元素。

例如,对于以下CSV数据:

Col1,Col2,Col3,Col4,Col5
All,0,,0,0
All,935,231,0,30
None,1011,257,0,30

我们期望生成的XML文件是这样的:



    
    
    

这与将列数据作为子元素(如 All...) 的常见转换方式有所不同,需要特定的处理方法。

立即学习Java免费学习笔记(深入)”;

2. 传统DOM方法的问题分析

使用Java的javax.xml.parsers.DocumentBuilder和org.w3c.dom包来手动构建XML是一种常见的方式。然而,当我们需要将CSV列数据转换为XML属性时,这种方法容易导致错误。

例如,如果按照以下逻辑构建XML:

Element rowElement = newDoc.createElement("row");
// ... 遍历CSV列数据 ...
String curValue = String.valueOf(stringTokenizer.nextElement());
Element curElement = newDoc.createElement(csvFields[i++]); // 使用列名作为元素名
curElement.appendChild(newDoc.createTextNode(curValue)); // 将值作为文本节点
rowElement.appendChild(curElement); // 将子元素添加到行元素

这段代码的newDoc.createElement(csvFields[i++])会为每个CSV列创建一个新的XML元素,例如 等,并将CSV值作为这些元素的文本内容。这最终会生成如下的XML结构:


    
        All
        0
        
    
    

这显然不符合我们将列值作为属性的需求。要将数据作为属性,需要使用 setAttribute 方法,而不是 createElement 和 appendChild 来创建子元素。但手动管理大量属性会使代码变得复杂且易错。

3. JAXB解决方案:POJO与注解驱动

为了高效且优雅地实现CSV到XML属性的转换,我们强烈推荐使用JAXB(Java Architecture for XML Binding)框架。JAXB提供了一种将Java对象与XML文档之间进行映射(编组和解组)的机制,极大地简化了XML处理。

Android数据格式解析对象JSON用法 WORD版
Android数据格式解析对象JSON用法 WORD版

本文档主要讲述的是Android数据格式解析对象JSON用法;JSON可以将Java对象转成json格式的字符串,可以将json字符串转换成Java。比XML更轻量级,Json使用起来比较轻便和简单。JSON数据格式,在Android中被广泛运用于客户端和服务器通信,在网络数据传输与解析时非常方便。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载

JAXB的核心思想是:

  1. 定义POJO(Plain Old Java Object): 创建Java类来表示XML的结构。
  2. 使用JAXB注解: 在POJO类和字段上添加特定的JAXB注解,以指导JAXB运行时如何将Java对象映射到XML元素、属性或文本内容。

通过这种方式,我们可以清晰地定义XML的期望结构,并让JAXB自动处理复杂的XML生成逻辑。

4. 定义数据模型(POJO)

首先,我们需要定义两个POJO类:一个用于表示XML的根元素(例如 ),另一个用于表示每一行数据(例如 )。

4.1 RowData 类:表示XML中的 元素

这个类将包含CSV文件中的每一列数据,并通过 @XmlAttribute 注解将它们映射为XML属性。

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlType;

// @XmlType(propOrder = {"col1", "col2", "col3", "col4", "col5"}) // 可选:定义属性在XML中的顺序
public class RowData {
    private String col1;
    private String col2;
    private String col3;
    private String col4;
    private String col5;

    // JAXB需要一个无参构造函数
    public RowData() {}

    public RowData(String col1, String col2, String col3, String col4, String col5) {
        this.col1 = col1;
        this.col2 = col2;
        this.col3 = col3;
        this.col4 = col4;
        this.col5 = col5;
    }

    // 使用 @XmlAttribute 注解将字段映射为XML属性
    @XmlAttribute(name = "col1") // name属性指定XML中属性的名称
    public String getCol1() { return col1; }
    public void setCol1(String col1) { this.col1 = col1; }

    @XmlAttribute(name = "col2")
    public String getCol2() { return col2; }
    public void setCol2(String col2) { this.col2 = col2; }

    @XmlAttribute(name = "col3")
    public String getCol3() { return col3; }
    public void setCol3(String col3) { this.col3 = col3; }

    @XmlAttribute(name = "col4")
    public String getCol4() { return col4; }
    public void setCol4(String col4) { this.col4 = col4; }

    @XmlAttribute(name = "col5")
    public String getCol5() { return col5; }
    public void setCol5(String col5) { this.col5 = col5; }
}

4.2 Root 类:表示XML的根元素

这个类将包含一个 RowData 对象的列表,并通过 @XmlRootElement 和 @XmlElement 注解来定义XML的根元素和子元素列表。

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.List;

@XmlRootElement(name = "root") // 定义XML的根元素为 
public class Root {
    private List rows;

    // 使用 @XmlElement 注解将List映射为XML子元素集合
    // name属性指定每个列表项对应的XML元素名称,例如 
    @XmlElement(name = "row")
    public List getRows() {
        return rows;
    }

    public void setRows(List rows) {
        this.rows = rows;
    }
}

5. CSV数据读取与对象转换

接下来,我们需要编写逻辑来读取CSV文件,解析每一行数据,并将其转换为 RowData 对象。这些 RowData 对象将被收集到一个列表中,最终封装在 Root 对象中。

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class CsvProcessor {

    public List parseCsv(String csvFilePath, String delimiter) throws IOException {
        List rowDatas = new ArrayList<>();
        try (BufferedReader csvReader = new BufferedReader(new FileReader(csvFilePath))) {
            String line;
            String[] headers = null;

            // 读取CSV头行,通常包含列名。
            // 在本例中,我们假设XML属性名是固定的(col1, col2...),
            // 但如果需要动态生成,则需要根据headers来调整POJO或使用更高级的JAXB适配器。
            if ((line = csvReader.readLine()) != null) {
                headers = line.split(delimiter); // 存储列头,尽管本例中未直接使用其内容作为属性名
            }

            // 逐行读取CSV数据
            while ((line = csvReader.readLine()) != null) {
                String[] values = line.split(delimiter);
                if (values.length >= 5) { // 确保数据完整性,至少有5列
                    // 创建RowData对象并填充数据
                    RowData row = new RowData(
                        values[0],
                        values[1],
                        values[2],
                        values[3],
                        values[4]
                    );
                    rowDatas.add(row);
                } else {
                    System.err.println("警告: 跳过不完整的CSV行: " + line);
                }
            }
        }
        return rowDatas;
    }
}

6. JAXB编组(Marshalling)

有了包含所有 RowData 对象的 Root 对象后,我们就可以使用JAXB的 Marshaller 将其转换为XML文件。

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;
import java.io.IOException;
import java.util.List;

public class CsvToXmlConverter {

    public void convertCsvToXmlAttributes(String csvFileName, String xmlFileName, String delimiter) {
        try {
            // 1. 解析CSV文件,获取RowData对象列表
            CsvProcessor csvProcessor = new CsvProcessor();
            List rowDatas = csvProcessor.parseCsv(csvFileName, delimiter);

            // 2. 将RowData列表封装到Root对象中
            Root root = new Root();
            root.setRows(rowDatas);

            // 3. 初始化JAXB上下文
            // JAXBContext.newInstance() 需要所有参与编组/解组的类
            JAXBContext jaxbContext = JAXBContext.newInstance(Root.class, RowData.class);

            // 4. 创建Marshaller实例
            Marshaller marshaller = jaxbContext.createMarshaller();

            // 5. 配置Marshaller属性
            marshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true); // 格式化输出,使XML可读
            marshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8");      // 设置XML编码

            // 6. 执行编组,将Java对象写入XML文件
            File xmlFile = new File(xmlFileName);
            marshaller.marshal(root, xmlFile);

            System.out.println("CSV文件 '" + csvFileName + "' 已成功转换为XML文件 '" + xmlFileName + "'。");

        } catch (IOException e) {
            System.err.println("文件操作错误: " + e.getMessage());
        } catch (JAXBException e) {
            System.err.println("JAXB编组错误: " + e.getMessage());
        } catch (Exception e) {
            System.err.println("发生未知错误: " + e.getMessage());
            e.printStackTrace();
        }
    }

    public static void main(String[] args) {
        // 创建一个示例CSV文件用于测试
        String csvContent = "Col1,Col2,Col3,Col4,Col5\n" +
                            "All,0,,0,0\n" +
                            "All,935,231,0,30\n" +
                            "None,1011,257,0,30\n" +
                            "Partial,1,2\n"; // 示例不完整行

        String csvFileName = "data.csv";
        String xmlFileName = "output.xml";
        String delimiter = ",";

        try {
            java.nio.file.Files.write(java.nio.file.Paths.get(csvFileName), csvContent.getBytes());
            System.out.println("示例CSV文件 '" + csvFileName + "' 已创建。");

            CsvToXmlConverter converter = new CsvToXmlConverter();
            converter.convertCsvToXmlAttributes(csvFileName, xmlFileName, delimiter);

        } catch (IOException e) {
            System.err.println("创建或写入文件时发生错误: " + e.getMessage());
        }
    }
}

7. 运行示例及预期输出

将上述 RowData.java, Root.java, CsvProcessor.java 和 CsvToXmlConverter.java 文件放置在同一个项目中。确保已添加JAXB依赖(见下一节)。运行 CsvToXmlConverter 的 main 方法后,将生成 output.xml 文件,其内容应与期望的XML结构一致:



    
    

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1903

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2092

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1081

2024.11.28

DOM是什么意思
DOM是什么意思

dom的英文全称是documentobjectmodel,表示文件对象模型,是w3c组织推荐的处理可扩展置标语言的标准编程接口;dom是html文档的内存中对象表示,它提供了使用javascript与网页交互的方式。想了解更多的相关内容,可以阅读本专题下面的文章。

3369

2024.08.14

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

9

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

8

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

3

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3万人学习

C# 教程
C# 教程

共94课时 | 8万人学习

Java 教程
Java 教程

共578课时 | 53.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号