0

0

如何在 Java 中解析网页返回的 XML 数据并提取指定字段

霞舞

霞舞

发布时间:2026-01-06 17:59:21

|

430人浏览过

|

来源于php中文网

原创

如何在 Java 中解析网页返回的 XML 数据并提取指定字段

本文介绍如何使用 java 从远程 url 获取 xml 响应,并安全、可靠地提取如国家名称等结构化数据,涵盖基础 http 请求、xml 解析原理及推荐的最佳实践。

在 Java 中直接读取 XML 格式的网络响应(例如 http://www.geoplugin.net/xml.gp?ip=...)仅靠字符串拼接或行号硬编码(如 list.get(13))是脆弱且不可维护的——一旦服务端调整 XML 格式、缩进或字段顺序,代码将立即失效。正确做法是使用标准 XML 解析器进行结构化处理。

✅ 推荐方案:使用 DOM 解析器(简洁可靠)

以下是一个完整、健壮的示例,基于 Java 内置的 DocumentBuilder 解析 XML 并提取 的文本内容:

PDFlux
PDFlux

PDF内容提取+智能问答神器,结合了科研级精准的非结构化文档解析能力,以及ChatGPT的智能问答能力。

下载
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import java.io.InputStream;
import java.net.URL;

public class GeoPluginParser {
    public static void main(String[] args) throws Exception {
        String ip = "xx.xx.xx.xx"; // 替换为实际 IP 或留空由 geoplugin 自动识别
        URL url = new URL("http://www.geoplugin.net/xml.gp?ip=" + ip);

        // 1. 构建 DOM 解析器
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();

        // 2. 解析 XML 流(自动处理编码)
        try (InputStream is = url.openStream()) {
            Document doc = builder.parse(is);
            doc.getDocumentElement().normalize();

            // 3. 定位目标元素(支持多层级容错)
            NodeList countryNodes = doc.getElementsByTagName("geoplugin_countryName");
            if (countryNodes.getLength() > 0 && countryNodes.item(0).hasChildNodes()) {
                String countryName = countryNodes.item(0).getTextContent().trim();
                System.out.println("Detected Country: " + countryName); // e.g., "Russia"
            } else {
                System.out.println("Warning: <geoplugin_countryName> not found or empty.");
            }
        }
    }
}

⚠️ 注意事项与最佳实践

  • 避免硬编码行号:原始答案中 list.get(13) 严重依赖 XML 输出格式稳定,极易崩溃;
  • 处理网络异常与空值:务必包裹 try-with-resources 和 null 检查,防止 NullPointerException 或连接中断导致程序崩溃;
  • 注意协议安全性:geoplugin.net 当前仅支持 HTTP(非 HTTPS),生产环境建议选用更安全、支持 HTTPS 的地理定位 API(如 IPGeolocation、MaxMind GeoIP2);
  • 字符编码自动识别:DocumentBuilder.parse(InputStream) 能自动识别 XML 声明中的 encoding="UTF-8",无需手动指定;
  • 替代方案参考
    • 若需高性能/流式处理,可用 StAX(javax.xml.stream
    • 若项目已引入第三方库,Jackson XMLSimpleXML 提供更简洁的 POJO 映射能力。

✅ 总结

解析远程 XML 不应停留在“字符串切割”层面。使用标准 DOM API 是 Java 原生、零依赖、语义清晰的首选方式。它确保了代码对 XML 结构变化具备弹性,同时兼顾可读性与可维护性——这才是生产级地理信息集成的正确起点。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

252

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

988

2024.03.01

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1939

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2116

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1146

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

678

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1561

2023.10.24

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

3

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.1万人学习

C# 教程
C# 教程

共94课时 | 10.6万人学习

Java 教程
Java 教程

共578课时 | 76.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号