应先用parse_url($url, PHP_URL_HOST)提取纯净主机名,再转小写并按点分割;但不可简单取最后两段为主域,需借助公共后缀列表(如php-domain-parser库)识别真实TLD,否则co.uk等多段顶级域会被误判。

PHP怎么用parse_url提取完整主机名再切分
直接对URL用parse_url($url, PHP_URL_HOST)是最稳妥的起点,别试图用正则硬啃整个URL。很多同学跳过这步,直接对原始字符串做explode('.', $url),结果把https://a.b.c.example.com/path里的https://也当子域切了。
拿到host后,按点分割得到数组,但注意:顶级域(TLD)可能含多个段,比如co.uk、github.io,不能简单取最后两段就认为是“主域名”。实际要先识别有效TLD才能反推子域层级。
- 先用
parse_url($url, PHP_URL_HOST)拿到纯净host - 转小写避免大小写干扰(
strtolower()) - 用
explode('.', $host)得到片段数组,如['shop', 'jp', 'example', 'co', 'uk'] - 别急着
array_slice,先查TLD规则——否则example.co.uk会被错判成三级子域
为什么不能只靠end(explode('.', $host))取顶级域
因为end()只能拿到uk,但co.uk才是真正的注册局级域名(public suffix)。PHP原生不带公共后缀列表,硬编码['com', 'org', 'net', 'co.uk', 'gov.uk', 'github.io']又难维护。常见错误是写成$parts = explode('.', $host); $tld = end($parts); $domain = $parts[count($parts)-2];,在mail.google.com里会把google当主域,其实google.com才是——而mail才是子域。
-
mail.google.com→ 子域是mail,主域google.com -
api.blog.jp.example.co.uk→ 子域是api.blog.jp,主域example.co.uk - 没TLD库时,至少按常见长度兜底:
count($parts) >= 3 ? $parts[0] : null只适用于www.example.com类场景,不通用
用danog/madelineproto或jeremykendall/php-domain-parser解析更可靠
自己维护TLD列表太重,推荐轻量第三方库。比如jeremykendall/php-domain-parser(仅解析,无网络请求),安装后几行就能分清层级:
立即学习“PHP免费学习笔记(深入)”;
use Pdp\Parser; $parser = new Parser(); $host = 'shop.us-west-2.api.example.github.io'; $domain = $parser->parse($host); echo $domain->subdomain(); // 'shop.us-west-2.api' echo $domain->registerableDomain(); // 'example.github.io'
它背后加载的是Mozilla Public Suffix List,自动识别github.io为有效TLD,比手写if (strpos($host, '.github.io') !== false)靠谱得多。
- composer require jeremykendall/php-domain-parser
- 不依赖cURL或远程API,纯本地解析
-
$domain->subdomain()返回完整多级子域字符串,不是单层 - 注意:传入的host必须是纯域名,不能带
http://或端口
手动实现简易版(无TLD库时的底线方案)
如果环境限制不能装包,可用白名单+长度双控:预设常见多段TLD,再按剩余段数决定子域深度。例如允许co.uk、org.uk、github.io、vercel.app,其余一律按“最后两段为主域”处理。
$tldList = ['co.uk', 'org.uk', 'ac.uk', 'gov.uk', 'github.io', 'vercel.app', 'cloudflareworkers.com'];
$host = strtolower('api.v1.beta.example.co.uk');
$parts = explode('.', $host);
$possibleTld = implode('.', array_slice($parts, -2));
if (in_array($possibleTld, $tldList)) {
$domain = implode('.', array_slice($parts, -3)); // example.co.uk
$subdomain = implode('.', array_slice($parts, 0, -3)); // api.v1.beta
} else {
$domain = implode('.', array_slice($parts, -2)); // fallback: last two
$subdomain = implode('.', array_slice($parts, 0, -2));
}
这个逻辑在内部系统、已知域名结构的场景够用,但遇到新TLD(比如刚推出的.app或.dev)就得改代码。真正对外服务的项目,别省这点依赖。











