必须建空间索引才能高效使用SDO_GEOM.SDO_DISTANCE;未建索引时会全表扫描,性能急剧下降;WGS84下默认返回“度”,需显式加'unit=METER'才得米制结果;NULL坐标会导致ORA-13033错误;批量计算应优先用SDO_WITHIN_DISTANCE或SDO_JOIN而非直接遍历调用。
用 SDO_GEOM.SDO_DISTANCE 计算两点距离前必须建空间索引
不建索引也能跑出结果,但哪怕只有几百条记录,查询就会明显变慢;上万点时可能卡住或超时。oracle 的空间函数默认依赖 sdo_index_type 为 qtree 的 r-tree 索引,否则退化成全表扫描 + 坐标逐行解析。
实操建议:
- 确保两点坐标都存为
SDO_GEOMETRY类型,且SRID一致(比如都用 WGS84:4326) - 建索引语句必须带
layer_gtype参数,例如:CREATE INDEX idx_geom ON locations(geom) INDEXTYPE IS MDSYS.SPATIAL_INDEX_V2 PARAMETERS('layer_gtype=POINT'); - 如果表里混了线、面数据,
SDO_DISTANCE仍能算,但索引效率会下降——最好按几何类型分表或加WHERE sdo_geom.sdo_geomrelate(geom, 'mask=POINT') = 'TRUE'
SDO_DISTANCE 的单位取决于 SRID,不是“米”就是“度”
WGS84(SRID=4326)下直接传两个 SDO_GEOMETRY,返回值是“度”,不是米——这点极易被忽略,导致距离误判十倍以上。想得米制结果,必须显式指定单位参数。
常见错误现象:算出两点距离是 0.12,以为是 120 米,实际是约 13300 米(赤道附近 1 度 ≈ 111km)。
实操建议:
- 强制用米:在
SDO_DISTANCE第四个参数加'unit=METER' - 确认当前 SRID 支持单位转换:查
MDSYS.SDO_COORD_REF_SYSTEM表,coord_ref_sys_kind = 'GEOGRAPHIC2D'的才需要单位参数 - 示例:
SELECT SDO_GEOM.SDO_DISTANCE( SDO_GEOMETRY(2001, 4326, SDO_POINT_TYPE(116.4, 39.9, NULL), NULL, NULL), SDO_GEOMETRY(2001, 4326, SDO_POINT_TYPE(121.5, 31.2, NULL), NULL, NULL), 0.005, 'unit=METER' ) FROM DUAL;
传入空坐标或 NULL 会直接报 ORA-13033 错误
这个错误信息很模糊:“Invalid data for the geometry”,实际往往只是某个 SDO_POINT_TYPE 的 X 或 Y 是 NULL,或者整个 SDO_GEOMETRY 对象没初始化。
使用场景:从用户输入或外部接口取经纬度拼 SDO_GEOMETRY 时最常踩坑。
实操建议:
- 构造前先
NVL检查:NVL(longitude, 0)不够,得用CASE WHEN longitude IS NULL OR latitude IS NULL THEN NULL ELSE SDO_GEOMETRY(...) END - 避免用字符串拼接生成
SDO_GEOMETRY,改用函数封装,例如写个to_point(lon NUMBER, lat NUMBER, srid NUMBER)PL/SQL 函数,内部做非空校验 - 调试时加
SDO_GEOM.VALIDATE_GEOMETRY_WITH_CONTEXT验证对象有效性,比等报错再排查快得多
批量计算时别在 SQL 里反复调用 SDO_DISTANCE
一个查询里对十万行执行 SDO_DISTANCE,每行都触发一次空间运算和索引查找,性能断崖式下跌。Oracle 不会自动向量化或缓存中间结果。
性能影响:同样数据量,用 SDO_JOIN + 过滤距离范围,比 ORDER BY SDO_DISTANCE(...) 快 5–20 倍,尤其配合空间索引时。
实操建议:
- 要找“离某点最近的 10 个地点”,用
SDO_WITHIN_DISTANCE先圈出候选集(比如 50km 内),再对小结果集排序 - 要算 A 表每个点到 B 表最近点的距离,优先考虑
SDO_JOIN+ROW_NUMBER() OVER (PARTITION BY a.id ORDER BY dist),而不是CROSS JOIN后套SDO_DISTANCE - 如果真要全量两两算,导出坐标到应用层用 Haversine 公式算更快——PL/SQL 调用空间函数有固定开销,小数据不如纯数学运算










