0

0

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

WBOY

WBOY

发布时间:2023-09-26 22:01:01

|

929人浏览过

|

来源于搜狐

转载

百宝箱
百宝箱

百宝箱是支付宝推出的一站式AI原生应用开发平台,无需任何代码基础,只需三步即可完成AI应用的创建与发布。

下载

mr系统可以使用多个摄像头,但在呈现图像时需要对齐图像。然而,图像对齐是一个具有挑战性的问题。因此,在名为“利用角点和线特征进行图像对齐的方法”的专利申请中,微软提出了一种解决方案

当然,行业早已存在利用角特征来进行图像对齐的方法。然而,在图像中识别角并根据识别的角对齐图像是一个耗时且计算密集型的操作。

微软提出的是一种更有效的改进技术,可以实现更好的特征匹配。发明主要介绍了使用角特征和线特征来执行视觉对齐的混合方法,而这种解决方案导致对齐过程中所需的约束更少,从而改进计算效率和特征匹配。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

图11示出一个示例环境1100,其中用户正在使用头显摄像头1105和外部摄像头1110。如前所述,需要对齐从这两个摄像头生成的图像内容。但环境1100可能是一个弱光环境,或者可能是一个在热梯度或对比度方面具有低对比度的环境。

例如,在深夜物体冷却后,环境的温度梯度可能通常是均匀的。在这种情况下,环境的温度曲线或梯度可能低于特定的等温阈值1115。在这种情况下,用于对齐内容的传统技术可能会失效。微软描述的实施例为这类场景提供了解决方案。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

图12示出可用于对齐图像的示例角检测1200过程。图12示出了由图11的头显摄像头1105生成的第一图像1205,以及由外部摄像头1110生成的第二图像1210。

进行角检测操作以识别图像中存在的“角”。举例来说,可以通过实施例来识别第一张图像中的角特征。换句话说,可以在图像中识别一组像素,确定这些像素集合对应于一个角

“角”是指具有非均匀强度的一个或多个像素,其具有相对于所述一个或多个像素水平定位的第一附近像素块和相对于所述一个或多个像素垂直定位的第二附近像素块。换句话说,角定义为一组一个或多个与相对于像素集在X和Y方向相邻角形成对比的像素。

识别第一图像1205中的角特征1215,并且也识别第二图像1210中的角特征。因此,成功识别出角特征1225。需要注意的是,角特征1225与角特征1215是相对应的

为了对齐图像内容,该实施例的任务是识别1230个角的阈值。角的阈值数量必须相互对应。换句话说,必须识别在第一张图像1205中识别的多个角,并且必须与在第二张图像1210中识别的多个角相对应

如果满足这些阈值,则实施例可以执行图像对齐操作以生成叠加图像1235,所述图像1235是其中对齐来自第二图像1210的内容,然后与来自第一图像1205的相应内容覆盖的图像。

进行角点检测和对齐是一项计算密集型操作,如果检测到的角点与图像之间的匹配不够好,整个过程可能会失败。例如,仅使用角点的方法,需要从一张图像中识别出至少5个角点,然后与第二张图像中的相应角点进行匹配。在低对比度条件下,即使识别出5个相应的角点也可能是一项挑战

在识别足够数量的角之后,实施例然后使用运动模型识别3D旋转,以便通过执行各种旋转和转换以使5个角彼此对齐来将图像内容从第一或第二图像适配到另一图像。执行这样的对齐是计算密集型。

因此,我们需要减少只使用角方法时所存在的约束,而图13则描述了这样一种技术。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

在图13中展示了角点和线点检测1300的过程,这个过程包括了图12中的角点检测1200操作和线点检测操作的组合。需要注意的是,角点检测操作和线检测操作是同时进行的

通常情况下,识别图像中的相应的“线”比识别角点更简单,因此线检测过程通常比角点检测过程更快。由于这两个过程可以并行运行,并且线检测过程更快,因此添加线检测过程不会对整体对齐过程的速度产生负面影响

通过合并使用线条来对齐图像,可以在对齐过程中使用更少的角,从而导致放松的约束和通常更容易对齐。特别是在低温条件下,要求使用更少的角是非常有益的,因为很难找到和匹配角

“线”被定义为一组一个或多个像素,它们具有相对于一组或多个像素集的水平定位的第一附近像素块的均匀强度,并且具有相对于一组或多个像素集的垂直定位的第二附近像素块的不均匀强度。或者,它们具有相对于一组或多个像素集的水平定位的第一附近像素块的不均匀强度,并且具有相对于一组或多个像素集的垂直定位的第二附近像素块的均匀强度

在图13中,展示了代表图12中图像的第一图像1305和第二图像1310。图13还展示了一种实施方法,可以检测第一图像1305中的角特征1315

在对第一图像1305进行角特征的例检测时,同时也会进行线特征的检测,就像线特征1320和线特征1325所示的那样。一般来说,相较于可以检测到的角的数量,我们能够检测到更多的线

对第二图像1310执行角和线操作。为了说明,所述实施例识别角特征1330。与角检测操作并行,实施例同时检测第二图像1310中的线,如线特征1335和线特征1340。

请注意,角特征1330与角特征1315相对应;线特征1335与线特征1320相对应。线特征1340与线特征1325相对应。实施例可以识别这些对应关系,然后生成或使用适合于将这些特征点彼此对齐的运动模型

根据发明原理,我们定义了第一个阈值为1345。第一个阈值是指必须在两个图像中识别的相应角特征的数量,以便对它们进行对齐。同时,我们还定义了第二个阈值为1350。第二个阈值是指必须在两个图像中识别的相应行特征的数量,以使它们对齐

第一阈值1345和第二阈值1350的满足使实施例能够对齐来自第一图像1305和第二图像1310的内容以生成叠加图像1355。值得注意的是,阈值通常是指必须识别的角和线的总数。

在了解执行线特征检测的便利性和速度之后,你可能会质疑为什么实施例不仅依赖于线检测操作而避免执行角检测操作。原因是因为在图像中检测线条会导致孔径问题。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

以下是重写后的内容: 根据图14,我们可以看到孔径问题,即孔径模糊度为1400。在图14中,线段1405是整条线的一部分。孔径模糊度1400指的是一条线的多个不同部分可能(但不正确地)与已识别的线段1405相关

例如,尽管线段1410实际上位于错误的位置或位置,但线段1410可能是与线段1405匹配的像素块。类似地,线段1415或线段1420可能包含可能映射或匹配线段1405中的像素的像素块。这样的场景在对齐过程中引入了模糊性。

因此,依靠线检测过程本身是不够的技术。换句话说,依靠线和角的组合可以使实施例使用宽松的约束,从而提高计算效率。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

示例过程流1500在图15中展示。最初,会获取一组图像,如头戴式摄像头图像1505和外部摄像头图像1510。这些图像可能是热图像。图像中的温度梯度或对比度1520可能低于特定的对比度阈值1525。因此,在图像中识别足够数量的角可能相当困难。在这种情况下,可以利用混合方法检测角和线的组合以实现对齐

将头戴式摄像头图像1505和外部摄像头图像1510传送到角度检测器1530和线条检测器1535中,这两个检测器同时运行,彼此之间没有依赖关系

请注意,线检测器1535在检测线条时通常比角检测器1530在检测角度时更快。换句话说,线检测器1535的延迟时间较角检测器1530的延迟时间要短

角点检测器1530分析所述两个图像并识别所述图像中的角点1545。类似地,线检测器1535分析这两个图像并识别图像中的线1550。然后,实施例通过在两个图像内识别相应的角和线来执行对齐1555。

为了执行对齐,需要确定线和角的阈值数量。匹配阈值比识别角的数量或线的阈值更相关。然后,实施例将所识别的角和线拟合到诸如运动模型的3D模型1560中。然后对模型1560进行模型拟合1565操作,以旋转、平移和/或变换一幅图像,从而匹配或对齐另一幅图像中的相应角和线。

换句话说,当执行重投影操作时,实施例使用已识别的角和线来对齐来自一个图像的内容与来自另一个图像的内容

相关专利:Microsoft Patent | Image alignment using corner and line features

名为“Image alignment using corner and line features”的微软专利申请最初在2022年2月提交,并在日前由美国专利商标局公布。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
vsd文件打开方法
vsd文件打开方法

vsd文件打开方法有使用Microsoft Visio软件、使用Microsoft Visio查看器、转换为其他格式等。想了解更多vsd文件相关内容,可以阅读本专题下面的文章。

510

2023.10.30

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

38

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

83

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

169

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

246

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 4.2万人学习

Excel 教程
Excel 教程

共162课时 | 21.1万人学习

PHP课程
PHP课程

共137课时 | 13.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号