三个关键技术给予AR界面的力量

本篇文章将从技术角度出发，并以最近推出的苹果MR为例，分析AR世界里所需要依托的三个关键技术点：眼动追踪、手动识别和空间计算。让我们一起看看作者对这三个技术点的分析吧~

三个关键技术给予AR界面的力量

用眼睛看，用手操作，是我们在物理世界里再自然不过的交互方式了。但要在AR世界里延续这种自然交互，却需要依托的三个关键技术点。

Apple Vision Pro的发布没有让我们失望，在里面，我看到了这三个技术带给自然交互的力量。

一、眼动追踪技术

我们在现实中如果需要与哪个物体有进一步的交互，都会自然地将视线集中在它的身上，当我们耗费注意力让视线聚焦在它身上的时候，就已经代表了我们的选择。

这个过程涵盖了目前界面领域上的两个状态：激活态（聚焦）和点击态（选择）。眼动追踪技术，实现的是看到聚焦这个过程。

这个技术当然并不是首创。AR眼镜的先驱，Microsoft Holoens第2代的交互就主打了Eye-gaze，就是用眼睛来聚焦的功能。

而在之前，Microsoft Holoens第1代的头动（Head-gaze）交互其实也已经有用眼睛来看和激活的概念了。但Head-gaze里使用头部微微移动来控制屏幕中心的一个点（Gaze）来激活内容，和我们本来的自然交互始终是有差距的，因为实际上我们聚焦一个物体，并不需要每次都靠头动，靠眼睛动就行了。

不过，虽然眼动追踪技术更解决自然交互的标准，但头动交互并不是没有可取之处，比如我团队目前自研的眼镜还只能支持Head-gaze交互。这种交互手段的成本和技术难度更低，比起用手/鼠标/遥控器等去聚焦激活的方式，它更加贴近我们用眼睛看这个自然交互理念。

另外，眼动追踪技术实现了激活态，却还没真正实现选择，也就是那个点击态。作用是告诉机器我确认是它了。

严格来说，对于不需要操作的东西，省去手这个确认操作是很有必要的。比如，我一边吃零食一边追剧的时候，就很希望不用每次操作前都要擦一擦我的脏手……在制造领域，类似这种解放双手的需求也经常被客户提出。

为了更自然的交互，也许这也可以成为我们畅想的一部分。之前我写过一个专利，就是靠脑电波技术来进行简单的确认。

二、手势识别技术

眼动追踪满足用眼睛看这部分的交互，用手操作，则需要手势识别技术。

这也不是什么新技术了，之前很多ARVR的设备上都有搭载，当然实现程度还要实际体验再确认。

Vision Pro的宣传视频里，手势识别看上去很自然，手甚至都不需要抬起来，这应该是依靠4组下视角相机（这大概也是需要12个摄像头配置的原因之一吧）。

三个关键技术给予AR界面的力量

相比Hololens2的宣传视频，可以看出手势是在头顶摄像头涵盖范围的。

三个关键技术给予AR界面的力量

因为手势识别是需要依托摄像头的（计算机需要输入才能知晓你的手在怎么动），那么同样的手势从不同角度拍摄的结果就不一样，识别的结果也会受到影响。

另外，2D手势识别和3D手势识别技术的体验感也不太一样。

三、空间计算

要让眼睛看得更爽，用手操作得更自然，设备需要有对空间的理解能力。空间计算，也是Vision Pro想主推的，对于这个能力的注重，让他们认为这块能力可以划分一个时代。

“空间计算时代”。

没有空间计算能力，也就是如果机器不能理解空间的话，很多交互都自然不起来。我们现在所听到的Nerf、SLAM、3DOF、6DOF，都属于空间计算技术的一员。

从体验角度来说，空间深度所带来的物体之间、物体与用户之间的距离感知；用户在不同位置和姿态下的视角朝向所带来的物体形状变化；真实环境中因时间和天气等光线不同所导致的色彩感知变化；甚至不同空间位置所传来的声音等，空间计算能给予设计师更多自然交互的空间。

可以说，空间计算，是能让AR在未来，成为不同于普通屏幕界面的、我们真正所期待的“凡所看之处，皆可成为界面”的关键技术。

专栏作家

林影落，微信公众号：林间有影落，人人都是产品经理专栏作家。一枚会玩卡的用户体验设计师，《AR界面设计》作者，10年+UIUX设计经验，专注于AR及智能化领域用户体验设计6年；设计&心理学教育背景，国家职业认证高级OH卡师/天赋挖掘教练。愿意用我的一份努力，让设计这个领域在智能化的未来更有价值，让设计师这个职业更加值钱！

本文原创发布于人人都是产品经理，未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

三个关键技术给予AR界面的力量

一、眼动追踪技术

二、手势识别技术

三、空间计算

潞晨尤洋：日常办公没必要上私有模型，这三类企业才需要 | MEET2026

世界模型和具身大脑最新突破：90%生成数据，VLA性能暴涨300%｜开源

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

SpaceX估值8000亿美元超OpenAI，IPO就在明年

“豆包手机”在二手市场价格都翻倍了……

6小时告破30年数学难题，亚里士多德一夜成名

AI也会被DDL逼疯！正经研究发现：压力越大，AI越危险

完整议程｜12.10-11第二十届中国IDC产业年度大典北京·首钢园启动

免费国产Banana真香！我想把PS给卸载了

deepseek当选网易有道词典2025年度词汇，全年搜索量超867万次