
智能眼镜的演进是技术迭代与场景需求共同推动的过程,近年来随着光学显示等相关技术进 步,智能眼镜正逐步走向轻量化和生态成熟,消费市场迎来新一轮融合现实与智能交互的创 新浪潮,其发展历程整体来看可分为四个阶段:
20 世纪末至 2012 年,智能眼镜主要停留在技术验证与原型开发阶段。20 世纪 80 年代开始, 多伦多大学教授史蒂夫·曼恩开始尝试制作头戴式智能眼镜,并成功开发出 EyeTab;2003 年, Vuzix 公司推出有简单显示功能的智能眼镜,是智能眼镜商业化的开端;2011 年,爱普生推 出首款 AR 眼镜 BT-100。这一阶段的核心价值在于验证了光学显示、传感器集成等技术应用 的可行性,为后续发展积累了技术经验。
2012 年,谷歌推出集成了显示屏幕和摄像头的智能眼镜 Google Glass,代表以 AR 眼镜为主 的智能眼镜行业步入正式发展期,但三年后谷歌因“摄像头隐私争议”等问题停售了探索者 版本的谷歌眼镜,也结束了 Explorer 项目。除谷歌外,其他厂商也在不断推出新的产品进行 商业化尝试,如 2014 年,爱普生推出 Moverio BT-200、索尼推出 SmartEyeglass 原型机; 2015 年,中科沃尔推出悍狼 WEARONE、微软发布 HoloLens。在这一阶段,行业经历了调整的 阵痛,各厂商也逐步意识到技术成熟度与用户需求匹配的重要性。
经历了产品多样化的丰富期后,2023 年开始,智能眼镜行业步入蓬勃发展期。苹果 Vision Pro 的发布引发了行业的大量关注;MicroLED 显示、光波导光学等核心技术加速突破推动设 备向轻薄化、高沉浸体验迭代;安卓阵营也同步推出了轻量化机型,进一步丰富产品矩阵。 开发者生态快速完善,推动了办公、娱乐等场景应用持续拓展,资本与消费端热度共振,驱 动行业加速向规模化落地迈进。
目前,智能眼镜通过技术架构与场景需求差异可分为四大核心种类:AI 拍摄眼镜、AR 观影眼 镜、AR 全域眼镜、VR 眼镜。
各类型智能眼镜最本质的区别是光学显示系统的区别:AI 拍摄眼镜:仅仅是配置了摄像头和语音交互组件,并未应用光学显示模块,目前主流产 品的应用场景多为日常拍摄和蓝牙音频交互;AR 眼镜:光学显示系统负责将虚拟环境信息映射到现实环境信息中,因此用户通过眼镜既 能看到身边的现实环境,也能看到虚拟影像;VR 眼镜:光学显示系统只显示计算机系统创建的虚拟环境信息,用户使用眼镜时并不能看 到现实环境,观感体验完全建立在虚拟环境中。
AR 眼镜允许外界光线通过,使用者得以看到外界环境,外界光线通过比例越高,人眼观察到 的真实环境越清晰。而 AR 观影眼镜是 AR 眼镜中的一个特例,由于大多采用 Birdbath 光学方案(透光率低,但成像质量好且重量轻),佩戴者如同戴了墨镜,难以清晰观察到外界,但 Birdbath 的优点使其成为了优秀的便携式观影眼镜,其主要应用场景转向了室内和差旅的观 影追剧。而采用其他光学方案的 AR 眼镜大都可以支持使用者清楚地观察到外界环境,适用 于绝大部分场景,故称为 AR 全域眼镜。因此 AR 眼镜根据技术特点和使用场景又可分为 AR 观 影眼镜和 AR 全域眼镜两种。
AI 拍摄眼镜本身并不具备光学显示系统,是集成了传统眼镜、相机、蓝牙耳机等功能的 AI 技术载体,该产品和 AR/VR 眼镜最本质的区别在于它并不产生虚拟影像。信息输入方式为语 音输入和光学感知,信息输出方式主要为听觉输出。相较于 AI 拍摄眼镜,未配备拍摄功能的 AI 音频眼镜是更初级的形态,如李未可科技 2024 年 4 月发布的 Meta Lens Chat。
相较于传统的 AR/VR 眼镜,AI 拍摄眼镜具备以下三个特点: 舍弃部分功能:舍弃光学显示模块(后两个特点的前提),但仍能覆盖拍摄、翻译、语音交 互等绝大多数使用场景;外观和重量:产品形态简约,接近普通眼镜的同时,产品重量基本控制在 50 克左右(舍弃 了光学显示模块),支持使用者全天佩戴,如 AI 拍摄眼镜 Ray-Ban Meta 为 49 克,雷鸟 V3 仅 为 39 克,重量远低于传统 AR/VR 眼镜;价格更低:1)省去光机成本:光机成本高昂,如华为 AR 眼镜 VisionGlass 成本中光机部 分成本占比高达 72%,AI 拍摄眼镜通过舍弃光机部分大幅降低了成本,使产品更符合消费者 预期价位;2)大模型成本降低:根据 Stanford 发布的 Artificial Intelligence Index Report 2025,在 2022 年 11 月至 2024 年 10 月期间,达到 GPT-3.5 级别性能的系统推理成 本从 20 美元/百万 tokens 暴跌至 0.07 美元/百万 tokens,下降了 280 倍。这大大减少了 AI 眼镜部署大模型的成本,进而推动了终端产品的价格下探。
AI 拍摄眼抓住了消费者对目前智能眼镜的两大核心需求:舒适度和性价比。AI 拍摄眼镜并 不试图实现功能的面面俱到,而是通过舍弃目前尚不完全成熟且实现成本较高的虚拟影像技 术来换取消费者更关注的舒适度和性价比,且在此基础上仍满足了消费者最关注的拍摄、语 音交互等大部分功能。
AI 拍摄眼镜的应用场景更多体现在日常生活中,作为融合计算机视觉、语音交互与轻量化硬 件的创新产品,通过其 AI 能力重构我们日常生活中的各个场景。