
国务院近日印发《关于深入实施“人工智能+”行动的意见》。在《意见》的引领下,人工智能将从技术创新的“关键词”加速升级为驱动产业变革的“核心引擎”,塑造经济增长的新动能。
【郭明錤:Hypernova属于实验性质产品,预计未来两年出货量15-20万副】
Meta Connect是Meta一年一度的重要活动,旨在展示AI/AR眼镜、MR、元宇宙等领域的最新成果,今年活动将于9月17日-18日举行。
近日,海外分析师郭明錤称,该设备预计在今年Q3季度量产,产品生命周期2年,未来2年出货量约15-20万副。根据高通芯片出货预估,2026年全球智能眼镜出货量约1300-1500万部,这能看出Hypernova的市占比可忽略不计,更像是实验性质产品。
AI将是Hypernova最重要的卖点,但目前整合AI+AR的应用探索仍处于早期阶段,加上售价约800美元,这应该是Meta保守看待Hypernova出货量的主要原因。此外,产品为追求量产性所以采用LCoS,但这也衍生出外观设计、亮度、续航等硬件设计挑战。
【自研AI进展缓慢,苹果(被曝已就收购Mistral、Perplexity事宜进行讨论】
8 月 26 日,苹果高管已就收购欧洲最大 AI 初创公司 Mistral 或 Perplexity AI 相关事宜展开讨论,其中 Eddy Cue 是公司内部最积极的收购支持者。此举或将增强苹果的 AI 能力和创新能力。
如果苹果真的能够收购 Mistral,将远超苹果 2014 年收购 Beats 的 30 亿美元纪录,成为其史上最大并购案。
8 月 26 日,科技媒体发布博文,报道称谷歌 DeepMind 推出全新 Gemini 2.5 Flash 图像编辑模型,在 Gemini 应用中可根据文字指令,在保持人物与动物的外观一致的情况下,提高修改图片的精度。
与此前的原生图像生成工具相比,它在根据文字进行图像修改时的准确率更高,甚至在多项任务中优于 ChatGPT 所用的 GPT-4o,让其能更好地基于复杂文字编辑图像。
据报道,Meta已着手联络第三方开发商,为其即将推出的、配备表面肌电图(sEMG)腕带的平视显示(HUD)眼镜打造“实验性应用”。
此次开发者招募活动“重点面向专注于生成式人工智能领域的从业者”,而Meta此举的核心目标,正是借助这些定制化应用程序,为这款全新HUD眼镜的后续推广奠定基础。
另据援引消息人士的说法,Meta这款HUD眼镜采用了以色列公司Lumus研发的波导技术。今年早些时候,Lumus曾发布旗下Z-30波导产品,该产品拥有30度的对角线视场,且具备“足够紧凑可嵌入标准眼镜镜框、功率强劲可在日光环境下正常工作、能效出色可支持全天使用”三大核心优势。
【英伟达(发布新一代Jetson Thor芯片,赋能高速机器人推理与多模态AI应用】
人工智能芯片领域的巨头英伟达近期震撼发布了专为先进机器人打造的Jetson Thor系列芯片模组,被誉为“机器人的智慧核心”。据悉,这款芯片模组预计在下月面世,为机器人开发者提供了打造原型机的全新利器。
英伟达强调,现代机器人需要处理海量的传感器数据,并要求极低的AI处理延迟。为了应对这一挑战,Jetson Thor系列内置了T5000系统单芯片,在FP4精度下,能以130瓦功耗爆发出惊人的2070 TOPS AI性能。
另外,与前代产品NVIDIA Jetson Orin相比,Jetson Thor在AI计算能力上提升了7.5倍,CPU性能增强3.1倍,内存也翻倍。这一性能飞跃将使机器人专家能够处理高速传感器数据,并在边缘端执行以往因速度过慢而无法在动态环境中运行的视觉推理任务,为人形机器人等多模态AI应用开辟了广阔的新天地。
今年6月,Snap宣布计划推出一款完全独立的消费级AR眼镜,名为Specs,这将是该公司十年智能眼镜研发工作的成果。Snap在2016年至2019年间公开销售了三代非AR眼镜,近年来还发布了两款AR眼镜开发套件,名为Spectacles。
在该公告中,Snap首席执行官Evan Spiegel透露,该公司迄今为止已投入30亿美元用于AR眼镜的研发。不过,Snap向UploadVR表示,该公司始终在评估最有效的方式来实现投资回报,但并不严格依赖外部融资来推出Specs。
近日,韩媒报道,三星首款MR头显(代号为Project Moohan)将会在今年9月29日举办的Unpacked活动上亮相,并在10月13日在韩国上市,后续会逐步面向全球市场发售。
Oakley Meta HSTN主要硬件与Ray-Ban Meta类似,如采用1200万像素摄像头,AR1芯片,不过一些功能有所提升:常规使用续航提升至8小时,视频录制规格达到2300×3100。
日前,苹果中国宣布,将于北京时间 9 月 10 日凌晨 1 点开始举行发布会,秋季发布会的中文海报主题词为:前方超燃。苹果发布会将见证多年来首款经过重新设计的 iPhone 亮相,将推出一款超薄的 iPhone 17。
在多模态人工智能领域持续演进的今天,情感计算正逐渐成为智能系统理解人类情绪的核心能力。据悉,微美全息对外发布其最新技术成果——CCDA模型(Cross-Correlation Dual-Attention),一种创新性的多模态情绪分析模型,旨在解决多模态融合与模态间建模效率的双重难题。
多模态情绪分析技术依托于文本、图像、音频乃至视频等多种类型的数据源,致力于挖掘隐藏在数据背后的情绪信息。而微美全息CCDA模型正是在这一背景下孕育而生,其设计从人类认知机制中汲取灵感,模仿多通道注意力协同与强化学习的机制,提出了同时聚焦模态内与模态间的双向建模框架。
据介绍,微美全息CCDA模型的核心架构包括两个关键组成部分:动态双注意力模块与互相关损失函数。动态双注意力模块由模态内注意力与模态间注意力两部分构成,模态内注意力用于挖掘每一种模态内部的关键情绪特征。
技术变革往往始于一次精准的洞察,微美全息CCDA正是以对模态协同机制的深刻理解,打破了传统特征融合的思维边界,让多模态情绪分析迈入了“互相关智能感知”的全新时代。
随着更多智能终端与情感计算需求的不断涌现,像这样的技术革新无疑将为智能世界带来更加细腻的人机共情能力。展望未来,微美全息还将继续优化CCDA架构,计划引入图神经网络、记忆增强机制及跨语言建模能力,进一步拓宽其在多语言、多文化情绪识别中的适用性,推动CCDA在商业化落地上的深度融合。
Meta此前宣布推出非具身化LLM NPC和环境生成预览功能,作为Meta Horizon不断扩大的GenAI创作者工具套件的一部分。如今,完全具身化的LLM NPC即将推出,环境生成功能现已作为Worlds Desktop Editor的一部分向所有创作者开放。
Meta还更新了扩展角色构建工具,新增一系列功能,能够为NPC定义各种特性,包括角色名称、故事、个性、对话,并测试其响应。今年晚些时候,还将添加更多功能,利用AI触发世界内动作,让角色与真实玩家进行动态对话,从而让角色更具真实感。AI NPC可以为玩家提供有用的背景信息、有趣的对话、探索地点的提示以及应采取的行动,从而提升游戏体验,同时还能丰富游戏世界的背景故事。
【高通(与VoxelSensors合作优化用于AR眼镜的3D感知传感器 】
近日,AI感知传感器开发商VoxelSensors宣布与高通达成合作,后续企业将结合高通骁龙XR平台以优化其单光子主动事件传感器 (SPAES) 3D传感技术。
据VoxelSensors指出,其与高通的合作专注于将SPAES与骁龙AR2 Gen 1平台相集成,提供低延迟且灵活的3D主动事件数据流,以及用于捕捉用户自我中心数据的推理引擎,我们看到了在XR设备上实现真正个性化的AI Agent交互的巨大潜力。