AI Weekly

AI 前沿精选 #01: OpenAI 推出OpenAI o3 和 o4-mini

发布于 2025年4月18日

大家好!很高兴宣布,我的全新周更栏目【AI 前沿精选】今天正式与大家见面了!

未来,我将固定为你精心筛选、梳理并分享过去一周 AI 领域最值得关注的前沿突破、重要动态和有趣应用。

希望【AI 前沿精选】能成为你高效获取 AI 价值信息的一个窗口,帮助你轻松跟上这个日新月异的时代。欢迎大家保持关注,也期待你的反馈!

OpenAI 推出 OpenAI o 3 和 o 4-mini

OpenAI o3 是一款跨多领域的强大模型,为编程、数学、科学及视觉推理任务树立了新标杆。

O4-mini 则以其卓越的速度与成本效益成为高智能模型之选。相较于 o3,它能支持显著更高的使用上限,对于需要推理辅助的海量问题处理场景而言,是理想的高容量、高吞吐解决方案。 https://openai.com/index/introducing-o3-and-o4-mini/

另外,OpenAI 更新了 ChatGPT 的记忆功能,使其自动保存用户对话和偏好,提供更个性化和上下文相关的回应。

谷歌 Cloud Next 大会发布多项 AI 工具

在谷歌 Cloud Next 大会上,谷歌发布了多项 AI 工具

  • Firebase Studio 一站式应用 AI 开发平台
  • Agent 2 Agent Agent 协议
  • Agent Development Kit Agent 开发框架
  • Vertex AI 目前唯一的视频、图像、语音、音乐生成媒体模型的平台
  • Gemini 2.5 Flash 预览版即将推出

https://cloud.withgoogle.com/next/25

谷歌发布了提示工程白皮书

零样本提示 (Zero prompting)、少样本提示 (Few shot prompting)、系统提示 (System prompting) 等等等等丰富的提示技术,帮助提升 AI 使用技能。

在线阅读/下载 (Google Drive):https://drive.google.com/file/d/1AbaBYbEa_EbPelsT40-vj64L-2IwUJHy/view

字节跳动推出 Dreamina

字节跳动发布了 Dreamina,一款超现实 AI 视频动画工具,可从单张图片和音频生成逼真的说话面部动画,接近微软未发布的 VASA-1 水平,特别在唇同步方面表现突出。 https://dreamina.capcut.com/

NextBigFuture 报道了 Dreamina 的性能,比较其与 VASA-1 的差异 https://www.nextbigfuture.com/2025/04/bytedance-hyper-realistic-ai-video-animator-dreamina-nears-microsoft-vasa-1-level.html

Perplexity 整合 Gemini 语音功能

Perplexity 为高级用户整合了 Gemini 2.5 Pro,并新增英语和中文语音交互功能,免费用户也获得部分语音访问(除日语外)。 https://x.com/AravSrinivas/status/1910444644892327996