12月21日,OpenAI的“连续12日圣诞发布”活动圆满结束。其中,最新推出的产品o3受到了极大的关注。这一成果在人工智能领域展现出多个引人注目的亮点。
o3的版本与性能提升
OpenAI最新发布了o3及其精简版o3 - mini。评估结果显示,其性能有显著提升。在软件工程测试中,o3的准确率比o1高出约47%。在竞赛数学测评中,o3的得分比o1高出15%。在人类博士专家级生化物测试中,o3的得分也比o1高出近13%。这些数据充分证明了o3卓越的推理能力。此外,在AGI相关测试中,o3取得了最佳成绩87.5,超过了人类水平门槛85。与GPT - 3的0%和GPT - 4o的5%成绩相比,o3的表现更为突出,标志着在向类人智能迈进的过程中取得了显著成就。
OpenAI计划在明年年初推出o3系列模型。这一计划展现了OpenAI对o3的信心和期望。然而,CEO Altman表示,可能在一段时间内不会向公众开放该模型。他们希望首先构建联邦政府的测试框架,以监控和降低模型风险。这一做法也揭示了前沿模型可能存在的潜在问题,需要我们谨慎处理。
技术直播其他成果汇总
在为期12天的技术直播活动中,多项成果得以公布。其中,“满血版”推理模型o1和GPT Pro正式上线,GPT Pro的月订阅价格为200美元。此外,强化微调研究项目亮相,该研究能够运用从数十到数千个高质量任务来定制模型。同时,AI视频生成模型Sora Turbo也同步发布,该模型最高支持1080p分辨率,视频时长可达20秒,充分展现了OpenAI在视频生成技术领域的探索进展。
Canvas创作助手的升级版现已全面推出,面向所有用户开放,该助手专注于提升编程和写作的效率。OpenAI与苹果公司携手合作,取得了显著进展,推出了iOS 18.2系统。在该系统中,Siri、写作辅助工具以及视觉智能功能与GPT技术实现了深度融合。此次合作将两种创新技术相结合,有望为苹果用户带来全新的使用感受。
功能升级与拓展
新发布的成果在功能方面实现了显著提升和扩展。全新推出的40视频通话功能,支持实时交流、解读用户连贯动作,并具备记忆能力。这一新增功能丰富了与用户互动的层面。同时,推出Projects In GPT,将GPT的各项功能整合,使用户在创建和管理项目时更加便捷,从而提高了使用效率。
GPT的搜索功能已全面更新,新增了地图整合和实时搜索等特性,并向所有用户全面开放。同时,OpenAI推出了全新的o1模型API,该API支持WebRTC的实时搜索,且价格下调60%,大幅降低了开发者的使用成本,预示着基于o1模型的更多开发成果将陆续问世。
GPT的移动战略
GPT在移动领域展开布局。该系统已进入手机应用,用户可通过拨打免费电话与聊天机器人建立联系,每月享有15分钟的免费通话时长,为手机用户带来了便捷的使用方式。此举使用户能够更加灵活地与GPT进行交流,无论是解决日常疑问还是获取知识等需求。同时,这也体现了OpenAI推动自身产品向更广泛普及、更易于大众使用的方向发展的努力。
原生应用程序自动化协作功能
OpenAI推出的原生应用程序自动化协作功能,与AI Agent的玩法有相似之处。该功能的核心优势在于其主动理解用户需求的能力。这一创新功能显著提升了用户在使用原生应用程序时的便捷性,使程序更贴合用户的使用习惯,减少了操作步骤,节约了时间,从而改善了用户体验。
安全研究人员的特权
自本周五起,OpenAI开放了安全研究员对o3及o3 - mini预览版本的注册访问权限。此举既有助于研究员迅速识别模型潜在的安全隐患并寻求解决方案,同时也反映出OpenAI对安全问题的深切关注。
OpenAI近期发布了一系列重要成果。这些成果对人工智能未来发展趋势的影响程度如何?欢迎各位点赞、转发,并在评论区展开热烈讨论。