阿里云百炼新功能上线：几分钟打造专属AI助手，无需代码

随着科技的迅猛进步，人工智能领域持续取得创新成果。在此背景下，阿里云百炼推出的全新音视频实时互动功能成为一大焦点。该功能显著提升了用户构建AI助手的便捷性，对于企业和个人而言，这无疑是一个具有革命意义的消息。

功能亮点一

阿里云百炼新功能上线：几分钟打造专属AI助手，无需代码第1张

阿里云百炼新推出的功能为用户提供了诸多便利。用户可自由挑选超过200种模型，包括文本、语音、视觉理解等。杭州部分科技公司测试人员发现，仅需几分钟，无需编写代码，即可搭建出一个具备听、看、说功能的AI助手。此举显著降低了AI应用构建的难度，为人工智能应用的快速开发打开了便捷通道。

另一方面，其具备对多个平台的兼容性。无论是网络平台，抑或是iOS和Android应用，阿里云百炼均可通过SDK方式进行整合。众多移动应用开发者对此功能抱有期待，它为开发AI相关应用，如AI虚拟助手、虚拟陪伴和AI教师等，增添了更多可能性。

阿里云百炼新功能上线：几分钟打造专属AI助手，无需代码第2张

多模态演进的趋势

阿里云百炼新功能上线：几分钟打造专属AI助手，无需代码第3张

过去一年中，大模型的发展趋势明显，逐步从单一文本模态向语音、视觉等多模态转变。这一多模态的进步显著拓展了应用领域的想象空间。以AI客服为例，它现在不仅能通过文本交流，还能以语音回应用户，并借助视觉元素来帮助用户理解复杂情况。

在发展过程中遭遇挑战，当前采用的单一模型在应对复杂任务时显得力不从心。这已成为众多科技企业共同面临的难题。阿里云百炼的推出，旨在尝试为这一问题提供有效的解决方案。

提供全模态大模型

阿里云百炼新功能上线：几分钟打造专属AI助手，无需代码第4张

阿里云百炼致力于帮助用户开发更高级的AI应用，为此推出了多种全模态、全尺寸的大模型。例如，Qwen、Qwen2-VL、CosyVoice等模型具备丰富功能。以Qwen2-VL为例，该模型在视觉智能体能力方面表现突出。据北京部分人工智能实验室测试结果显示，该模型所采用的M-ROPE方法在处理多模态数据上表现出色，能精确地捕捉多维度数据的位置信息，这也使得它在开源社区中颇受欢迎。

阿里云百炼与阿里云AI实时互动方案相结合，共同发挥效能。该合作模式为国内用户提供了高效的工作流程应用和智能体编排应用，例如，它支持建立RAG知识库、进行Prompt调优等。

音频方面的进步

阿里云百炼新功能上线：几分钟打造专属AI助手，无需代码第5张