设为首页 加入收藏
  • 首页
  • 时尚
  • 综合
  • 知识
  • 娱乐
  • 探索
  • 焦点
  • 当前位置:首页 > 热门资讯 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    发布时间:2025-06-27 15:34:10 来源:云浮市某某形象策划培训中心 作者:热门资讯

    人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态白城市某某运输服务经销部问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

    北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经白城市某某运输服务经销部音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

    一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

    模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

    作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

    发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

    米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

    此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

    国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

    多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

    米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

    据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

    OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

    • 上一篇:“卷王”刘强东,继续战斗
    • 下一篇:俄外长:以伊停火尚无结论

      相关文章

    • 中学生抢话筒喊话学校“没钱修宿舍”,是勇敢还是偏激?通报来了
    • 教育部:2025届高校毕业生预计规模1222万人
    • 从“胖东来进京”说起,看实体零售焕新的秘诀
    • 对话·科学先锋|AI驱动引领经济脉动
    • 开火!海军某护卫舰支队开展实弹射击演练
    • 雷佳音获金鸡奖最佳男主角
    • “弗吉尼亚”号核动力攻击潜艇被渔网“捕获” 美方:赔偿得走流程
    • 期中考试后,如何帮助孩子发现问题、解决问题?这些方法请收好→
    • 工信部:我国正在有序开展6G相关的技术试验
    • 不断涨价!国足主场战日本,最高票价已涨到每张4125元

      • 风景如何变场景——探析吉林“赏花游”的流量密码
      • 俄称别尔哥罗德边境村庄遭乌军炮击 致5死12伤
      • 美“林肯”号航母已进入美国中央司令部责任区
      • 埃及发生火车与多辆汽车相撞事故 已致2死3伤
      • 判了!中国留学生迷奸数十人 欲靠化学阉割减刑
      • 揭秘|人形机器人“上岗”要过几道关?
      • 中信特钢上半年盈利降一成 国外市场营收降超两成
      • “三周客观+三周主观”:应届本科法考过关经验
      • “自爆”炸烂座椅!这些车内“易爆隐患”快清除
      • “灵感上Xin”设计空间巡展登陆北京

        随便看看

      • 那家月薪5000不要吃的火锅店要IPO了
      • 黎巴嫩真主党宣布向以色列发射大量火箭弹和无人机
      • 当下父母一种奇怪的观念:女儿要娇养,以后有福气,不用伺候人
      • 印度安得拉邦一制药厂发生爆炸 已致17死41伤
      • 权威数读|“含金量”“含新量”不断提高!这几组外贸数据要关注
      • “你好,新学期”短视频征集
      • 呼唤朴素的“开学礼”
      • 克里米亚地区发生森林火灾 面积已达15公顷
      • 车企集体承诺“60天账期”业内:承兑汇票等潜规则不变账期仍然长
      • 埃及发生火车与多辆汽车相撞事故 已致2死3伤
      jyn.laoying.sbs “走进‘科技中轴’ 遇见‘古代科技’”主题活动举办 共和党同时拿下参众两院,特朗普激进主张更易通过 李佩霞受贿案一审宣判 冲刺阶段需要5点起床吗···? 以色列空袭黎巴嫩多地 致11人死亡9人受伤 林长春:发挥科学实践育人价值 2025年民航招飞150人,新增1所民办大学,分数会下降吗 广东省发展改革委副主任、省能源局局长吴道闻被查 商家自称“苟延残喘”,古城耗资22亿,三年来入驻店铺可查仅18家 新氧集团董事长金星:中国医美消费者尚未实现“医美自由”
      • Copyright © 2025 Powered by 财经观察:提升人机交互效率 多模态大模型易用性进一步推进,云浮市某某形象策划培训中心   sitemap