你的位置:开云(中国大陆) Kaiyun·官方网站 > 新闻资讯 > 欧洲杯体育咱们在赓续声息的本领-开云(中国大陆) Kaiyun·官方网站
欧洲杯体育咱们在赓续声息的本领-开云(中国大陆) Kaiyun·官方网站
发布日期:2024-06-24 08:07 点击次数:140
新浪科技讯 5月14日上昼音讯,当天,360集团创举东谈主、董事长周鸿祎在谈及GPT-4o时默示,GPT-4o的发布,除了才调的提高外,最迫切的是交互能力的提高。
周鸿祎默示,此次OpeanAI发布的是GPT-4o,最大的惊艳等于它的语音输入和声息输出的举座体验。在往常,咱们在赓续声息的本领,实质上是用了三个引擎,先是言语后把语音用一个语音识别引擎翻译成笔墨,然后再把笔墨交给大模子去向理,然后大模子赓续结束再把谜底通过一个叫TTS的引擎,把笔墨转谚语音,然后再输出来。
周鸿祎指出,这么作念的着力是,体验相当不像真东谈主,比如这三个引擎合起来的时延就特地长,而咱们真东谈主言语一句话反应的时延八成在300毫秒掌握,关联词用三个引擎辘集起来,这种作念得假的语音反映和语音赓续延长至少在2秒到3秒以上,你就知谈他不是真东谈主。
此外,因为分了三个引擎,就会导致东谈主们在言语中的许多的姿色语调等玄妙的东西齐被丢掉,是以输出语音的本领也当然莫得东谈主的姿色,是以许多机器东谈主发音就莫得朗朗上口,平铺直叙听不出情感。同期,传统语言交互时常需要喊出叫醒词的计算,也会极地面影响交互体验。
“但在有了OpenAI的这种对话能力后,大众以后不会以为我的共享像个数字东谈主,反而会说老周还不如数字东谈主了。”周鸿祎自我捉弄谈。(文猛)
海量资讯、精确解读,尽在新浪财经APP包袱剪辑:尉旖涵 欧洲杯体育
Powered by 开云(中国大陆) Kaiyun·官方网站 @2013-2022 RSS地图 HTML地图