-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
苹果iPhone将于7月26日关闭“我的照片流”,推荐使用iCloud
苹果公司宣布将于2023年7月26日关闭“我的照片流”服务,这是一项允许用户在多个苹果设备之间共享照片的服务。这项服务的优点是可以自动将用户拍摄的照片同步到所有的设备上,用户可以随时在不同的设备上查看和分享这些照片...
手机互联 2023-05-29 11:08:32 -
Windows11强推Edge浏览器用户想换第三方浏览器有门槛
从Windows 10开始,微软就在努力推广其原生的Edge浏览器,在经过数次大的改版后,Edge浏览器采用了Chromium内核,为用户带来了更好的Web兼容性,并为所有Web开发者减少Web碎片化。这一改动确实让Edge浏览器也进入了主流用户的视野中,一时好评如潮...
智能设备 2023-05-27 17:11:35 -
消息称三星GalaxyZFlip5有8种颜色、GalaxyZFold5有5种
IT之家 5 月 27 日消息,屏幕供应链咨询公司 DSCC 首席执行官罗斯・杨(Ross Young)在最新推文中,三星 Galaxy Z Flip 5 手机共有蓝色、绿色、铂金色、黄色、米色、灰色、浅绿色和浅粉色 8 种颜色。而三星 Galaxy Z Fold 5 在热销的米色、黑色和浅蓝色之外,还会推出蓝色和铂金色,共计 5 种颜色。IT之家在此附上三星 Galaxy Z Fold 5 规格如下:全新的水滴状铰链,在闭合状态下不会出现缝隙。外屏尺寸为 6.2 英寸、内屏尺寸为 7...
手机互联 2023-05-27 15:23:14 -
百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”
5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...
业界动态 2023-05-25 13:06:05 -
索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器
5月24日消息,在“Sony Expo 2023”展前媒体发布会上,索尼(中国)有限公司总裁吉田武司提出了索尼在华发展的愿景:“激发灵感与热情,与追梦者共创感动。”他表示,“中国有很多对未来充满热情和憧憬的追梦者,他们虽来自不同年龄层,不同领域,但他们都拥有勇于创新,不断突破极限的可贵的精神,这同样是索尼创业以来,传承至今的精神...
业界动态 2023-05-24 18:49:55 -
铠侠发布BG6系列PCIe4.0SSD:首个采用第六代BiCSFlash的产品
铠侠(Kioxia)宣布,推出BG6系列PCIe 4.0 SSD。这是铠侠第一个采用第六代BiCS FLASH 3D闪存的产品,性能几乎是其上一代BG5系列SSD的1...
智能设备 2023-05-24 10:54:51 -
ChatGPT重塑Windows!操作系统全面接入,Bing也能用插件了
金磊 丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,微软彻底重新定义了PC交互。因为这一次,它把Bing和ChatGPT插件的能力,注入到了整个Windows系统!这就是在刚刚结束的Build 2023中,微软重磅推出的Windows Copilot。有了它,想让自己的PC变得更适合工作,就只需要一个简单的动作——问:如何调整我的系统,(以便更好地)来完成工作?然后Windows Copilot“啪的一下”就会给你2个建议:开启Focus Sessions功能(Windows11利于专注工作的新功能)。把系统变成深色模式。此时,若是你觉得建议有用,只需点击一下“yes”,一键就可以让系统变成你想要的样子。把桌面上的PDF“喂”给Windows Copilot,总结文档内容,也就是点下鼠标的事情了。不仅如此,Windows Copilot还可以跟你电脑里所有的App来一个联动。例如问它:什么音乐比较适合工作的时候听?它会立即在Spotify中给你推荐几个音乐播放列表,而我们所要做的,依旧是一个点击的动作而已。并且在各种插件的加持之下,像做logo这样的工作,就变成傻瓜式的“问”、“点击”、“拖拽”。微软在现场也直接道出了此举背后的目的:Make every user a power user.让每个用户都是高级用户。而且对于开发者来说,或许Windows Copilot的玩法会变得更有意思。因为它允许Bing或ChatGPT插件对它进行扩展。如此一番“大秀”之下,引得网友直呼“AI将无处不在”:不过Windows Copilot,也仅仅是微软Build 2023中“上新”的一隅。Bing,引入到ChatGPT了从现在起,不止是Bing里有GPT-4,ChatGPT里也有Bing了。这个模式叫做“使用必应进行搜索(Browsing with Bing)”,和不久前刚刚上线的插件功能在一个列表中。这个功能已经对plus用户开启,免费版的很快也将上线。勾选上该模式之后,你就可以进行一些基于必应的实时查询了。比如问ChatGPT:本周的Build大会,关于...
智能设备 2023-05-24 10:50:10 -
昨晚,史上最伟大的Windows来了
今日看点9min read昨晚,史上最伟大的 Windows 来了宛辰2023/05/24摘要2023 Build 上,微软公布了 AI 服务 Copilot 全家桶,其中最引人关注的就是 Windows Copilot。2023 年微软 Build,注定是载入史册的一届...
智能设备 2023-05-24 10:48:22 -
微软CEO纳德拉宣布:Windows的“AI时刻”来了
①微软将在本周的Build大会上发布50余款产品,纳德拉在周二的揭幕演讲中着重提到5款产品; ②通过Windows Copilot,用户可以使用自然语言调整设置,并调动整个Windows生态系统的软件; ③其他更新包括通用AI插件平台、云AI工作室等。 财联社5月24日讯(编辑 史正丞)北京时间周三凌晨,微软Build年度开发者大会正式揭幕...
智能设备 2023-05-24 10:48:18 -
微软叠buff!CopilotAI助理链接Bing并可用于所有Windows应用
【网易科技5月24日报道】微软昨日在其年度 Build 开发者大会上宣布推出Windows Copilot系统级的AI助理,它集成了Bing搜索功能,并可用于Windows的所有应用。此外,微软同步引入了一系列其他AI增强功能,包括将Bing Chat插件扩展到Windows、引入新的混合AI循环以支持跨平台和跨Azure的AI开发、推出Dev Home以提高开发人员的工作效率,并在Microsoft Store中引入新的AI功能和体验...
智能设备 2023-05-24 09:40:19 -
十年打磨,英特尔亮出两大黑科技,打破安卓与Windows壁垒
本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。作者 | 云鹏编辑 | 心缘智东西5月23日报道,今天下午英特尔公布了一系列PC和移动生态融合相关技术和产品...
手机互联 2023-05-24 01:27:13