-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”
5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...
业界动态 2023-05-25 13:06:05 -
索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器
5月24日消息,在“Sony Expo 2023”展前媒体发布会上,索尼(中国)有限公司总裁吉田武司提出了索尼在华发展的愿景:“激发灵感与热情,与追梦者共创感动。”他表示,“中国有很多对未来充满热情和憧憬的追梦者,他们虽来自不同年龄层,不同领域,但他们都拥有勇于创新,不断突破极限的可贵的精神,这同样是索尼创业以来,传承至今的精神...
业界动态 2023-05-24 18:49:55 -
英伟达发布GeForceRTX4060/4060Ti:起售价分别为人民币2399元/3199元
英伟达宣布,推出基于Ada Lovelace架构的新一代主流GPU,包括GeForce RTX 4060、RTX 4060 Ti 8GB和RTX 4060 Ti 16GB三款,对应的官方建议零售价分别为299美元/人民币2399元、399美元/人民币3199元和499美元/人民币3899元。其中GeForce RTX 4060 Ti 8GB将于2023年5月23日晚上解禁,并在5月24日21点正式发售,而剩下两款显卡要等到7月份。值得一提的是,GeForce RTX 4060 Ti 8GB会有Founder Edition,也就是公版显卡,由京东商城独家发售。GeForce RTX 4060 Ti搭载了AD106-350(8GB)/351(16GB)GPU,采用PCIe 4.0 x8接口,完整版本芯片拥有36组SM、4608个CUDA核心、36个RT核心和144个Tenor核心,不过RTX 4060 Ti只开启了其中34组SM,也就是4352个CUDA核心、34个RT核心和136个Tensor核心。此外,还带有一个第8代NVENC编码器和一个第5代NVDEC解码器,支持AV1硬件编解码。GeForce RTX 4060 Ti的基础频率为2310 MHz,加速频率为2535 MHz,搭配8GB或16GB的GDDR6显存,显存位宽为128-bit,显存速率为18Gbps频率,显存带宽为288 GB/s,整卡功耗为160W。英伟达表示,通过32MB的L2缓存,显存等效带宽增大至554 GB/s。GeForce RTX 4060搭载了AD107-400 GPU,采用PCIe 4...
智能设备 2023-05-19 11:51:46 -
利润成倍增长后,Tether决定拿出15%增持比特币作为储备资产
界面新闻记者|司马林威5月17日,全球最大的美元稳定币发行商Tether宣布,将从本月开始使用部分利润定期购买比特币 ( BTC ) 作为其稳定币储备,将分配高达约15%的已实现投资利润(不包括其储备资产的任何未实现价格增值)来购买比特币,并将这些代币添加到其储备盈余中。Tether的首席技术官保罗·阿多伊诺 (Paolo Ardoino) 表示:“比特币不断证明其韧性,并已成为具有巨大增长潜力的长期价值储存手段。其有限的供应、分散的性质和广泛的采用使比特币成为机构和散户投资者的首选。”加密稳定币现在是一个市值1310亿美元的资产类别,已成为加密货币基础设施的重要组成部分,通过将其价格锚定在法定货币(通常是美元)上,它充当着法定货币和加密货币之间的交易媒介。而Tether公司发行的USDT目前是为全球最大的美元稳定币,市值约820亿美元。根据其规定,每一枚USDT都将锚定一美元市值。本月初,Tether公司发布了一份与公共会计师事务所BDO Italia审计后的财务报告,报告显示其第一财季净利润为15亿美元,是上一财季的两倍多。其在第一财季结束时的合并总资产为820亿美元,高于2022年底的670亿美元。截至3月底,Tether持有超过690亿美元的现金和现金等价物,其中530亿美元为短期美国国债。在2022年底,Tether持有550亿美元的现金和现金等价物,其中390亿美元为短期国债。Tether目前还持有价值15亿美元的比特币和价值34亿美元的黄金。同时,该公司强调自己的超额储备创造了历史峰值,截至2023年5月9日,该公司管理层声明集团综合总资产至少达818亿美元,综合负债总额为793亿美元,这些负债主要源自其发行的加密稳定币。Tether的超额储备在一季度创造了24.4亿美元的历史新高。Tether的报告是由BDO Italia会计师事务所进行的最新认证的一部分。与全面审计不同,认证只记录公司在某个时间点的财务状况。但该公司最近受到指控,称其准备金索赔“可疑”。前美国证券交易委员会前执法律师约翰·里德·斯塔克 (John Reed Stark) 辩称,该公司定期未经审计的证明“毫无意义”。《华尔街日报》3月份报道称,Tether的公司使用了虚假文件和空壳公司,但Tether称这一指控“完全不准确且具有误导性”。和另一家在美国银行业危机遭遇动荡的稳定币发行商Circle不一样,多年来,Tether因其储备缺乏透明度和有争议的投资决策而在加密行业受到批评。不过,美国区域银行业危机打击了Circle发行的第二大美元稳定币USDC。硅谷银行 (SVB) 的突然倒闭导致USDC的部分现金储备冻结在银行,使得这种稳定币暂时失去了与美元挂钩的能力。而另一家竞争对手,发行了第三大美元稳定币BUSD的Paxos,在美国监管压力下已经放弃了这一业务,因此Tether发行的USDT成为了近期加密稳定币需求的首选。截至发稿前,比特币最新报价为27332美元,24小时涨幅0...
区块链 2023-05-18 11:33:44 -
消息称英伟达GeForceRTX4060Ti8GB显卡定价为399美元
IT之家 5 月 18 日消息,EGAsizeGPU 是一位很少出错的英伟达硬件爆料者,他刚刚分享了有关 NVIDIA RTX 4060 Ti 系列的首个定价传闻。根据他的说法,NVIDIA RTX 4060 Ti 将会分为 8GB 和 16GB 版本,之间应该有 100 美元的差价。据说,更便宜的 8GB 版本将会持平上一代的 3060 Ti 为 399 美元(IT之家备注:当前约 2785 元人民币,国行 2999 元),而 16GB 版本为 499 美元(当前约 3483 元人民币)。值得一提的是,博板堂上周有消息称,英伟达将对 RTX 3060 Ti GPU 进行停产,并通知合作厂商清完库存即止,预计 RTX 3060 Ti 显卡的库存还需要数个月的时间才能消化。根据这位爆料者的说法,NVIDIA RTX 4060 Ti 8GB 预计将于 5 月 24 日推出,而 AMD RX 7600 非 XT 型号也将在同一天解禁。根据我们的信息,配备 16GB 显存的 RTX 4060 Ti 以及 RTX 4060 8G 应该要到 7 月下旬才会发布。IT之家注意到,目前已经有部分型号的 NVIDIA RTX 4060 Ti 8GB 显卡提前上架,但这个定价显然是占位符,预计英伟达将会在近日官宣。消息称 RTX 4060 Ti 将采用 AD106 GPU,拥有 4352 CUDA 核心,配备 8GB / 16GB 128bit GDDR6 显存,TGP 功耗 160/165W,采用 PCIe 4.0*8 连接。频率方面,消息称RTX 4060 Ti OC 型号最高可达 2...
智能设备 2023-05-18 10:53:21 -
一分钟了解特斯拉股东大会:ModelY将成全球最畅销车型,Cybertruck下半年交付
【网易科技5月17日报道】北京时间5月17日凌晨4点,特斯拉2023年股东大会在美国得州超级工厂举行。特斯拉CEO埃隆·马斯克(Elon Musk)在会上表示,尽管电动车企业盈利非常艰难,但特斯拉在盈利上是非常成功的。2022年是振奋人心的一年,特斯拉将带领全球经济走上可持续发展道路。今年下半年,特斯拉即将交付Cybertruck电动皮卡,预计将年产25万辆以上。此外,马斯克还透露,未来特斯拉还将推出2款全新产品,设计和制造都远超当下的任何产品和技术,预计这2款新产品年度总销量将超过500万辆。特斯拉2022年全年财报显示,其全年的营收为814.62亿美元,同比增长51%;毛利润为208...
智能设备 2023-05-17 13:58:12 -
特斯拉股东大会:马斯克否认辞职传言年内必交付Cybertruck
财联社5月17日讯(编辑 赵昊)当地时间周二(5月16日),电动汽车龙头特斯拉召开了股东大会,公司CEO埃隆·马斯克在讲话中预计经济将在12个月后反弹,并承诺在今年晚些时候交付电动皮卡Cybertruck。汽车业务关于这辆“难产”了很久的车型,马斯克对制造方面的一些挑战表示了遗憾,“我对造成的延误很抱歉,我们最终将在今年晚些时候开始交付量产的Cybertruck...
智能设备 2023-05-17 12:10:00 -
OPPO解散ZEKU团队,幕后老大称:“研发芯片是个错误,及时止损”
近日,OPPO停止ZEKU业务板块的消息非常火热。OPPO在芯片领域虽然入门比较晚,但是投入的资源很庞大...
手机互联 2023-05-14 23:41:53 -
OPPO投入几十亿的项目说停就停,Zeku突然停止开发,引人联想
根据网友爆料,OPPO哲库的员工上一周还去海外出差联系合作,没想到仅隔了几天,5月12日就收到了项目全部被裁撤的消息。OPPO自研芯片项目哲库的突然夭折,不仅让哲库员工措手不及,也让国内关心国产自研芯片发展的网友大感意外...
手机互联 2023-05-13 16:47:45 -
OPPO造芯未半决定终止半导体寒冬下“ZEKU们”经历“危急存亡之秋”
每经记者:陈鹏丽 每经编辑:梁枭今日(5月12日)中午,OPPO方面向《每日经济新闻》记者证实,面对全球经济、手机市场的不确定性,经过慎重考虑,公司决定终止ZEKU(哲库)业务。“这是一个艰难的决定,我们会妥善处理相关事宜,并将一如既往做好产品,持续创造价值。谢谢各位朋友的关心与支持。”OPPO方面表示。记者获悉,哲库是OPPO旗下涉及芯片业务的公司。企查查信息显示,哲库科技(上海)有限公司(以下简称哲库科技)成立于2019年8月,法定代表人为刘君,注册资本为1亿元。早在2019年,OPPO创始人兼首席执行官陈明永就宣布,未来3年将投入500亿,用于前沿技术和深水区技术的探索。2021年12月,OPPO首个自研芯片马里亚纳MariSilicon X正式发布。哲库科技业务终止的消息来得比较突然。记者了解到,4月底,哲库科技还对外发布了系统构架、数字设计、软件开发、芯片验证等多个职位的社会招聘信息。截至2023年2月底,ZEKU全球专利申请超2400件。OPPO宣布终止ZEKU(哲库)业务企查查显示,哲库科技2019年成立之时,注册资本为5000万元,由OPPO广东移动通信有限公司100%控股,最初公司名字为“守朴科技(上海)有限公司”。2020年7月,该公司注册资本增至1亿元,同时公司更名为哲库科技。2020年10月,哲库科技的投资人变更为广东欧加控股有限公司,该公司是OPPO、一加和realme的母公司。哲库科技主要从事电子科技、网络科技、信息科技领域内的技术开发、技术转让、技术咨询、技术服务,电子产品、通信产品、半导体的设计、开发、销售,芯片、半导体元器件的销售等。2019年,哲库科技还出资1500万元在北京成立子公司哲库科技(北京)有限公司。根据企业在工商系统自主填报的年报信息,哲库科技2019年~2021年的参保人数分别为22人、602人、1261人。公开消息显示,OPPO“造芯”最早也是在2019年。当年,有媒体透露,OPPO可能已在自研芯片,OPPO在欧盟知识产权局申请了名为“OPPO M1”的商标,涉及芯片领域。据《中国经济周刊》报道,在2019年12月的OPPO未来科技大会上,OPPO副总裁、研究院院长刘畅在接受媒体采访时表示,OPPO已具备芯片级能力,比如VOOC闪充的芯片就是OPPO自主研发。而网上传闻的M1芯片,也确实在计划之中,未来可能会在OPPO产品上商用。OPPO创始人兼首席执行官陈明永同时宣布:“未来三年,OPPO将投入500亿的研发预算和更多资源,构建最最核心的底层硬件技术以及软件工程和系统架构能力。”图片来源:每经记者 张建 摄(资料图)2020年2月,OPPO正式向全体员工宣布要自研芯片,将其命名为“马里亚纳项目”。2021年12月,OPPO首个自研芯片马里亚纳MariSilicon X正式发布,该芯片产品号称以创新的架构设计树立低功耗、高算力的行业新标杆。2022年12月,全球领先集成专用NPU单元的蓝牙音频SoC芯片MariSiliconY商用发布。OPPO芯片产品高级总监姜波当时对外称:“马里亚纳MariSilicon Y是OPPO的第二颗自研芯片,标志着OPPO自研芯片能力的再进一步。”据哲库科技方面介绍,该蓝牙音频SoC芯片率先应用先进的N6RF射频制程工艺,以12Mbps蓝牙速率,首次实现192kHz/24bit无损音频的无线蓝牙传输。在实现旗舰续航体验的同时,能够释放前所未有的高性能。《每日经济新闻》记者注意到,2020至2021年期间,哲库科技大举招聘人才。“ZEKU招聘”公众号透露,2021年9月,ZEKU开启2022届校园招聘,公司在8座城市、13所院校进行了招聘宣讲,累计收到国内578所高校投递的简历。2023年1月至4月,哲库科技仍在对外发布社招职位专辑,大量招募系统构架、模拟/射频、算法、芯片验证等方面的职位。据科创板日报报道,哲库科技近日发送内部信,称公司做出股东决定,自2023年5月12日起解散哲库科技及其全资子公司、分公司,并终止所有劳动合同。信中指出,对于尚未入职报到的应届生,可选择加入OPPO其他部门,或接受”N+3”补偿金。对此,《每日经济新闻》记者也尝试向OPPO方面求证,但未能获得回应。据“ZEKU招聘”透露,ZEKU布局全球7大研发中心,多Site协同发展,为员工提供全球化的平台资源和多元化的技术领域,截至2023年2月底,ZEKU全球专利申请超2400件。半导体寒冬仍在持续,业内有观点指哲库造芯“投入太大”记者了解到,OPPO宣布终止哲库业务的消息来得比较突然。据悉,哲库产品覆盖芯片设计、处理器研发的数百项技术领域,涵盖Hardware、SoftwareCPU、GPU、AI等,为旗舰手机提供系统解决方案。哲库科技此前称,要打造伟大的产品,坚持自研核心科技,致力综合发展领域。同时,哲库科技还称要坚持长期主义,持续投入研发资金,造芯需要坚定决心。“自研高端芯片是推动旗舰手机产品差异化的必由之路。稳定的终端客户和持续的投资保障,不仅让ZEKU具有独特的垂直整合优势和规模效应,同时表明了ZEKU造芯的坚定决心,并为ZEKU的长期发展奠定了坚实的基础。”对于OPPO终止“造芯”,一位资深行业人士评论称,虽然不了解内情,但理解,哲库使用的都是最先进的工艺,而且要实现真正的业务协同,投入太大,终止需要勇气。该人士还提到,今年半导体人都很难,行业处于淡季,二级市场不受待见,一级市场更不受待见。“洗礼之后,活下来的都是龙头。”一位前券商首席分析师也向记者发来一张漫画图,隐晦表示,OPPO终止芯片业务或主要与“造芯”所需投入太大有关。图片来源:视觉中国-VCG211288429073《每日经济新闻》记者注意到,截至目前,除了承担主要芯片自研任务的哲库科技,OPPO还投资了上海瑾盛通信科技有限公司,同时持有南芯科技(SH688484,股价40.13元,市值170亿元)、唯捷创芯(SH688153,股价59...
手机互联 2023-05-13 09:34:50 -
项目一个不留!OPPO放弃ZEKU自研芯片业务:多大代价都是最小代价
快科技5月13日消息,本周最突然的大事件,可能就是OPPO将终止ZEKU自研芯片业务了。OPPO将终止ZEKU业务,对于这个决定,公司称面对全球经济、手机市场的不确定性,经过慎重考虑,公司决定终止ZEKU业务...
手机互联 2023-05-13 09:34:30