-
精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023
新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式,即利用类别文本描述在目标图像中查询潜在目标,但这种方式往往会面临「广而不精」的问题。论文链接:https://arxiv.org/abs/2305...
智能设备 2023-10-19 02:15:01 -
产业链人士:华为上调2023年手机出货量目标至4000万部
IT之家 6 月 11 日消息,据中证金牛座报道,从产业链人士处获悉,华为近期已上调 2023 年手机出货量目标至 4000 万部,而华为年初将这一目标设为 3000 万部级别。市场研究机构 Omdia 数据显示,2022 年华为手机出货量为 2800 万部。产业链人士称,这意味着,华为对 2023 年公司手机出货行情有信心。IDC 数据显示,2023 年一季度全球智能手机出货量 2.7 亿部,同比下降 15%,环比下降 11%。IT之家注意到,这并非是第一次有消息称华为将上调今年的手机出货量至 4000 万部。此前 CteeNews 报道称,华为已上调 2023 年全年手机出货目标,预计全年出货量从之前的 3700 万台上调到 4000 万台了,上调幅度达 8...
手机互联 2023-06-13 10:58:22 -
群星璀璨!2023智源大会6月9日正式启航
风云激涌,星光熠熠!第五届北京智源大会将于6月9日启航!本届智源大会汇聚人工智能领域最关键的人物、最重要的机构、最核心的话题与最内行的观众,将为专业精英人士献上本年度人工智能的巅峰盛会。智源大会群星璀璨英雄荟萃:影响未来的关键问题讨论2023智源大会现场,将会有图灵奖得主Yann LeCun等领衔探讨大模型发展现状与未来趋势;图灵奖得主Joseph Sifakis,Midjourney创始人David Holz,中国工程院院士郑南宁,智源研究院理事长张宏江,清华大学智能产业研究院(AIR)院长张亚勤,智源研究院院长黄铁军,智源首席科学家、清华大学教授朱军等将进行一系列面向未来的特邀报告与尖峰对话。2023智源大会主席未来生命研究所创始人Max Tegmark,图灵奖得主Geoffrey Hinton、姚期智,OpenAI创始人Sam Altman,中国科学院院士张钹,UC伯克利分校教授Stuart Russell等嘉宾将进行一系列安全伦理问题和风险防范的讨论。AI生命科学方向的讨论将由诺贝尔化学奖得主 Arieh Warshe、2021年科学突破奖生命科学奖得主 David Baker、美国国家科学院和医学院双院士谢晓亮等顶尖专家引领探讨。星辰大海:纵览前沿研究趋势大模型的引爆人工智能概念不是偶然,算法的进步提供了重要支持。本届大会邀请过去一年领域突破的重要工作完成人,亲身讲解技术成果。如PaLM-E、OPT、NLLB、T5、Flan-T5、LAION-5B、RoBERTa等重要工作完成人届时将出席,其中多位将亲临北京,与现场观众面对面交流,讲解研究成果背后最激动人心的故事。大会还汇聚了国际明星团队,一览人工智能发展前沿趋势,如OpenAI、DeepMind、Anthropic、HuggingFace、Midjourney、Linux基金会等代表机构,以及Meta、Google、微软等企业,斯坦福、UC伯克利、MIT等学府齐聚一堂。深度研讨:最全面,最专业,最前沿两天3场特邀报告,13场专题论坛,百场精彩讨论。不同于对热度的追逐,智源大会极为注重为人工智能专业人士献上兼具专业深度与创意启发的思想交流体验,力争将每个值得探讨的话题拉到极致。6月9日首日议程包括基础模型前沿技术论坛,类脑计算论坛,视觉与多模态大模型论坛,具身智能与强化学习论坛,大模型新基建与智力运营论坛。智源大会主要议程6月10日议程包括生成模型论坛,AI系统论坛,基于认知神经科学的大模型论坛,AI生命科学论坛,AI安全与对齐论坛,自动驾驶论坛,AI开源论坛,智能的物质基础论坛。智源大模型全面开源,旗舰评测项目启航智源研究院是中国大模型研究的先行科研机构之一。在连创「中国首个+世界最大」纪录之后,「悟道3.0」迈向全面开源崭新阶段,将在大会上发布系列大模型研究成果。此外,智源研究院一直致力于通过开源开放,促进人工智能领域协同创新,构建大模型时代的「新 Linux 生态」。本次大会,「FlagOpen 大模型技术体系」也将带来大模型评测方面的最新进展,帮助大模型训练效率提升。 ...
智能设备 2023-06-08 11:13:15 -
携程集团发布2023Q1财报:净营收92亿元,同比增长124%
6月8日消息,携程集团(纳斯达克:TCOM及香港联交所:9961)公布了截至2023年3月31日第一季度未经审计的财务业绩。财报显示,2023年第一季度,携程集团净营业收入为92亿元,同比增长124%。净利润为34亿元,经调整EBITDA利润率达31%,业绩表现超市场预期。财报显示,今年一季度,携程住宿预订收入为35亿元,同比增长140%;交通票务收入为42亿元,同比增长150%。从宏观市场来看,国内酒店预订量同比增长超100%,出境酒店和机票预订量恢复到2019年同期的40%以上。国际OTA平台的机票预订量同比增长超过200%,较2019年同期增长100%。聚焦国内市场,一季度,携程集团国内本地酒店预订量较2019年同期增长150%。携程酒店套餐预订交易额同比增长超1倍。基于携程的智能客票综合解决方案,国内中转人次较2019年同期增长超过40%的机场有38个。携程数据显示,今年一季度,携程集团“机票+酒店”同订产品订单量同比增长超3倍,为用户节省旅行开支超过3000万元人民币。与此同时,该组合产品为酒店带来的新用户同比增长超1.5倍。一季度,携程集团旅游度假业务收入为3...
互联网 2023-06-08 08:45:49 -
三星OneUI6.0更新机型清单曝光S23系列10月推送
【手机中国新闻】此前有消息称,三星有望在今年年底前推出基于Android 14的One UI 6.0更新。据手机中国了解,已经有媒体提前放出可能会获得三星One UI 6...
手机互联 2023-06-08 08:31:50 -
美团买药2023年将数字化药店开到1000座县城
6月5日消息,美团买药联合药店、药企等发起“小黄灯健康守护联盟”。据了解,该联盟今年将24小时看病买药服务送进至少1000个县城,服务县域居民1亿次购药需求;另一方面,联盟会为药店、药企等医药健康行业提供一揽子数字化助力包,推广线上诊疗购药一体化服务的数字化药店。“两年前我们共同发起的‘小黄灯’民生服务计划,24小时药店作为小黄灯的载体,是我们解决夜间购药的急先锋。”美团高级副总裁、到家事业群总裁王莆中表示,随着越来越多药店完成数字化升级,能够实现线上诊疗、购药一体化服务,每个数字化药店都会成为守护家庭健康的最小单元,并连接形成每个家庭的健康守护网。希望未来能够持续与大家一起厚积薄发,让每一个家庭都有触手可得的守护他们健康的小黄灯。王莆中表示,两年前一起发起“小黄灯”民生服务计划时,意在解决夜间用药难。站在当前的时代背景下,24小时药店也许是位“急先锋”,未来完成数字化升级、能实现线上诊疗购药一体化服务的数字化药店,或将成为中国家庭健康服务的最小单元。美团医药业务部负责人李锦飞表示,“小黄灯健康守护联盟”今年将点亮千县——在1000座县城落地能24小时看病买药的数字化药店,预计今年将满足1亿次县域居民看病购药需求。“我们推出了腾飞计划3.0,提供一揽子数字化工具助力药店数字化升级。”李锦飞表示,腾飞计划3...
互联网 2023-06-05 19:43:44 -
学校要讲品牌,也要懂舆情公关:中国教育发展战略学会教育新闻传播专业委员会2023年年会顺利闭幕
6月5日消息,中国教育发展战略学会教育新闻传播专业委员会2023年年会上,中国高等教育学会会长,教育部原副部长、党组副书记杜玉波出席会议并宣布了论坛开幕。会议首先进行了2023年学会理事会选举,万安伦当选为理事长,张辉锋、郑伟、武斌儒、孙兴洋等当选为副理事长...
互联网 2023-06-05 19:37:01 -
只需15分钟,iPhone就能「复制」你的声音
史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。但那并不是霍金自己的声音。在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。只需 15 分钟「调教」,就能生成你的声音▲ 图自 Fastcompany在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。据介绍,iPhone、iPad 和 Mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?素材随机化。在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。物理距离屏障。在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。自己的声音,失去了才懂多重要人是感性的生物,而声音是很强烈的情感触发器。有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。这听起来有点抽象。但当我们失去它时,重要性就变得显而易见了。2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。Brunton 的行动很果断,确诊后马上找公司去做语音生成。来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。那家公司用的是一种名为「单元选择(unit selection)」技术。简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》这种技术生成的语音能听清,但会有点电音,听起来不太自然。结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。https://s3.ifanr...
智能设备 2023-06-05 10:26:14 -
郭明錤谈WWDC23:相比于苹果头显投资者对AI更感兴趣
6月5日消息,苹果将于北京时间周二凌晨举行本年度全球开发者大会(WWDC23),届时有望推出第一款混合现实头戴设备。知名苹果分析师郭明錤会前表示,投资者对苹果头戴设备的兴趣不如对人工智能服务的兴趣大...
电信通讯 2023-06-05 07:57:27 -
三星自家元器件仅占S23UltraBoM的约三分之一
集微网消息,近日市调机构 Counterpoint 公布了三星 Galaxy S23 Ultra 的元器件成本分析,其中高通是三星 Galaxy S23 Ultra 供应商中的最大赢家。三星 Galaxy S23 Ultra 8+256GB 版本(Sub-6GHz)成本约为469美元,其中处理器和蜂窝数据子系统占比最高占到35%,屏幕第二(18%),相机第三(14%)...
手机互联 2023-06-05 00:08:13 -
消息称苹果将在WWDC23上提供AR/VR头显现场体验机会
IT之家 6 月 4 日消息,据彭博社记者 Mark Gurman 报道,苹果公司计划在即将举行的 2023 年 WWDC 活动上,向部分开发者和参会者提供尝试新款 AR / VR 头显的机会,这款头显将在活动上正式发布。据报道,苹果公司在 Apple Park 内建造了一个新的“结构”,用于提供对头显的受控现场体验...
智能设备 2023-06-04 09:40:31 -
Gurman称苹果有望在WWDC23上宣布不再使用“嘿,Siri”唤醒词
IT之家 6 月 4 日消息,据彭博社记者马克・古尔曼(Mark Gurman)透露,苹果公司可能在下周的 WWDC23 大会上宣布一项重大改变,即取消目前唤醒语音助手 Siri 所需的“嘿,Siri”唤醒词,用户只需说“Siri”就可以激活语音助手。古尔曼在推特上重申了这一消息,并表示这项改变可能是下周大会上的重要公告之一...
手机互联 2023-06-04 09:03:41