首页 > 资讯列表 >  本页面生成新视觉专题报道,新视觉滚动新闻,新视觉业界评论等相关报道!
  • 超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品

    超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品

    白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...

    智能设备 2023-10-19 09:56:05
  • 传《GTA6》视觉效果大升级顶尖的水面物理

    传《GTA6》视觉效果大升级顶尖的水面物理

    据媒体报道,《GTA6》将有“令人印象深刻的”视觉升级,遥遥领先《荒野大镖客2》比《GTA5》的升级幅度。 消息来自于法国媒体Rockstar Mag,这家媒体报道称开发《GTA》系列新作的RAGE引擎新版本将引入一些重要的升级,这包括物理,时间流逝,渲染品质,AI等方面...

    游戏资讯 2023-10-19 03:25:35
  • 更有气势了!《碧琪公主表演时刻》视觉图调整

    更有气势了!《碧琪公主表演时刻》视觉图调整

    任天堂近日悄悄对Switch游戏《碧奇公主表演时刻》的封面视觉图进行了调整,主要集中在碧奇公主面部的微妙表情上。调整后似乎进一步强化了主角碧奇公主的气势,让玩家对游戏的精彩内容有更加直观的预期...

    游戏资讯 2023-10-19 03:09:12
  • 任天堂《碧奇公主表演时刻》视觉图进行调整

    任天堂《碧奇公主表演时刻》视觉图进行调整

    任天堂近日悄悄对Switch游戏《碧奇公主表演时刻》的封面视觉图进行了调整,主要集中在碧奇公主面部的微妙表情上。调整后似乎进一步强化了主角碧奇公主的气势,让玩家对游戏的精彩内容有更加直观的预期...

    游戏资讯 2023-10-19 03:06:22
  • 《极限竞速:Motorsport》MOD优化远距离阴影视觉效果

    《极限竞速:Motorsport》MOD优化远距离阴影视觉效果

    MOD作者Talal26为《极限竞速:Motorsport》发布全新MOD,为游戏的远距阴影进行优化。这个MOD可以明显优化游戏的视觉效果...

    游戏资讯 2023-10-19 02:51:39
  • 暴雪《暗黑4》新视频错误连篇被玩家嘲笑后快速下架

    暴雪《暗黑4》新视频错误连篇被玩家嘲笑后快速下架

    近日,在《暗黑破坏神4》第二赛季发布之后,暴雪在其社交媒体上发布一段新视频,其中介绍了第二赛季为游戏带来的新变化,但这一举动再次受到的玩家的批评。《暗黑破坏神4》主播Raxxanterax指出了视频中的错误,这些不是隐晦难以发现的错误,就连普通的数值计算暴雪也搞错了。首先是《暗黑破坏神4》第一赛季和第二赛季的地牢布局对比,暴雪把改动之后和改动之前的布局弄反了,他将新的第二赛季之后的布局列为了之前,而旧的布局列为了之后。随后是经验增益的展示,暴雪在数值计算出现了低级错误,改动之前:1000xp乘以40%的计算结果居然是1040xp(正确的应该是1400),改动之后暴雪把百分比换成了小数,并表示1000xp两个单独的1.2倍增益结果是1400xp(实际上是1440)。类似的错误视频中还出现了很多,目前暴雪已经将该视频下架。不过整件事相当奇怪,而且令玩家惊讶的是,这个视频是如何制作并通过审核最终被发布出来的。 ...

    游戏资讯 2023-10-19 02:45:00
  • 360发布视觉大模型周鸿祎:多模态大模型与物联网结合是新风口

    360发布视觉大模型周鸿祎:多模态大模型与物联网结合是新风口

    【网易科技5月31日报道】“原来的AIoT只是垂直AI,不是通用AI,经过大模型赋能的AIoT才是‘真AI’”,5月31日,三六零(601360.SH,下称“360”)智慧生活集团举办视觉大模型及AI硬件新品发布会,360集团创始人周鸿祎参会并发表演讲——大模型开启AIoT新时代。会上,周鸿祎宣布发布“360智脑-视觉大模型”。他表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,让“360智脑“能够看懂图片,未来还能看懂视频、听懂声音。周鸿祎表示,过去的人工智能是弱人工智能,在此基础上打造的智能硬件不具有真正的智能。大模型出现后,计算机第一次真正的理解这个世界,并能够赋予AIoT真正的智能。他表示,大模型的出现标志着通用人工智能到来,AI完成了从感知层到认知层的进化。“大模型将带来一场新工业革命”,周鸿祎认为,所有软件、APP、网站,所有行业都值得用大模型进行重塑,而智能硬件是硬件化的APP。从大模型的发展趋势来看,多模态是大模型发展的必经之路,GPT-4最重要的变化是拥有了多模态的处理能力。因此,周鸿祎预言,多模态大模型与物联网的结合将会成为下一个风口。他表示,多模态技术与智能硬件结合是大势所趋,未来大模型将成为物联网的大脑,物联网设备则相当于大模型的感知端,让大模型进化出“眼睛和耳朵”,大模型还有可能操控物联网设备,进化出嘴巴、手和脚,从而拥有行动力,最终实现从感知到认知,从理解到执行。据悉,360在视觉感知能力基础上,融合千亿参数“360智脑”大模型,基于十亿级互联网图文数据进行清洗训练,并针对安防场景百万级行业数据进行微调,最终打造出了专业的视觉及多模态大模型——360智脑-视觉大模型。“目前,大模型的能力主要体现在软件层,当大模型接入智能硬件,会让大模型的能力从数字世界走向物理世界。”周鸿祎说。(袁宁) ...

    智能设备 2023-05-31 21:02:01
  • 三星GalaxyS24Ultra全面变革,超视觉无孔屏+第三代骁龙8,很强

    三星GalaxyS24Ultra全面变革,超视觉无孔屏+第三代骁龙8,很强

    首先问一下大家,有没有使用三星手机的呢?在下方打出手机型号!三星是一家综合性的手机厂商,在全球市场表现出众,是苹果强有力的竞争对手,三星对手机品质要求非常高,主打海外市场,尤其是三星Galaxy S系列,定位高品质影像旗舰,其中Ultra机型的影像实力有目共睹,配合极其自由的系统,用户体验也不差。按照正常更新节奏,三星Galaxy S24Ultra也不远了,有海外博主发布了一组渲染图,产品设计全面变革,看起来更加精致,很强。众所周知,前几代Ultra机型外观基本一致,Note系列也是如此,各机型之间的差距不大,辨识度并不高,用户也期待在产品设计方面有所改变。此次三星Galaxy S24Ultra整机变化很大,搭载一块超视觉无孔屏,还是双曲面方案,边框更窄一些,屏幕更接近直屏,屏占比高达96%,将视觉效果彻底提升了一个档次。据爆料,这款屏幕达到了6.78英寸,三星新一代动态AMOLED材质屏,峰值亮度高达2600尼特,全屏幕(包括屏下区域)支持1-120赫兹刷新率自由调整,分辨率提升至2K+水准,并且支持1440赫兹高频PWM调光,HDR10+显示,并且支持低频闪模式,长时间使用眼睛也没有任何酸涩感,非常完美的旗舰好屏。三星Galaxy S24Ultra的机身更硬朗一些,对中框边缘进行了微曲面处理,看起来更加精致。影像模组大改,采用全新的矩形浴霸方案,镜头大小不一,呈田字排列,坚持超精工设计方案,细节打磨相当到位,支持IP68防水。三星Galaxy S24Ultra产品设计值得肯定,这种高品质设计方案实属难得,必然会受到用户关注。至于影像参数,三星Galaxy S24Ultra重磅升级,后置旗舰四摄,将回归1亿像素主摄,自研新一代大底传感器,支持可变光圈,搭配1200万像素超广角,1200万像素长焦,1200万像素潜望式长焦,主摄、及双长焦均支持光学防抖,超广角还支持超级视频防抖,配合三星引以为傲的影像算法,在各种场景都有出色的表现。三星Galaxy S24Ultra性能优势明显,很可能首发第三代骁龙8,这颗芯片工艺、架构已经相当清晰,4纳米工艺制程,依旧由台积电代工,1+5+2全新架构,GPU将升级为Adreno750,性能和能耗比都全面升级。第三代骁龙8核心性能完美,在三星调教之下,用户体验自然不容小觑。运存还将提升至20GB,搭配1TB储存空间,更符合商务人士需求。该机坚持超长续航方案,不仅集成了各项电源优化技术,电池容量达到了5600毫安时,日常轻松使用一天,轻度使用续航更持久,商务人士必备,配备S-Pen手写笔,随时都可以流畅使用。可以看出,三星Galaxy S24Ultra颜值和性能都再次提升了一个水准,外观更好看,品质更优秀,硬件配置也相当出色。不过该机短时间并不会发布,大家可以考虑三星Galaxy S23Ultra。一款不可多得的高性能影像旗舰,支持IP68防水,颜值出众。全新超视觉夜拍影像系统,2亿高像素主摄+双长焦系统,支持10倍光学变焦,100倍数码变焦。正面120赫兹动态AMOLED 2K屏,视觉效果不容小觑,支持S-Pen手写笔操作。内置骁龙8Gen2超频版芯片,性能遥遥领先,还有5000毫安时大容量电池,配置全面。三星Galaxy S23Ultra通过了市场检验,商务人士的必备神器,工作、拍照两不误,用户体验出众。大家觉得三星Galaxy S23Ultra值得入手吗?欢迎在文章下方留言并讨论!大家有任何问题都可以私信小编! ...

    手机互联 2023-05-17 08:54:09
  • Meta开源多感官人工智能模型,整合文本、音频、视觉等六类数据

    Meta开源多感官人工智能模型,整合文本、音频、视觉等六类数据

    IT之家5月9日消息,Meta公司发布了一个新的开源人工智能模型ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验...

    智能设备 2023-05-10 10:49:03
  • 高德上线手机弯道会车预警功能,帮助用户提前了解前方视觉盲区状况

    高德上线手机弯道会车预警功能,帮助用户提前了解前方视觉盲区状况

    4月28日消息,五一假期前,高德地图正式上线了手机端的弯道会车预警功能,应用北斗系统精准定位、智慧交通实时算法等技术,可在用户驾车导航至弯道复杂路段时自动生效,以语音播报、动态3D影像等形式告知对向来车情况,帮助用户提前了解前方视觉盲区状况,降低驾车出行安全隐患。据了解,过往的传统方式多是通过在相应路段或机动车上设置传感器、大屏幕、雷达等硬件设备,成本较高...

    互联网 2023-04-28 15:09:16
  • P5手游主视觉图曝光官方已更换头像背景

    P5手游主视觉图曝光官方已更换头像背景

    今日,手游P5X《女神异闻录:夜幕魅影》官方微博和B站更新了本作的最新视觉图。微博地址>>>关于本作,目前还没有更多官方消息公布,不过据传很有可能是完美世界在2021年公布的《CODENAME:X》,让我们期待一下吧...

    游戏资讯 2023-03-17 08:17:46
  • 主动降噪效果提升2倍,苹果放出AirPodsPro(第二代)最新视频

    主动降噪效果提升2倍,苹果放出AirPodsPro(第二代)最新视频

    IT之家3月16日消息,苹果官方今天再次发布了一段宣传视频,重点介绍了AirPodsPro(第二代)的主动降噪功能。在视频中,一位女性佩戴着AirPodsPro,听着TkayMaidza的《WhereIsMyMind?》歌曲,穿梭在繁忙的都市环境中...

    智能设备 2023-03-16 09:51:23

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持