-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
Key社《虚拟月球之子》将于2024年登陆Switch
2021年在PC平台发售的Key视觉小说《虚拟月球之子》(别名:恋月物语)确定将于2024年登陆任天堂Switch平台,为广大Switch玩家带来一场充满浪漫与情感的精彩冒险。 《虚拟月球之子》以浪漫的恋爱故事为主线,讲述了一位少女与虚拟世界中的神秘男孩之间的邂逅和成长...
游戏资讯 2023-10-19 07:08:45 -
Analogue3D任天堂N64平替主机原创设计性能加强
一直在致力于复刻平替经典游戏机的Analogue公司日前公布了最新项目,“Analogue 3D”的任天堂N64平替主机,官方表示新主机为弃原版元素的原创设计并性能加强,敬请期待。·据悉,“Analogue 3D”将带来完全弃原版元素的原创设计,采用FPGA设计,在原版解像度模式基础上追加4K级别,支持美、欧、日本所有地狱的100%兼容性,支持蓝牙以及2.4Ghz无线连接,并支持4个控制器使用,还采用公司独创Analogue OS操作系统等等特征。·“Analogue 3D”预定2024年发售,感兴趣的玩家可以关注下了。 ...
游戏资讯 2023-10-19 02:36:15 -
大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0
新智元报道编辑:编辑部【新智元导读】ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。Stack Overflow,已经被ChatGPT创飞了!因为码农大量涌向ChatGPT、Github Copilot,Stack Overflow今天不得已宣布裁员100多人,几乎占员工人数的1/3。所以,ChatGPT这类AI编码工具,真的要颠覆整个行业了?不过最近,普林斯顿和芝大的一项研究发现,LLM想要替代码农,其实没那么容易。论文地址:https://arxiv.org/abs/2310...
智能设备 2023-10-19 02:14:55 -
HeySiri被砍!iOS17首个测试版发布:你升级吗?
快科技6月6日消息,北京时间凌晨01:00,一年一度的苹果WWDC23开发者大会正式开幕,带来了M2 Ultra版Mac Pro和Mac Studio、新款MacBook Air、首款头显Vision Pro等新品,同时还发布了iOS 17、watch OS10、iPadOS 17等新系统。在大会结束后,苹果火速发布了首个iOS 17开发者Beta版,目前有开发者资格的同学已经可以下载体验尝鲜了...
手机互联 2023-06-06 05:43:27 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
苹果的最大竞争对手?外媒上手Quest3头盔:预计10月份发布
5月29日消息,最近,彭博科技的作者马克·古尔曼(Mark Gurman)试用了Meta即将推出的混合现实头戴式设备Quest3。他认为,Quest 3更轻薄,透传功能大幅提升,处理速度更快,可运行的内容也更多,在混合现实领域明显具有很大吸引力...
业界动态 2023-05-29 16:28:37 -
自动写代码?GoogleColab叫板githubcopilot
【网易科技5月18日报道】近日,谷歌宣布了Google Colaboratory(Colab)将加入全新的AI编码功能。据了解,该功能由全新的「文生代码」模型Codey提供支持,支持20多种编码语言,包括Go、谷歌标准SQL、Java、Javascript、Python和Typescript等...
智能设备 2023-05-18 14:56:18 -
上QQ就可AI绘画?Midjourney中文版来了内测申请已在QQ频道上线
①Midjourney官方中文版已经开启内测申请,其将搭载在QQ频道上,每周一、周五下午6点统一开放,达到一定人数后会关闭入口,用户扫描相关二维码即可加入;②有知情人士透露,Midjourney入驻QQ频道并开放招募,目前还只是自己的行为。《科创板日报》5月16日讯(记者 张洋洋)5月15日晚,AI绘画工具Midjourney又悄悄搞了一个大动作...
智能设备 2023-05-16 10:09:21 -
苹果新专利:演示文稿应用Keynote增加直播源功能
IT之家4月14日消息,根据美国商标和专利局(USPTO)公示的清单,苹果计划为演示文稿应用程序Keynote引入实时视频/直播源功能,编号为US20230115250A1。苹果公司在专利描述中表示,用户如果想要在Keynote应用中嵌入视频,可能会消耗大量的计算资源,通常情况下也不会使用实时视频...
智能设备 2023-04-14 10:31:41 -
微软Surface雷电4Thunderbolt扩展坞开售,国行2565元
IT之家4月12日消息,微软SurfaceThunderbolt4(雷电4)扩展坞现已在官网上架开售,国行售价2565元。据介绍,这款扩展坞是一款USB4/Thunderbolt4扩展坞,可提供超高速数据传输、连接重要的外围设备,并为其充电...
智能设备 2023-04-12 11:36:43 -
微软发布Beta版SwiftKey输入法,支持和必应聊天
IT之家4月7日消息,微软近日发布了Beta版SwiftKey输入法应用,最值得关注的改进就是可以和必应(NewBing)聊天了。用户在Beta版SwiftKey版本的左上角看到一个必应图标,点击之后会跳出提示,IT之家翻译如下:“欢迎在SwiftKey中使用Bing...
智能设备 2023-04-07 10:21:11