看啥推荐读物
专栏名称: AIGC新智界
区块链/数字货币/比特币中文资讯,创立于2011年,200多位专栏作入驻平台,国内最大区块链资讯原创基地(公众号【原创】认证),我们为以下合作伙伴供稿:火币、OKCoin、BTC.com、BTCC、币看、BTC123、比特时代、挖币网
今天看啥  ›  专栏  ›  AIGC新智界

马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合

AIGC新智界  · 公众号  · 比特币  · 2024-04-15 16:53
【导读】马斯克xAI的多模态模型Grok-1.5V横空出世了!不仅多项基准测试超越GPT-4V,而且看懂梗图写Python代码也都不在话下。并且,为了评估模型对于真实世界的空间理解,xAI此次还推出了新基准RealWorldQA。马斯克的第一代多模态模型Grok-1.5V,终于来了!Grok 1.5V,号称是能连接数字世界和物理世界。除了文本功能,它还能处理文档、图标、屏幕截图和照片之类的各种视觉信息。很快,所有早期测试者和所有Grok用户就能用上Grok 1.5V了。英伟达高级科学家Jim Fan发现了Grok-1.5V的「最大亮点」:在他看来,Grok-1.5V最令人感兴趣的,就是解决自动驾驶边缘案例的潜力。如果使用语言进行「思维链」,帮助汽车分解复杂场景,用规则和反事实进行推理,解释其决策,Grok-1.5V就能将像素->动作映射提升为像素->语言->动作。由此,特斯拉FSD V13就很有可能会理解语言To ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照