注册登录

看啥推荐读物

专栏名称: 包包算法笔记

数据挖掘、机器学习、深度学习、Kaggle竞赛分享与交流。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

正商听潮 · 冒充国货上位，一年狂赚1046亿：这个日本饮 ...· 昨天

电商报Pro · 快手全力冲刺，海外业务到了关键时刻· 昨天

首席品牌官 · 为什么emis、Navage、Liquid ...· 昨天

亿恩 · 美国广告商计划继续加码TikTok· 3 天前

蛋先生工作室 · 5月12日淘汰鸡行情· 4 天前

今天看啥 › 专栏 › 包包算法笔记

挑战GPT4v？马斯克xAI刚刚发布Grok 1.5v

包包算法笔记 · 公众号 · · 2024-04-14 07:57

Grok-1.5V是xAI推出的首个多模态AI模型，不仅具有强大的文本处理能力，还能够处理各种视觉信息，包括文档、图表、截图和照片等。这使得Grok能够更全面地连接数字世界和物理世界。 Grok-1.5V在此前发布的语言模型Grok-1.5的基础上，增加了视觉处理能力。它采用了创新的架构，先提取图像或视频的特征，然后使用交叉注意力层将视觉特征与文本输入融合，实现统一的理解。在VQAv2和NLVR2等测试视觉问答和推理能力的基准测试中，Grok-1.5V取得了最先进的结果，超越了GPT-4和Gemini-3等模型。这证明了它在多模态理解方面的强大能力。 xAI认为像Grok-1.5V这样的多模态AI在现实世界应用中具有巨大潜力。例如分析医学扫描图像、理解电商产品图片，以及处理机器人和自动驾驶汽车中的视频信息等。文章中提供了交互式演示，用户可以上传自己的图片 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

正商听潮 · 冒充国货上位，一年狂赚1046亿：这个日本饮料品牌，竟成了“中国茶”代表？

昨天

电商报Pro · 快手全力冲刺，海外业务到了关键时刻

昨天

首席品牌官 · 为什么emis、Navage、Liquid I.V.都将天猫国际作为入华第一站？

昨天

亿恩 · 美国广告商计划继续加码TikTok

3 天前

蛋先生工作室 · 5月12日淘汰鸡行情

4 天前

慈怀读书会 · 湖南街头，22岁二孩妈妈被丈夫撞死：他开车从她身上碾过去，又绕回来压了一次……

1 年前

王盐 · 周末时间又到啦，大家在过往的恋爱经历中有哪些非常美好的时刻来分享一下吧，也可以来谈一谈，对于未来的爱情有什么比较特别的期待。

4 年前

极果网 · 宅家轻松玩转工作，随时劳逸结合，被这款办公神器香哭了~

4 年前

19楼 · 警惕！路边碰到这种小红土堆，赶紧躲远点！已有多人因此中毒、休克！

5 年前

概率论 · 我不怕等待，只怕你不来。

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号