|
如果你心里还只有YOLO-World你就输了!DetCLIPv3出手,性能大幅度超出一众SOTA模型! 集智书童 · 公众号 · · 2 天前 · 访问文章快照 |
|
视觉的跨界 Wiki-LLaVA | lmage + Question 的奇妙反应,生成多模态大型语言模型(MLLMs)! 集智书童 · 公众号 · · 2 天前 · 访问文章快照 |
|
100+论文与创新点!SLAM+路径规划资料合集 集智书童 · 公众号 · · 3 天前 · 访问文章快照 |
|
VoxAtnNet | 手机面部生物识别系统的新型3D呈现攻击检测算法! 集智书童 · 公众号 · · 3 天前 · 访问文章快照 |
|
简单有效的手写文本识别系统优化之路,在IAM 和 RIMES 性能 SOTA! 集智书童 · 公众号 · · 3 天前 · 访问文章快照 |
|
多才多艺模型出现 | 捕捉每一个细节,多任务 + 多模态 + 自监督等Trick都不在话下! 集智书童 · 公众号 · · 3 天前 · 访问文章快照 |
|
标题:逆光、眩光问题视觉模型怎么解决?一个感知卷积让检测/识别/跟踪/深度估计等任务,统统适用! 集智书童 · 公众号 · · 4 天前 · 访问文章快照 |
|
中科院联合多所高校提出 AdvLoRA | 通过数据增强,攻击检测等对抗模型攻击,提高模型安全性和鲁棒性! 集智书童 · 公众号 · · 4 天前 · 访问文章快照 |
|
Res-U2Net | 一种无需训练的相位检索模型用于三维结构重建! 集智书童 · 公众号 · · 5 天前 · 访问文章快照 |
|
三星新出检测神器 | 通过聊天+看图的形式轻松完成目标检测,性能 SOTA 集智书童 · 公众号 · · 5 天前 · 访问文章快照 |
|
四大院校携手 GraphBEV | 将激光雷达和相机信息融合到BEV,比 BEVFusion性能高出8.3% ! 集智书童 · 公众号 · · 6 天前 · 访问文章快照 |
|
杜克大学提出 OSR-ViT | 性能水平远超现有的监督学习方法,仅使用少量训练数据就能超越监督 Baseline ! 集智书童 · 公众号 · · 6 天前 · 访问文章快照 |
|
时序多方向论文204篇大整理,包含时序预测/时序Transformer/时序大模型等最新研究 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
“地表最强股票”英伟达一夜缩水1.5万亿元市值,超微电脑暴跌23%!科技股炸锅了 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度! 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
速度提升5.8倍数 | 如果你还在研究MAE或许DailyMAE是你更好的选择,更快更强更节能!!! 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
视觉prompt工程!无需微调、无需任何模型修改,让一个通用模型可以执行多种指定任务 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
FlattenQuant | 推动低比特量化技术突破,大幅提升大型语言模型的计算效率和部署性能! 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
你的模型是不是换个场景就不行了?CAT 的完美设计解决类内偏差,场景自适应的目标检测就这么诞生了 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |
|
官宣!META豪横推出Llama 3大模型,性能炸裂,AI大模型王座争夺战迎来新变革 集智书童 · 公众号 · · 1 周前 · 访问文章快照 |