Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
视觉理解论文系列(一)——ERNIE-VIL
简介 ERNIE VIL是百度出品的知识增强视觉 语言预训练模型 xff0c 首次将场景图知识融入到多模态预训练中 xff0c 大幅提升了机器的 理解能力 通过在预训练阶段加入场景图预测任务 xff0c 使得模型能更精准的把握视觉 语言跨模
ERNIE
VIL
视觉理解论文系列