Midjourney公司计划在未来几个月推出“文本转视频”模型,通过在1月开始培训视频模型,强调其自然发展和在生成视频领域引入竞争动态,同时V6更新提升画质和用户体验。
谷歌即将发布与Bard合作的增强助理,最新应用程序更新展示新设计,包括弹出窗口和标签切换器,同时对股票和金融小部件进行调整。
与GPT-4V进行比较时,实验发现GPT-4V在所有对象识别任务中表现一致,但在对象级感知方面落后于VCoder。
此外,M2UGen还加入了适配器和LLaMA2模型,使得该模型具备多种能力。
项目地址:https://top.aibase.com/tool/dreamtalk