【AI】行业消息精选和分析(23-11-19)

行业动态

1、对标GPTs,微软连夜发布100多项更新!微软CEO:Copilot时代来了
2、英伟达联手微软推出AI代工服务
3、全新雅虎搜索将于 2024 年上线,未来还会推出更多 AI 和高级功能
4、Instagram 推出定制 AI 贴纸和滤镜功能,强化创作者体验
5、OPPO正式推出自主训练大模型AndesGPT
6、原阿里首席 AI 科学家贾扬清再发声:开源领域“魔改”要不得
7、滴滴组建大模型团队,将落地部分个人出行和企业差旅场景
8、小米 Vela 开源系统正式发布:8KB 内存就能跑,支持端侧 AI 大模型
9、金山办公昨日宣布,WPS AI 开启公测,面向全体用户陆续开放体验。
10、人人都有专属数字家庭医生 浙江数字健康人“安诊儿”来了

技术发展

🤖 DeepMind的Mirasol3B模型:
- 更有效地理解和分析视频中发生的事情,即使视频很长。
- 独特的多媒体处理:同步和非同步文本分析。
- 视听与文本关系理解:提高长视频分析效率。


🎥 Meta AI的Emu Video和Emu Edit:
- Emu Video:文本到视频的生成,高质量视频制作。
- Emu Edit:图像编辑的指令驱动模型,精确像素修改。
- 技术创新:两个扩散模型生成高分辨率视频。

当地时间11月16日,Meta于官网发布文生视频模型Emu Video和图像编辑模型Emu Edit。
据介绍,Emu Video可以通过自然语言生成高质量视频,它将视频生成分为两个步骤,首先生成以文本为条件的图像,然后生成以文本和生成的图像为条件的视频。Emu Edit是一个多任务图像编辑模型,可以通过自然语言对图像进行编辑。在训练中,团队将区域编辑、自由格式编辑和计算机视觉任务等均制定为生成任务,并为其提供了学习任务嵌入。


🌐 screenshot-to-code项目:
- GPT-4V驱动:将屏幕截图转化为HTML网页。


👤 微软的Deepfakes Creator:
- 仅需文本输入就可生成逼真的会说话的真人视频
- 支持多种语言,还可进行实时问答互动


🎶 Deepmind与YouTube的Lyria音乐生成模型:
- 只要哼唱或者吹口哨就能帮你自动生成交响乐
- 歌词创作和风格控制:艺术家风格模仿。
- 特色:生成音频带AI水印。

谷歌DeepMind宣布与YouTube合作推出AI音乐生成大模型Lyria,并基于该模型推出两个功能:Dream Track、Music AI。Dream Track可以自动生成模仿某音乐人声音、风格音乐,用户只需输入文字提示,选择需要模仿的音乐人,便可以自动生成包含歌词的30秒音乐。
Music AI可以将用户哼唱的旋律变成完整的曲目,创建乐器和声乐伴奏等。此外,基于Lyria模型发布的任何内容都将带有Synth ID水印。

🏪 GPTs Store界面曝光:GTPs导航站可能会被取代?
- 精选GPT:展示本周精选GPTs。
- 热门GPT:社区中受欢迎的GPTs。
- 特色和趋势:当前列表为空


🎨 Meshy-1:3D模型生成AI工具:
- 多样输入:文本和图像到3D模型转换。
- 风格多样:现实、动漫、卡通等风格选择。
- 格式支持:多种文件格式,包括Unity插件。
- 高清纹理:提供4K分辨率PBR纹理。
 

今日感受

1.魔改开源大模型,以零一修改张量名字为典型案例,开始被开源社区、大厂抵制。这将导致社会资源的大量浪费和损失。

2.多模态AI时代就要来了。

单模态AI的能力是有限的,比如只能通过文本或者图像来理解或者输出内容。如今,单模态数据在实际应用中存在局限性,需要采用多模态 AI。

举个例子,一辆只有摄像头系统的自动驾驶汽车很难在弱光下识别行人。如果加上激光雷达、雷达和 GPS 就可以完美解决这些问题,可以为车辆提供更全面的周围环境图像,从而使驾驶更安全、更可靠。

和自动驾驶一样典型的案例,就是医疗。我们都知道,中医有“望闻问切”,西医讲究“视触叩听”,异曲同工,并且是典型的多模态应用。

多模态才更符合人类的真实世界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/163662.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

适用于全部安卓手机的 5 大免费 Android 数据恢复

您是否面临这样一种情况,即在Android设备上丢失了一些重要文件,但不知道应该选择哪种Android数据恢复来取回它们? 如果您以前从未备份过Android数据,则很难解决问题。 本文将介绍排名前5位的免费Android数据恢复软件。 您可以获…

【教3妹学编程-算法题】三个无重叠子数组的最大和

2哥 : 3妹,咋啦?一副苦大仇深的样子? 3妹:不开心呀不开心,羽生结弦宣布离婚。 2哥 : 羽生什么? 3妹:羽生结弦! 2哥 : 什么结弦? 3妹:羽生结弦!&am…

理论与实践相结合之Cisco Packet Tracer网络模拟器安装教程

简介 Packet Tracer是由思科设计的跨平台可视化仿真工具,它允许用户创建网络拓扑以模仿计算机网络和使用命令行界面来模拟配置思科路由器和交换机。Packet Tracer的用户界面为拖放式,允许用户根据自己的需要添加和删除模拟的网络设备。 Packet Tracer很…

安卓手机投屏到电视,跨品牌、跨地域同样可以实现!

在手机网页上看到的视频,也可以投屏到电视上看! 长时间使用手机,难免脖子会酸。这时候,如果你将手机屏幕投屏到大电视屏幕,可以减缓脖子的压力,而且大屏的视觉体验更爽。 假设你有一台安卓手机,…

odoo17前端js框架的演化

odoo17发布了,从界面上看,变化还是很明显的,比16更漂亮了,本来以为源码不会发生太大的变化,结果仔细一瞧,变化也不小。 1、打包好的文件数量和大小发生了变化 打包好的文件从两个变成了一个,在…

在excel中设置图表的标题

已经在excel做好了一个图,默认是没有标题的: 现在来设置一个标题。 双击图表,进入编辑状态: 右键,选择“插入标题”: 输入标题:

0基础编程教学,编程零基础该学什么,中文编程工具下载

0基础编程教学,编程零基础该学什么,中文编程工具下载 给大家分享一款中文编程工具,零基础轻松学编程,不需英语基础,编程工具可下载。 这款工具不但可以连接部分硬件,而且可以开发大型的软件,象…

vscode pandas无法使用

一、代码内容 import csv csv_reader csv.reader(open("data.csv")) for row in csv_reader:print(row) print(row[2]) 二、错误提示 ModuleNotFoundError: No module named pandas 三、安装pandas 然后我安装pandas,因为我的python的版本是python …

Dynamsoft Barcode Reader新框架将医疗视觉提升到新水平

Dynamsoft Vision 框架将医疗保健领域的计算机视觉提升到新的水平 引入图像捕获、内容理解、结果解析和交互式工作流程的聚合 SDK,以简化复杂的流程。 温哥华 – 2023 年 7 月 17 日 – Dynamsoft™ 发布了 Dynamsoft Barcode Reader SDK C Edition v10.0.0。更新…

Kotlin 知识体系

Kotlin 知识体系 1、Kotlin 文档2、Kotlin 基础3、桌面应用程序4、Android 与 iOS 应用程序 1、Kotlin 文档 Kotlin 是一门现代但已成熟的编程语言,旨在让开发人员更幸福快乐。 它简洁、安全、可与 Java 及其他语言互操作,并提供了多种方式在多个平台间复…

基于STM32单片机数字电压表自动切换量程及源程序

一、系统方案 1、本设计采用这STM32单片机作为主控器。 2、液晶1602显示。 3、内部ADC采集电压0-12V,自动切换档位。 二、硬件设计 原理图如下: 三、单片机软件设计 1、首先是系统初始化 u8 i; u16 a,b,c,d; u16 adcx; float adc; unsigned char datas…

(免费领源码)python+django+mysql线上兼职平台系统83320-计算机毕业设计项目选题推荐

摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对线上兼职等问题,对线上兼职进行…

后端技术知识点内容-全部内容-面试宝典-后端面试知识点

文章目录 -2 flink-1 linux of viewlinux查看占用cup最高的10个进程的命令; 〇、分布式锁 & 分布式事务0-1分布式锁--包含CAP理论模型概述分布式锁:分布式锁应该具备哪些条件:分布式锁的业务场景: 分布式锁的实现方式有&#…

【算法挨揍日记】day22——面试题 17.16. 按摩师、213. 打家劫舍 II

面试题 17.16. 按摩师 面试题 17.16. 按摩师 题目描述: 一个有名的按摩师会收到源源不断的预约请求,每个预约都可以选择接或不接。在每次预约服务之间要有休息时间,因此她不能接受相邻的预约。给定一个预约请求序列,替按摩师找…

实用小算法

开头提醒: 打开自己本地任意一个SpringBoot项目,复制代码到test包下跟着敲。 后面几篇文章不再提醒,希望大家养成习惯。看10篇文章,不如自己动手做一次。 我们不执着于一天看多少篇,但求把每一篇都搞懂,…

python 计算最大回撤

1. 什么是最大回撤 最大回撤是评估金融产品收益的一个非常重要的风险指标,它指的是在选定历史周期内任一历史时点往后推,产品净值走到最低点时的收益率回撤幅度的最大值。 以上图为例, 最大回撤 ( V a l u e A − V a l u e B ) V a l u e …

《2020年最新面经》—字节跳动Java社招面试题

文章目录 前言:一面:01、Java基础知识答疑,简单概述一下?02、倒排索引了解吗?使用Java语言怎么实现倒排?03、详细讲解一下redis里面的哈希表,常用的Redis哈希表命名有哪些,举例说明其…

MongoDB相关基础操作(库、集合、文档)

文章目录 一、库的相关操作1、查看数据库2、查看当前库3、创建数据库4、删除数据库 二、集合的相关操作1、查看库中所有集合2、创建集合2.1、显示创建2.2、隐式创建 3、删除集合 三、文档的相关操作1、插入文档1.1、插入单条文档1.2、插入多条文档1.3、脚本方式 2、查询文档3、…

<Linux>权限管理|权限分类|权限设置|权限掩码|粘滞位

文章目录 Linux权限的概念Linux权限管理a. 文件访问者的分类b. 文件类型和访问权限c. 文件权限表示方法d. 文件权限的设置权限掩码file指令粘滞位 权限总结权限作业 Linux权限的概念 Linux下有两种用户:超级用户(root)和普通用户。 超级用户:可以在Lin…

【算法挨揍日记】day29——139. 单词拆分、467. 环绕字符串中唯一的子字符串

139. 单词拆分 139. 单词拆分 题目描述: 给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。 注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。 解题思路&am…
最新文章