查看原文
其他

除了聊天,AIGC现阶段在本土还能有哪些应用 | 沙龙现场

东西文娱 2023-10-23

The following article is from 共同虚拟 Author 共同虚拟



   闫楚文
百度移动生态商业市场负责人


百度AIGC布局

百度在人工智能领域已经摸爬滚打了10年,累计研发投入超过了1000亿,在这样压强式马拉松式的投入下,让百度在人工智能从芯片层、框架层、模型层、应用层都有了领先布局探索还有应用。

在芯片层,百度自主研发了中国第一款在互联网规模落地的通用云端AI芯片,百度昆仑芯,同时百度还拥有国内首个自主研发功能完备开源开放的产业级深度学习框架,百度飞桨,并由此支撑了飞桨文心大模型。在大家最熟悉的产品应用领域,百度也输出了如文字创作、语音合成、图画创作、视频生成、数字人等多种大众都可以快速上手的产品。

百度AIGC辅助营销生产内容案例

今年AIGC以1/10的成本被广泛应用在品牌代言、内容营销、企业应用服务上,AI生成的以客户和客户产品为主题的海报作品,可以在几分钟内生成。我们的数字人也可以凭借AIGC的能力为企业主持新品发布会,创作主题曲,为新品做评测等等。

文案助理:2022年,是百度数字人度晓晓参加了2022年高考一卷的作文,40秒写了40篇,曾经担任北京高考阅卷组组长的老师认为,度晓晓的作文紧扣主题,立意明确,结构完整,语言流畅,而且善于引经据典,使用修辞方法,给出的预估分数大概可以超过75%考生。同样在文字应用场景,百度AIGC可以在几秒时间内生成符合场景人物心情的完整歌词。

插画助理:去年12月我们百家号业务部门搞了一个 AIGC的创作大赛,其中有一个4岁的小女孩用我们的AIGC技术创作了一个绘本,去年年底山东人民出版社看到了绘本,叫《超能外星战队》,认为这个绘本价值在10万块钱以上,并且他们还愿意出版。另外,百度通过AI技术对分散两地的《富春山居图》进行“合璧”,得到了黄公望纪念馆负责人毛传镔的高度评价。

视频助理:国内首支AIGC MV《启航星》画面由文心一格根据歌词生成。它是一年过去一年在AI技术创新层面的一个代表,它不仅探索了数字人、AI生成等基本技术,更为MV制作AI音乐产业结合展现出了清晰的路径。




杨帅
中文在线 证投部副总经理 

中文在线业务介绍


中文在线的发展战略实施“夯实内容、服务产业、决胜IP”的发展战略,国内国际双轮驱动。我们手中有510万种数字内容,旗下有一主多元的原创内容生产平台,公司IP衍生业务以文学IP为核心,向下游延伸进行IP培育与衍生开发,通过对优质网文进行音频、中短剧、视频漫剧、动漫、影视、藏品以及文创周边等衍生形态的同步开发,升级IP衍生孵化链条。

内容行业的生产方式从最早的PGC到UGC,以及现在见到的AIGC,我们一直在行业里持续地推进和布局,甚至在一些细分上处于行业领先。

AIGC应用

公司已经上线3款AIGC的应用功能,第一个是AI主播,根据文字故事情节的真实语境,生动模拟音色以塑造角色,我们现在音频总共库存时长有45万小时,其中有相当一部分来自于AI主播的录制。AI主播确实对整个业务的产能提升特别明显,一台机器一天最多可录制500万字的有声书。

第二个,AI辅助创作,已在17K平台上线,目前可针对人物、物品等进行AI辅助创作,并针对不同的作品类别如古风、都市等进行语言调整,带来最佳的内容产出体验,大幅提升创作效率和内容的可读性。

第三、AI绘画,已在海外Chapters中应用。

公司也在研发推动更多AIGC产品落地,未来,随着技术的迭代更新,AI会在更多应用领域提升目前的内容生产方式。

中文在线AIGC合作:海量正版内容是核心竞争力

公司深耕文化数字产业20余年,自成立之初一直秉承“先授权、后传播”的原则,高度重视知识产权保护工作,已积累了海量的正版数字内容资源,旗下“17K小说”创建于2006年,是中宣部认定的“网络文学重点园地”。在AI时代,数据对于AI模型的意义重大,模型的产出内容高度依赖源头数据,公司拥有数字内容资源超510万种,网络原创驻站作者440余万名,可为AI模型提供海量数据用于训练,所以手中这些数据也是我们的核心竞争力。




董小


某游戏公司主策 

AI在游戏开发中起到的作用


游戏AI与广义的AI实际上有所不同,首先自游戏诞生以来,大部分的时候是给一个单元去实现人机交互,随着AlphaGo围棋战胜了柯洁李世石,开始教人类下棋的时候,游戏行业基本上也开始拥抱机器学纪元。游戏AI作为游戏规则的一部分产生了互动性,广义AI通过进步开始产生工具属性,通过中台化来辅助游戏开发维护与运营。

过去与现在——盘点此前AI在游戏行业的作用

自AlphaGo站起来到走入游戏行业的视野,从2016年到2022年上半年,我们把这段时间称为AI在游戏行业的“昨天”。

举几个非常常见的应用:对于有玩家对战需求的游戏,填充“假人”作为游戏成员;在绝大多数是起到“陪练”的作用。除此之外,AI可以在NLP服务进行维护多种语言出海游戏的聊天环境;第二是可以通过训练模型,模拟付费礼包的推送,类似于购物平台推荐广告;第三是为已有对话生成口型,然后通过口型生成匹配;还可以快速为游戏中生成三消等固定类型玩法的填充关卡,控制难度体验。但这些成果基本只能作为辅助工具,在有限的规则里帮助节省了重复性的或专项技能性质的劳动工作,但实质上没有进行创作。

目前,随着文生图成熟以及ChatGPT诞生,对于AI辅助启发创作有了新的可能。如Mid Journey等绘画工具,对于游戏开发的影响是创作赋能:可以赋能给没有绘画能力,甚至没有专业审美能力的“需求方”以快速画面沟通,而不再以“文档词汇”+“有限记忆参考图”为蓝本和美术沟通,并且在生成AI时自查提升。这样可以极大降低了沟通偏差,无论是初期探索还是需求流程都有着革命性改变。而对专业画师, Mid Journey通过算法和素材库,突破经验壁垒和想象瓶颈,可以将风格进行融合,像欧洲建筑风格一样,融汇出新,创作出大胆的结合,例如灵游坊CEO梁其伟就在微博发布了他利用AI创造的“水墨克苏鲁武侠”风格设定集。

ChatGPT则可以作为内容创作的工具,对于需要填充文本量的NPC以及内容故事是非常好的填坑神器。与此同时,API接入游戏甚至可以让NPC在给定世界观下和玩家自由对话互动。ChatGPT可以用来将关键词发散创作,如关键词联想画面描述等方法,再将其创作联想的画面代入文生图软甲,可以形成快速创作以启发作者。

未来——重新展望AI对游戏行业趋势影响

ChatGPT已经可以做到一定的规则生成,并提供代码,由此规则类游戏可以直接生成,根据指定主题,游玩诉求,AI生成美术素材,规则并完成实现,甚至可以一定程度替代并创作桌游。游戏创作的门槛极大降低,内容量的需求从量大管饱,到精品创新有趣的要求是必然的,而工艺上的差异在取得突破之前,会失去内卷的意义。我们完全可以期待未来有更多流程模块且更稳定的AIGC工具,届时对于游戏世界的构建权甚至可能掌握在玩家自己手里,就像每个人都能写作文讲故事画图画拍短视频一样,而游戏开发商则变成了内容海洋的爆款创作者,艺术品创作者。



马千里
无界AI联合创始人

AIGC作为生产力工具

谈到生产力方面,无界AI每天产生的AIGC内容是150万张图片,不到半年的时间我们就超过了全球最大的图库单日的上线量。而且,玩法上也发生了比较大的变化,我们广场图库展示界面,已经越来越像信息流(抖音、小红书)产品,你可以在我这里去刷各种各样的优质作品,并且所有的作品都是AIGC的创造,未来会有更多算法推荐和算法创造。

AIGC作为加密技术

AIGC是一种控制,你可以用prompt和seed得出唯一的图片,但是你不能逆推,你可以大概猜到他的prompt用了什么样的词,但是你也没办法完全猜到,这个seed是一个随机数,是神经网络初始化时的一串随机数,它是无法逆推的,这就意味着你掌握了seed你就掌握了资产,可能有web3或区块链行业从业经验的人就会想到一个东西叫比特币,你通过掌握公钥匙和私钥,你就可以掌握这个资产。

那么同样的所有的AIGC的资产,你只要掌握了它的seed,你就掌握了这个资产,因为你随时可以通过原模型复原它,而任何其他人可能只能 copy一下,但是没法实时生成他。

AIGC作为压缩技术

所有作品都具备非常强大的一个压缩属性,它可以压缩10万倍100万倍。那么假如说大家手机里存储的不是传统的照片,而是AIGC的照片,那么相当于说你的手机的存储容量可以增加10万倍,你的手机的传输速度可以增加10万倍,我需要图片的时候我再把它计算出来就可以了,AIGC可以用计算代替存储,说的哲学一点,就是可以用计算压缩时间和空间。

但是大家要注意这种压缩技术不是传统的压缩,它只适用于AIGC生成的内容,所以我们认为AIGC生成内容有非常强的优越性,它是这种计算代替存储的属性,可能会阴差阳错地会把元宇宙的一个问题解决掉:很多人说元宇宙未来需要大量规模的创造,也需要大量的存储和高速的传输,但是如果这个是AIGC生成的元宇宙,那么所有内容其实你看到的时候去生成,你不看到的时候它就是一个静态的文本,你看到的时候他去算力,他就用计算来去转他,用来存储它,用网络传输它。




张启煊

影眸科技CTO 

影眸科技介绍

影眸科技是上科大孵化的一家公司,我们成立于2020年,我们最重要的几个特点,第一个是我们会有很多学术上的产出,包括其实我们可能是国内最早跟进NeRF,还有其他生成式AI工作的团队。第二,国内第一个AIGC to c应用,至少在我们看来可能应该是我们推出的,然后当时也是一度登上过app store的榜首。然后我们其实最主要的方向一个是生成式AI,另一个是光场,我们用光场技术做了很多数字人相关的项目,然后现在也是把生成式AI技术和数字人技术进行融合。

元宇宙与数字人布局

影眸科技把数字人的成本分为两类,一类是资产成本,一类是应用成本,我们在两类上都进行了发力。

我们可以在3到5天内完成一个超显示数字的资产的制作,这个球现在在上海有两个,青岛我们跟东方影都合作也做了一个,北京在今年4月份我们应该也会有一个地方。然后第二个我们去年在计算机图形学会议SIGGRAPH Asia上发了一篇微表情及面部捕捉技术,这个技术当时也是跟今年在《阿凡达2》中最新的Weta的面部捕捉技术在同一个session中进行了大家分享,我们也做各种跨语言的音频驱动等。

在我们去年7月份开始商业化陆陆续续也参与了20多个数字人项目的制作,但是刚刚所讲的那些数字人制作,本质上都是为了帮我们自己去构建一个超写实数字人的数据集,到目前为止我们一共有1000多个产品级的数字人。

有关AIGC的尝试

AIGC这个词它更加贴切的表述其实应该是生成式AI,因为AIGC会让人觉得它是跟UGC、PGC是有一个递进的关系,但其实在整个创作过程中起最主要作用的还是人,是人去决定了prompt,人去调试了prompt,人去调试了Seed。

我们现在可以根据一句话去生成3D数字人,但是如果你真的让我去想75个人或者100个人的长相,我自己脑子里是组装不出这些prompt的,所以我们会需要像当初计算机用命令行时代过渡到GUI时代的一个过渡,由人简单地去直接想prompt变到一个prompt user interface的过渡。

我们3月底会出现一个叫hyperhuman的文本生成数字人的demo,然后在今年7月份的时候我们会上线正式版本,它会包括完整的面部捕捉绑定驱动、音频驱动,还有人机交互都在里面。



张炯
星图比特创始人


星图比特介绍

星图比特的主要业务是智能数字资产内容管理,核心技术是Web3.0和AIGC的融合。星图比特在AIGC领域主要提供各类模型算法和相关训练服务,支持本地化部署,帮助企业端和个人端的用户去提高内容创作的生产力和管理能力。目前基于国内合规性的要求,更多为是B端的客户和合作伙伴提供服务。

星图比特目前两个股东,一个是产业端背景的风雨筑,另外一个是学术端的树图区块链研究院。我们公司主要的团队应该算是全球最早的人工智能科班出身,公司的标签就是数字资产、Web3.0、NFT、AIGC还有数字人民币。

我们比较坚持的一点,是在国内提供合规的真Web3.0服务。另外,因为我们办公室在微软加速器,所以也是国内比较早的开始接触到OPEN AI模型算法的公司。

产品及服务

我们的核心产品是一个SaaS产品,灵境数字资产管理云,整个产品在逐步实现低代码的部署,像快速搭建、多端部署、模块化的扩展已经完全实现,并且已经通过华为云的认证,企业用户可以在华为云市场搜索和购买星图比特的Web3.0服务。

在AI领域,然后目前我们主要为企业端去提供的定向模型优化服务,基于我们自己训练的一些模型,也有已经开源的模型,根据企业客户的业务,提供包括:需求收集、数据收集、模型训练、模型评估、模型落地、业务监控等一站式服务。并且训练完的模型和生成的数字内容都可以通过星图比特的灵境数字资产管理云很好的管理起来。




周昊
ObEN合伙人


AIGC应用现状

AI从它的整个模式来讲,是在从一个分析型AI朝生成式AI发展。原来的工作方式是通过数据指针从已有的数据库里面去拿出来数据,这个时候机器它只做了机械性的分析和认知工作。生成式AI在此之上更进一步,通过更好的模型算法能做到举一反三,智慧生产,智能交互。

其实越往后的话,AIGC内容创作平台日活流量最大的考验,除了模型外,还是比的算力,包括训练和应用在内都需要有强大算力的支持,最后会归结到基础建设能力的问题。

目前通过ChatGPT可以生成一些数据和产品形态用以提升用户粘性和提升数据模型性能,但在版权、信任、安全和成本方面,ChatGPT仍然有一些有待解决的Concern。用户和企业在接受Chatgpt服务的时候,也是被反向学习的过程,对于不同的行业,需要关注信息数据的安全。

ObEN的AIGC布局

ObEN自2019年进入中国市场,制作过央视4位主持人,打开中国超写实数字人在应用端领域的应用。目前可以通过AIGC和人像模型引擎,直接生成从卡通到超写实的人像的3D,适用于UE、Unity、WebGL等元宇宙空间对3D模型资产的调用,另外也可适配动作及声音的驱动模式。

我们的AIGC平台完全基于自主开发,从2019年开始做AIGC模型,100%的自主知识产权。系统在定制化和灵活性方面很有特色,算力消耗更少,在同业中数据表现出色。

应用层面,未来对出版业,报业,视频媒体、艺术机构、游戏、设计和工业应用等领域,在企业场景、个人用户,或者是链上均可以提供服务。对于Web3数字市场,AIGC也有很多的行业机会。



Hello!
我们在为更加闭环、更加高效的服务模式做准备
欢迎加入限定白名单
与我们一起探索






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存