微媒数字会议 首页 策划干货 行知云峰会:AI、自然语言、元宇宙、云原生,新科技将如何驱动产业变革? ...

行知云峰会:AI、自然语言、元宇宙、云原生,新科技将如何驱动产业变革? ...

发布时间 : 2021-8-22 08:21| 查看: 1829

摘要: 微软全球合伙人,微软亚洲互联网工程院副院长、首席科学家姜大昕表示,在人工智能领域,自然语言处理技术未必是最热门的,却是最前沿的那一类技术,被誉为人工智能皇冠上的明珠。近几年大数据、大算力和深度学习的浪 ...

微软全球合伙人,微软亚洲互联网工程院副院长、首席科学家姜大昕表示,在人工智能领域,自然语言处理技术未必是最热门的,却是最前沿的那一类技术,被誉为人工智能皇冠上的明珠。近几年大数据、大算力和深度学习的浪潮也带动了自然语言处理领域的快速发展。

2018年底,BERT模型横空出世,在阅读理解等多个任务的测试集上超越人类水平,成为自然语言处理领域的里程碑事件。具体来看,BERT模型将训练拆成两步,预训练加微调。预训练是用自监督的方法学习语言的特征表示,得出大规模预训练的语言模型,这个模型可以从大量的文本当中学到很多语法和语义知识,这些存储到模型参数当中。从预训练模型到训练出特定下游任务的模型,这一阶段被称之为模型的微调。

BERT模型问世之后,虽然预训练模型在不停的发展,微调的手段也有不同的变化,但是这样一个预训练加微调两阶段的训练方式成为当前自然语言处理的主流,被认为是自然语言处理的新的范式。

我们能够通过大规模的语言模型落地应用推动企业的数字化转型,在实践当中我们总结了业务服务层所要解决的三个挑战,首先是自然语言处理的任务非常多,种类非常多,算法也非常不一样,包括语法分析、语义分析、基础应用等。同时,训练自然语言处理的模型需要大量的标注数据,而这些标注数据代价往往是非常昂贵的。工业级的应用追求高质量的模型,高质量的模型就需要高质量的标注,标注质量越高意味着代价越昂贵。此外,如何根据领域数据的分布特点,如何灵活的加入领域知识来优化模型,也是一个难点。

为了应对这些挑战,我们制定了四步走的策略:预训练大规模语言模型;为不同的任务进行微调;针对不同的领域进一步进行微调;把大模型压缩变成小模型部署上线。

我认为有两个方向有希望在近几年取得突破:跨语言和多模态。前者已经实现了工业级的应用,如何在语料稀缺的小语言上扩展是当前的难点和研究方向;后者的发展比较迅速,学术界已经提出了多个流派,比如单流、双流、编码-解码不同的形式。多模态也碰到了一系列的挑战,比如说缺乏平行的训练数据,怎么生成长序列,怎么生成高清都序列等,这些都是需要将来解决的一些问题。

胡璇:元宇宙依旧缺乏某一种整体性共识

腾讯研究院数字内容研究中心副主任胡璇从价值、路径和挑战三个方面探讨了元宇宙:

元宇宙到底承载了我们对于未来、对于科技前沿的哪些想象?从价值层面来看,元宇宙给人原初和更高维的感受,避免了互联网带来的高度抽象化、断裂化;其次,元宇宙给了我们超越现有生活的自由。从现实层面来说,线下场景向线上迁移的趋势,走向成熟的科技工具和设备,使元宇宙成为了可能。

关于元宇宙的讨论,事实上依旧缺乏某一种整体性共识,大家对元宇宙没有一个特别清晰的概念和范围的限制。目前元宇宙大体分为三个方向:元宇宙由许多被用户创造的小世界构成;元宇宙是超大规模、沉浸式体感交互的虚拟世界;元宇宙不仅仅是一系列内容的组合,不仅仅是工具和平台,而应该形成一套协议、标准,将不同内容无缝衔接至虚拟世界中;有一套合理运行的经济体系,能够对每一个参与其中的人所产生的价值进行合理的估值和交易。

从元宇宙的实现路径上来说,有由实到虚,也有由虚到实的。目前在路径层面已经出现了一些概念,比如虚拟人的概念,是在新世界当中你我他的形象,做到高保真、智能化、工具化。再比如云游戏的概念,让我们能够分离庞大的数字内容运算和显示。从工具层面,游戏引擎能显著加速虚实融合的进程,它可以渲染、增加物理效果、采集动作制作动画。

然而当前元宇宙正面临的一些挑战,包括边界还不清晰,如何在元宇宙当中重新去思考我们的社交关系,以及如何判断优质内容、如何把控内容风险等多方面问题。

陈泽辉:拥抱云原生

云原生计算基金会(CNCF)亚太区负责人陈泽辉(Keith Chen)表示,云原生最基本的理念是希望用开源的方法和传统的微服务把应用进行细分,而后打包进一个相对应的容器中,通过动态的容器管理平台,实现极致的、最大化的使用。

目前,很多企业已经迈向云原生,主要是因为企业可以用更少的服务器支持更多的服务,提高资源的使用率;云原生颠覆了开发的速度和开发的情形,缩短了部署时间,为新功能快速推向市场赋予了可能性;允许多种云组合,实现无限扩展等。

云原生虽然是趋势,但现在很多企业还在考虑是否使用云原生,因为建立和使用容器有其挑战性。这些挑战性主要体现在三个方面:第一,云原生具备复杂性,有很多人还在看怎么样部署云原生,怎么样去认识,怎么样去使用,怎么去做容器化等;第二,云原生颠覆了整个开发的规划,从开发者的角度要改变整个开发的文化也是一个挑战;第三,越来越多的基于云原生安全的公司出来了,国内就有非常多这样的公司。

怎么样更加好的迈向云原生?我们需要创建一个面向服务的组织,应付不同的高弹性、高扩展性的场景。还要更改一下我们传统的基于功能的结构,更改成为可以围绕特定服务能力的团队。

陈祎溦:将AI算法注入内容领域,通过海量的数据进行训练后优化模型

火山引擎金融行业解决方案总监陈祎溦表示,不论是内容的创作,内容的理解和消化,又或是内容的分发和传播,都需要通过AI的方式来辅助。这其中,对于视频类和文字类的处理模式又并不相同。

视频类的内容是基于推荐算法做分发的,并不是出现在固定的位置,因此捕捉和分析都提升了难度。对于视频类文本内容的解析,实时性本身也是非常重要的一环,背后也需要用到比较强的一些技术。针对视频里面每一帧分析本身的故事、识别情绪,包括里面的一些人物、一些场景,这些都需要涉及到相关的AI算法。

具体到操作,会针对视频里面的各种场景去做一定的分析,最后得出相应的模板,把分析的结果打上一个标签。每个行业都有相应的应用,以针对金融企业的视频为例,可能属于政策事件、安全事故、违约事件等等。

在做分析和监测时,核心数据包括实时产生的信息流。结合交易所的公告,和第三方渠道合作的信息,来构成完整的信息源。对于财务报表,半年报,季报等等的PDF进行解析之后,利用NLP技术做一些语意分析。这里面涉及到对于文本里面的一些实体的提取,对于文本的情感的分析,以及对主题关键字做分类和索引。不论是模糊搜索、穿透式搜索、关联关系的分析,这些都是可以通过智能检索技术实现的。

推荐算法的商业化价值越来越高,所应用的场景也非常广泛,在电商、零售、内容消费、金融等各个领域都有深度的应用。推荐引擎可以为企业进一步提升竞争力,能够实现对于流量活跃度(用户停留时长,用户留存率)、销售贡献度的提升,也能够为企业降本增效,提升整体实力。同时,推荐算法实现了内容与广告业务的混排,在保证客户良好体验的前提下,也实现了企业的商业变现目的。





如果您有此类需求
欢迎咨询我们~
为你提供更多解决方案
长按识别二维码添加人工客服
备注“活动”
帮助你解决各种活动+互动难题
客服电话:0571-2822-1462
(工作日10:00-18:00)
  免责声明:本网站转载的文章、图片、音频视频文件等资料的版权归版权所有人所有,转载目的在于传递更多信息,并不代表本网站赞同其观点和对其真实性负责。原作者认为其作品不宜供大家浏览,或不应无偿使用,请及时与我们联系,以迅速采取措施,避免给双方造成不必要的损失。
文章ID:3132

相关阅读

热门文章

返回顶部