(资料图片)
8月8日消息,近日,快手高级副总裁、研发线负责人于冰表示,AI大模型作为当下最重要的革命性技术,进入爆发期,有望开启AGI时代,而多模态内容生成与理解是其核心能力。
于冰认为,当前,多模态AI大模型因其在文本、代码、图像和视频等多种内容上突出的生成与理解能力,有望为视频生产、理解、分发、消费等全链路打开新的技术视角,突破传统音视频编码的技术天花板,突破基于用户行为的搜广推算法的传统思路,将视频内容创作从PGC、UGC带动进入AIGC时代,创造AI大模型驱动的视频内容创作工具,激发创作者的创意空间,高效率、低成本地生产高质量的视频内容。
而短视频、直播作为最典型的多模态媒介,快手也抓住平台基因,在AI大模型领域重度投入,全方位探索技术突破。于冰介绍,目前,快手在AI大模型的布局体系分为三个层级:基于具备高性能、高并发、高算力的“大基建”,构建快手多模态的AI“大模型”,进而在搜广推、内容创作、用户增长、研发效能等领域内打造“大应用”。
他提到,在多模态 AI大模型的加持下, AI技术和工具可全方位地赋能影视创作者,助其在创作、拍摄、后期等各阶段激发创意、提升效率和内容质量,影视制作的周期也能大幅提高,过去花费数年拍摄的大片有望数月完成。
快手自2011年成立至今,回顾过往经历,于冰表示,业务发展会经历入局、成长、成熟等多个阶段,在业务发展的不同阶段,快手所采取的研发策略也各有侧重。创新成长期更注重持续投入,探索新产品、新周期;而成熟阶段则需聚焦优化效率,兼顾体验,既保证产品体验的竞争力,又保证业务的稳健成长。
于冰以快手音视频业务为例,目前该业务已步入成熟期,研发策略重点也转移至提升效率、优化成本,追求单位成本下算力、存储和网络使用效率的提升。快手基于自研视频质量评估KVQ、视频增强修复KEP和KRP、视频压缩编码算法KVC等一系列核心技术,形成数据驱动的视频处理闭环,在兼顾体验的同时极致压缩视频。
2022年,快手技术toB业务StreamLake推出了首款自研智能视频处理芯片SL200,该芯片集成了快手领先的视频编解码、图像处理、AI推理、内容自适应编码等关键技术,具备高质量、高密度、智能化的特点。目前,SL200芯片已全面应用于快手的直播和短视频业务,实现成熟技术通过StreamLake对产业赋能。
而在数字人领域,于冰介绍,快手全链路自研了光场扫描重建、超写实人像建模、智能绑定、动作捕捉与驱动、物理仿真等数字人核心技术,推出「快手虚拟演播助手(KVS)」和「快手智播」两大解决方案。未来,结合智能编曲、图像/视频生成、LLM等AI能力,快手数字人技术将继续在文旅、教育、游戏、直播电商等领域广泛应用,助力客户打造高品质低成本的3D和2D数字人。(一橙)
关键词:
相关文章
-
快手于冰:抓住平台基因,在AI大模型领域重度投入
-
五款性价比新机已在路上:百瓦快充、独显芯片、金属中框都要来了
-
7月市场整体平淡,政策宽松信号不断
-
邮政快递慢是啥原因(邮政快递慢)
-
“走,我们回家”——北京丰沙铁路线最后一批滞留旅客转运见闻
-
余英:房地产转型最大的蛋糕,是已有物业的盘活和服务 | 博鳌快讯
-
土拍!永得隆地产1.16亿竞得连江21.97亩住宅用地
-
打好安全生产翻身仗丨湘阴:打击取缔流窜非法生产烟花爆竹,7人
-
组图 | 美食+比赛!文昌星光市集为海南“村VA”聚人气
-
海南医疗救助信息平台“海惠帮”正式上线!附申请流程→
-
起售价23.98万元,广汽本田新款冠道正式上市,内饰充满惊喜
-
传 iPhone 15 Pro 最高 2TB 容量,微信大面积开放「朋友圈置顶」功能
-
美股异动 | 美国最大点评网站Yelp(YELP.US)涨超6.7% Q2收入3.
-
北京自来水变凉了?北京市自来水集团回应竟与密云水库有关 具体
-
男篮22分吊打日本,撕下陈磊最后遮羞布,输中国台北败因就在他这
-
人参归脾丸和归脾丸的区别和功效_人参归脾丸和归脾丸的区别
-
rado是什么牌子 rado是什么牌子的表值多少钱
-
同比和环比的区别计算_同比和环比的区别
-
暗黑破坏神41.1.1野蛮人双重横扫BD介绍
-
小夜灯开一晚上耗电吗(小夜灯的好处和危害)