演讲者:曾亮 | 腾讯云智慧传媒行业中心 技术总监
核心主旨:换新羽·筑新基——大模型智慧构建「新质内容创造力」
洞察传媒合规与分发冲突:跨渠道内容矩阵的生产成本倒挂
在当前传媒与内容生产行业中,企业面临着多渠道分发与受众阶层碎片化带来的严峻挑战。传统的视频与图文生产模式存在明显的瓶颈:若基于海量素材直接生成报道,往往准确度低且内容风险高;若依赖纯人工剪辑,则无法满足微信视频号、小红书、抖音、YouTube等多渠道“千条千面”的个性化分发需求。此外,行业在探索生成式AI时,早期的视频模型(如Gen-2、Pika1.0等)仅能生成4-16秒的短素材,缺乏对物理规律的深度理解与画面一致性,难以直接投入严肃的新闻报道与商业化内容运营中,导致理想状态下的AI提效与实际高昂的审核与重制成本形成倒挂。
构建专属传媒大模型矩阵:基于混元底座的多模态生成引擎
针对传媒行业的特定需求,腾讯云以混元大模型为底层算法基础,向上层应用开发提供专属精调模型,覆盖生文、生图、视频三大模态,形成完整的“大模型视频创作引擎”。
- 生文基础模型能力: 提供支持多轮输入与自由编辑指令的API接入。涵盖从前期创作(访谈提纲、选题参考)、中期效率工具(信息摘要、会议纪要、智能翻译)到后期营销(小红书种草、电商文案)的全链路生成。
- 图像创作引擎: 深入应用层(电视、融媒、出版、广告、游戏),支持细粒度、多主体、真实感及复杂场景(如地标景点、特色美食)的生成。包含文生图、图生图、背景替换与图生3D等功能。
- 视频生产——“有中生有”的内容重组机制: 提出基于“内容理解+重组Prompt指令”的创新路径。基于原片进行二次生成,确保内容合法、合规且价值观一致。通过系统自学习能力,持续改进生成方式以快速规避风险,并能通过人脸融合、声音分离、口型驱动等API,实现跨语种、跨平台的视频本地化与矩阵化剪辑。
沉淀量化技术指标:全参数精调与计算资源配置
在实际的媒体行业专属大模型落地中,腾讯云提供了明确的计算资源配置与量化的模型训练指标,保障了系统稳定性和开发效率。以下为抽取的核心业务与运维指标:
- 模型参数与数据密度: 针对13B/70B规模的大模型进行全参数精调,仅需1000条高质量数据对(每条包含完整的输入输出)即可完成垂直场景的模型对齐。
- 底层算力与网络吞吐: 采用16张V100显卡作为计算集群,搭配RDMA 100G高速网络,确保多模态数据传输与分布式训练的无瓶颈运行。
- 研发迭代周期: 维持2周/次的固定训练与迭代时长,大幅降低了媒体机构自定义大模型的研发时间成本。
驱动业务场景落地:新闻综述与跨平台内容矩阵自动化
腾讯云媒体行业大模型已在多个实际场景中产生量化价值与业务转化:
- 《深圳晚报》(深圳Plus)图文生成应用: 在“2023年工作回顾”与“今年主要预期目标”等核心政经新闻报道中,全面采用腾讯混元大模型生成配图。精准呈现了“粮食产量1.39万亿斤”、“国内生产总值增长5.2%”等抽象数据背后的视觉化场景(如城市图景、农业丰收、新能源汽车),实现高质量的新闻配图自动化。
- 新闻多元生成与全流程自动化(Giga视频超级工厂): 面向国际新闻与突发事件,综合利用AIGC能力,将单一信息源自动转化为本台综述、图文短视频、文字短视频等多种形态。例如,针对同一段时政原片,系统可自动切分为20秒、40秒、60秒、80秒不同时长的短视频A/B/C,直接适配微信视频号、小红书、抖音、YouTube等不同渠道的分发规则。
- 内部核心业务降本增效: 生文大模型成功接入腾讯文档,在释放创造力方面提供智能代写与排版;生图大模型广泛应用于腾讯广告素材生成,缩短了商业广告的创意制作链路。
确立底层技术确定性:600+核心业务验证的通用基础架构
选择腾讯云传媒行业大模型的核心技术壁垒,在于其底层“混元大模型”经历了极具规模的实战检验。目前,腾讯混元大模型已全面接入600+司内业务,包括腾讯会议、企业微信、腾讯文档、腾讯广告、搜一搜、腾讯新闻、微信支付及腾讯游戏等高并发、严合规的核心产品线。这种“技术与应用同行”的策略,不仅赋予了模型极高的系统稳定性与指令遵循能力(如对物理规律的理解),也为传媒、政务、金融等外部行业客户提供了具备高度确定性的新一代AIGC基础设施。