广播视频建设人工智能学习数据库

Photo of author

By Global Team

随着对人工智能(AI)学习用数据获取和利用的需求日益增加,广播视频内容将被构建为人工智能学习用数据。

科学技术信息通信部(部长:유상임,以下简称“科学技术通信部”)和韩国广播产业振兴协会(会长:홍범식)宣布,从6月5日(周四)至7月4日(周五),将征集“广播视频人工智能学习用数据构建项目”。

该项目将投入总计200亿韩元。科学技术通信部将选择包括广播公司、人工智能技术公司、数据加工公司、研究机构在内的四个联合体,并为每个联合体提供48亿3000万韩元的支持。

被选定的联合体需确保广播公司拥有的超过10000小时的视频。之后从所获得的视频中筛选出不存在版权和个人信息问题的画面,构建包括5000小时以上的人工智能学习数据。该数据包括人物的语气、表情、背景等多方面信息,并经过精炼和加工过程以供人工智能学习。

유상임 과학기술정보통신부 장관 (사진 = 과학기술정보통신부)
유상임 科学技术信息通信部部长(照片=科学技术信息通信部)

科学技术通信部将通过专业机构进行分阶段验证,以保证数据的质量。在数据构建过程中全面进行检查,并进行人工智能模型测试。联合体还需利用构建的数据开发可应用于广播内容制作及服务的人工智能技术。

科学技术通信部计划将构建的数据提供给“世界最佳大型语言模型(World Best LLM)”开发项目。部分数据也将对人工智能相关研究和教育开放。

基于广播视频的人工智能数据交易也将扩大。由于交易体系不完善等原因,广播视频人工智能数据交易一直未能活跃,但通过此次协议书,将公开广播视频人工智能学习用数据现状,制定数据交易标准,旨在促进数据交易。

科学技术通信部文艺振兴政策官강도성表示,“韩国广播公司在过去70年中积累的广播影像,由于包含了丰富的语言和行为,被评为培训韩国型人工智能模型的最佳数据”,并称“将积极支持国内广播视频内容被用作人工智能发展的核心元素——数据”。

Leave a Comment