人民网北京6月15日电 (记者董兆瑞)6月14日下午,作为2024北京智源大会主题论坛之一,“人工智能+数据新基建”主题论坛举行。论坛上,北京人工智能数据运营渠道正式对外发布。记者经过查询了解到,现在渠道已会聚超越700万亿字节的通用数据集和4.33万亿字节的职业数据集,为大模型职业开展供给数据支撑。
据介绍,北京人工智能数据运营渠道是在国家开展变革委、国家数据局指导下,由北京市开展变革委主导,在市委网信办、市科委、市经信局、海淀区政府、我国网络空间安全协会人工智能安全办理专委会等单位支撑下,由智源研究院牵头与京能数产等单位共建推进建立敞开型数据运营渠道。
数据渠道在完成数据的会聚办理、处理与加工等功用根底上,可供给多种模态的数据标示功用,支撑多种数据会聚和运用方式。现在渠道已会聚超越700万亿字节的通用数据集和4.33万亿字节的职业数据集,未来将不断扩大数据规划,为大模型职业开展供给坚实的数据支撑。
现在,数据运营渠道支撑“开源敞开”“积分同享”“数算一体”三种数据运营形式。“开源敞开”形式答使用户在恪守运用协议的前提下自在下载运用;“积分同享”形式面向数据工作组内的成员,根据数据奉献实施积分制,即成员单位奉献数据,依照计分规范获取相应积分,一起取得同享数据的权益;“数算一体”形式针对高价值数据,仅在渠道进步行数据加工、练习运用,确保数据不出安全域。
海淀区相关担任这个的人说,依托数据运营渠道,海淀区会同智源研究院等单位活跃推进政务、社会与企业数据敞开同享,打破数据孤岛。一起探究建造北京数据根底准则先行区,统筹布局算力与数据存储根底设施,为数据资源立异使用供给技能与准则保证。
人民日报社概略关于人民网报社招聘招聘英才广告服务协作加盟供稿服务数据服务网站声明网站律师信息维护联络咱们
人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用