当前位置:
新闻发布 > 工作动态
各区动态 | 西青区8个数据集入选天津市第一批行业高质量数据集
来源:“西青发改委”微信公众号
发布时间:2024-06-28 18:00:00
字体+
字体-
高质量数据集是人工智能模型训练、推理和验证的关键基础,是按照特定标准,依次开展数据采集、数据清洗、数据归类和数据标注等智能化处理,并具备更新和维护机制的数据集合。为促进数据要素价值全面释放,加强算力、算法、数据一体化应用,推动西青区数据集高质量发展,按照市数据局相关工作要求,区发展改革委聚焦12个行业领域和其他重点行业领域,组织开展了第一批行业高质量数据集征集工作。
其中,天津理工大学提供的中国手语多模态数据集通过“海河.尔语”聋人手语理解大模型搭建了高质量大规模手语数据训练资源平台,规模全球最大,包含上百万RGB视频、深度信息、多角度传感数据、骨架坐标等多模态数据,符合国家通用手语标准,可为智能手语翻译模型提供训练和测试数据。该项目的研发推动了我国无障碍事业高质量发展,全面提升人民生活幸福感。
天津市极客网联产业服务有限公司(区属国有企业永泰恒基有限公司全资子公司)提供的智能网联数据集等6个数据集初步构建了先导区车联网运营场景体系;下一步计划建设车联网大数据交易体系,构建智能汽车行业企业资源池,收集自动驾驶数据技术痛点与同性,筛选特色有效场景下高质量数据,规范数据存储转换应用格式,加快数据要素在智能汽车行业研发过程中的低成本流通和价值转换,深挖数据运营与服务方面的价值。
下一步,区发展改革委将依托产业经济优势,持续培育扶持行业企业健康发展,积极配合市级部门做好后续数据集征集工作,营造良好的营商环境,加快行业高质量数据集发展,催生新产业、新模式。