采购
产品
供应
企业
大模型与AI标注工具帮助电商平台文字生成标注、图上文案抠图、AI视频打标,商品素材生成效率较人工提升千倍,内容制作成本降低超30%,破解了电商行业商品识别效率低、仓储分拣自动化不足、个性化推荐精准度差等痛点……
在人工智能产业风起云涌之际,数据标注产业也乘风起航,不断加速创新发展。
数据标注产业进入快速发展期
数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。
去年年末,国家发展改革委等部门发布《关于促进数据标注产业高质量发展的实施意见》,提出到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
目前,我国已建成四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同7个数据标注基地,7个数据标注基地数据标注总规模达到17282TB,形成医疗、工业、教育等行业的高质量数据集335个,赋能121个国产人工智能大模型研发,引进和培育标注企业223家,标注从业人员达5.8万人,带动数据标注行业相关产值超过83亿元。
日前在2025数据安全发展大会上发布的《2025高质量数据集研究报告》显示,随着人工智能、大模型技术迭代,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、规范化发展新阶段。
数据标注产业赋能效应显现
近日,国家数据局发布了一批数据标注优秀案例集,从助力人工智能、低空经济等新兴产业加快发展,到推动油气勘探、矿山巡检智能化转型,再到赋能基层治理和信息无障碍建设,数据标注产业正加速赋能千行百业转型发展。
为解决传统标注精度低、效率低、成本高、复杂目标识别难等问题,无人机影像数据标注采用深度学习算法、3D点云等标注技术,有效提升无人机数据标注的准确性、一致性与可用性,目前已用于近20个低空经济场景,年均标注数据近1万条,标注效率提升90%,成本下降60%,有效推动低空数据产业高质量发展。
针对矿山行业数据标注标准缺失、多模态数据标注成本高、海量数据价值释放困难等困境,通过构建矿山行业知识标签体系、多模态数据生成算法与合规校验模型等,实现标注效率提升30%,跨模态语义一致性提升20%,高质量数据复用率提升50%,将行业人工智能应用研发周期由3个月缩短至3周,赋能矿山行业实现高质量发展。
通过对各级各类诉求渠道数据的归口化管理,引入“数据清洗车间”“因果森林”等技术,解决传统数据标注效率低、精准性差等问题。打造人机协同的训练体系,日均处理数据6万余条,标注准确率达90%以上,人力成本降低30%,提升了基层治理的效率。
智能数据标注成为产业发展未来方向
人工智能作为新一轮科技革命和产业革命的核心驱动力,具有强大的“头雁”效应,而高质量的数据集是人工智能发展的基石,数据标注则是构建高质量数据集的关键环节。
近年来,随着人工智能技术的飞速发展,数据标注的需求也在不断增长,从图像到文本,从语音到视频,数据标注的类型和任务划分日益多样化,对数据标注的质量和规模的要求也不断提升。与此同时,数据存量小产量低、数据集质量良莠不齐、缺乏主流高价值数据引领、数据利用效率低等问题仍然存在。
日前,由清华大学数字政府与治理研究院联合江苏省数字化协会发布的《智能数据标注产业发展观察报告》(以下简称“报告”)指出,数据标注产业涵盖了从数据采集、标注到应用的全过程,数据标注是人工智能模型训练的基础,数据标注产业不仅关乎人工智能技术的进步,更对数字经济、产业升级乃至社会生活的智能化转型具有深远意义。
数据标注产业通过标准化的数据处理流程,将原始数据转换为可供机器学习的高质量训练数据,其核心参与者包括数据标注企业、专业技术团队以及经过系统培训的标注人员,而人工智能技术的快速发展,让数据标注产业逐步从劳动密集型向技术密集型转型,人工标注与人工智能标注正在深度融合。
报告指出,随着人工智能技术的不断发展,智能标注将成为未来数据标注产业的重要发展方向。它不仅能够满足大模型数据标注的需求,还能为复杂的人工智能模型提供高质量的数据支持,推动人工智能技术在各个领域的广泛应用和深度发展。
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,如有侵权,请与本站联系删除。