冰山數據

案例

HOME > Cases

image&LiDAR

图像&LiDAR案例

全景语义分割示例图
在冰山标注平台进行3D点云数据标注

图像&Lidar标注项目需要结合技术能力、项目管理能力和大规模的标注资源共同协作,以快速交付高质量的标注数据。

冰山數據通过多年项目经验和专为计算机视觉开发的标注平台长期服务于多家互联网、人工智能和自动驾驶技术公司。

某自动驾驶公司

该公司是知名的自动驾驶技术公司,致力于基于车路协同的自动驾驶技术加速自动驾驶汽车落地。

在冰山标注平台进行3D点云数据标注
点云连续帧标注

挑战

连续帧点云标注是一项十分耗费时间的工作,且在目标较多时很容易造成漏标,客户内部团队无法通过普通的数据标注工具完成项目。

解决方案

冰山标注平台的连续帧标注工具支持多个辅助标注功能,如包围框自动贴合,连续帧自动补间等操作加速数据标注。

成就

通过高质量和高效率的交付,冰山數據成为该客户长期供应商之一,每月稳定交付大量数据。

某汽车制造商

该公司是世界知名的汽车制造商,2022年销量超过180万台,并借助辅助驾驶技术提升驾驶者体验。

可行驶区域标注

挑战

客户需要针对多种场景进行可行驶区域标注,并且随着算法准确率要求提高,需要标注的数据量呈指数级增长,客户难以借助线下标注工具和内部团队完成这项工作。

解决方案

冰山通过全球供应链筛选优质数据标注团队并进行培训和考核,可灵活和快速地扩充标注规模。

借助冰山标注平台的自动化工作流,使数十人标注规模的数据流转十分有序,且得到质量保证。

成就

冰山數據是该部门的独家数据标注供应商,目前已成功交付应用于多个场景的数据标注项目。

所有通过训练的模型都在其应用领域有着卓越的表现,大部分已经投入使用,在表现不足的模型上正在标注更多数据。

某汽车制造商

泊车位标注

挑战

泊车位识别是自动泊车技术中的重要环节,人工智能系统需要识别停车场的停车位置和限位杆以保证车辆停泊到准确的位置,在数据标注过程中,需要大量训练有素的标注员进行工作。

解决方案

冰山通过全球供应链筛选优质数据标注团队并进行培训和考核,可灵活和快速地扩充标注规模。

借助冰山标注平台的自动化工作流,使数十人标注规模的数据流转十分有序,且得到质量保证。

成就

冰山數據是该部门的独家数据标注供应商,目前已成功交付应用于多个场景的数据标注项目。

所有通过训练的模型都在其应用领域有着卓越的表现,大部分已经投入使用,在表现不足的模型上正在标注更多数据。

某高精地图公司

该公司是一家高精地图服务商,主要关注停车场景。其在国内上万个停车场采集了图像数据,向自动驾驶汽车提供自动泊车能力。

停车位检测

挑战

客户内部使用线下标注工具难以满足标注需求,且质量管理较为困难。

1.停车场环境大多数较为昏暗,无法看清目标。

2.全景分割的目标边缘难以实现完美贴合,对数据质量有影响。

解决方案

冰山标注平台可实时调整图像亮度和对比度,且使用平台提供的多边形共用边界功能可完美贴合多物体边界。

成就

冰山數據是该公司的独家数据标注供应商,目前已成功交付应用于多个检测功能的数据标注项目。

所有通过训练的模型都在其应用领域有着卓越的表现,大部分已经投入使用,在表现不足的模型上正在标注更多数据。

某自动驾驶公司

该公司专注于自动驾驶系统自主研发,提供高可靠性、高品质的全栈式自动驾驶解决方案,是国内领先的自动驾驶Tier1供应商。

立体框标注

挑战

在2D图片上对不同场景的行人、机动车、障碍物标注立体框(Cuboid annotation),需要较为丰富的自动驾驶标注经验和空间想象能力,且面对数据断档周期,客户难以长期培养合格的内部标注员。

解决方案

我们的项目组从资源网络中筛选20位有立体框标注经验的标注专家,通过培训流程、考试和小批量交付与客户对齐规范,有效地使项目大规模运转。

成就

通过高质量和高效率的交付,冰山數據成为该客户长期供应商之一,每月稳定交付大量数据。

某海外美颜相机APP

该公司是一家集开发与运营于一体,致力于移动端视频图像处理产品研发的互联网企业,旗下摄影App在海外拥有超高下载量。

人脸分割

挑战

1.该项目需要对人脸图像进行细致地分割标注,因涉及图层叠加,导致容易发生层级错误。

2.由于图像是镜像呈现的,很容易对左眼,右眼和左耳,右耳产生错误判断。

解决方案

项目组对项目易错点进行了梳理,制定了易错点check list,验收人员严格按check list逐项检查,成功地完成了高质量交付。

成就

冰山數據持续为该公司提供人脸和人体分割标注,帮助其提升摄影App的识别准确率。我们调动了20位标注专家长期为其交付数据,质量和速度是其考虑与冰山合作的主要因素,我们稳定每周交付5000帧数据,这是客户内部团队所难以支持的。

某AI内容审核公司

该公司是一家智能分析决策服务商,主要关注金融和内容安全领域,旗下的AI内容审核技术帮助检测违规内容,

商品LOGO目标检测

挑战

客户提供1000个品牌的电商、广告、室外等场景图片,不同的品牌包含不同的10-20种标签,无法进行统一管理和培训,数据需要在2个月内完成交付,对项目管理的经验和能力形成极大挑战。

解决方案

项目组详细地对1000个品牌标签进行梳理,针对共同点进行统一培训。在标注细节方面,对每个品牌制作了文档,通过协同表格与我们肯尼亚标注专家进行协作,成功地在2个月内交付项目。

成就

通过高质量和高效率的交付,冰山數據成为该客户唯一数据供应商,持续在网络内容安全场景数据标注合作。

某医学AI公司

该公司是一家医学AI公司,致力于用AI实现智能诊断,为患者提供快速的精准的医学判断。

X光标注

挑战

医学影像不像常见的图片那么直观,需要一定的医学知识才能胜任标注工作。

解决方案

冰山项目组从全球资源中通过培训考核筛选出能够胜任医学标注的人员。

成就

冰山數據是该公司的独家数据标注供应商,目前已成功交付应用于多个医学检测功能的数据标注项目。

所有通过训练的模型都在其应用领域有着卓越的表现,大部分已经投入使用,在表现不足的模型上正在标注更多数据。

某创意内容AI公司

该公司提供从内容生产到内容流转的一站式服务,帮助品牌搭建内容中台,升级内容战略,驱动品牌智能化增长。

视频素材标注

挑战

1.该项目需要标注人员对于内容创意有一定程度的理解。

2.随着客户产生的创意内容增多,标签也随之越来越丰富,需要标注人员随时关注新的标签库并正确理解。

解决方案

冰山项目组从众包资源中筛选出适合该项目并通过初步考核的标注员,项目经理全程跟进并实时对标注结果进行质检。

当有客户通知有新的标签产生时,我方会及时对标注团队进行培训和考核,保证对新的标签理解正确。

成就

冰山數據是该公司的独家数据标注供应商,目前已成功交付应用于多个内容素材创意的数据标注项目。

某智能光学检测公司

该公司国内首家软硬件结合并拥有自主知识产权的光学检测设备制造商。宜美智自成立以来一直致力于半导体、PCB及IC基板领域的光学技术及机器视觉的智能研发,其具有自主知识产权的尖端图像处理系统享誉全球。

缺陷检测标注

挑战

1.该项目需要标注人员对于缺陷类别有较强程度的理解。

2.标注团队需要查看真实图像和原始设计图来对比找出缺陷,线下工具难以实现。

解决方案

冰山项目组从众多资源中筛选出适合该项目并通过初步考核的标注员,项目经理全程跟进并实时对标注结果进行质检。

冰山标注平台支持实时显示原始图片和对比图,有效提高标注效率和标注质量。

成就

冰山數據是该公司的最大标注供应商,目前已成功交付数百万张各类缺陷检测标注数据集。

某智能家装公司

该公司是国美旗下智能家居装修生态平台,冰山數據独家提供装修场景图像标注。

某OCR服务公司

该公司是知名的OCR技术公司,冰山數據长期提供各类票据OCR标注服务。

某生命科学公司

该公司致力于成为一流的家庭智能健康服务平台运营商,冰山數據长期提供健康检测标注服务。

某卫星导航公司

该公司专注于惯性导航、卫星导航、机器视觉、激光识别等多传感器与人工智能融合产品,冰山數據长期提供各类工业场景标注服务。

audio&multilingual

语音&多语言案例

语音标注-ASR转写

多语言语音和OCR识别技术常常受限于无法快速获得训练数据集,冰山數據依托全球资源优势,不仅在国内拥有众多资源,在全世界大多数国家也同样用有大规模的采集和标注人力。

通过母语者标注专家标注高质量的语音和OCR训练数据。

某互联网公司

英语ASR转写

挑战

该项目需要在3个月内完成2000小时语音转写标注,在当时国内COVID-19爆发,大多数国内供应商难以调动人力。

解决方案

项目组及时地调用印度供应商50名英文标注专家组成标注和质检小组,顺利地在3个月内完成了项目交付。

成就

冰山數據此次项目赢得客户高度认可,后续在阿拉伯语,印地语等小语种方面持续合作。

某语音技术公司

该公司是亚太地区知名的智能语音和人工智能上市企业,致力于让机器能听会说,能理解会思考,用人工智能建设美好世界。

阿拉伯&印地语OCR采集标注

挑战

客户需要有海外采集能力的公司提供数据采集,并提供快速,高质量的OCR转写服务。

解决方案

我们通过多年全球供应链的建设快速在埃及和印度调用众包人力进行广告牌、招牌、标语、海报等类型的图像采集。在标注环节中,我们通过与海外供应商合作,调用50名母语者标注人员进行长期标注,北京项目组调用外国语学习者组成验收小组对质量进行实时管理。

成就

冰山數據成为该客户内部有良好口碑的多语言供应商,目前除了阿拉伯和印地语以外,还提供蒙语,俄语等小语种的以及国内各种方言的语音采集和转写服务。

natural language

自然语言

文本标注-实体提取

为自然语言理解构建AI模型必然要面对频繁发生的变化,由于每个领域的垂直方向较多,在处理这方面训练数据时总是难以找到多名标注专家进行大规模进行标注。

冰山數據通过多年数据标注经验,通过多年积累的众包资源可快速匹配垂直领域标注专家。

某搜索引擎巨头

该公司是国内知名搜索引擎巨头,其APP月活达到6.2亿人,搜索量巨大,该公司不断通过提升AI技术优化用户搜索体验。

多轮问答标注工具-3
类ChatGPT应用多轮对话标注

挑战

该公司当时正紧急开发类ChatGPT应用,该公司NLP团队需要大量训练有素的文本类标注员对海量语料数据进行标注和纠正,短时间内难以培训出数百人标注人员,并保障数据质量可信。

解决方案

我们通过常年积累的标注资源和深度打磨的培训和质检流程,确保每一位标注员深入理解该应用的用途和背后所使用的技术,且清晰了解标注规则,在短时间内可拓展合格的标注员上百人。

成就

冰山數據的专业性、高质量和高效率获得客户高度认可,持续提供针对该应用的文本标注服务。

某古玩电商平台

该公司是国内领先的文玩艺术品电商平台。开创了文玩艺术品直播竞拍全新商业模式,实现了文玩竞拍行业线上化。

古董文玩实体标注

挑战

该项目涉及各种古董文玩专业知识,需要至少有相关经验和兴趣的人员进行标注

解决方案

我们与高校的古玩专业建立合作,培训和筛选10名合格的标注人员长期为客户提供标注。

成就

冰山數據的专业性获得客户高度认可,持续提供古董文玩和智慧电商相关的标注服务。

某自然语言技术公司

该公司是领先的人工智能公司和AI数字员工提供商,主攻深度学习和自然语言处理,提供智能语义、语音和视觉的AI全栈服务。

相似问扩写

挑战

该项目需要对客户提供的原始问句进行泛化编写,每个原始问句至少泛化30条相似问,需要极高的语言泛化能力。

解决方案

项目组通过合作院校语言系调用学生、培训和筛选了5名合格的标注专家长期提供编写服务。

成就

冰山數據每周稳定每周提供10000句相似问,一次通过率为98%,得到客户高度认可。

某中东出海电商平台

该公司是出海沙特的知名电商平台,覆盖沙特阿拉伯、阿联酋、科威特、卡塔尔、阿曼、巴林和中东等地区。

搜索相关度评测

挑战

该项目需要有长期电商购物经验的阿拉伯母语者进行评测,国内几乎无法找到匹配的标注人员。

解决方案

项目组从埃及标注基地调用10名符合要求的标注人员通过了客户的测试,并长期提供评测服务。

成就

冰山數據的资源调度能力赢得客户认可,持续在电商图片,意图标注等领域持续合作。