服务场景

图文识别

依托OCR技术,将图片上的文字内容,智能识别为结构化的文本,大幅提升信息处理效率。可应用于证件识别、票据识别、定制模板识别、通用表格文字识别等场景,识别出图片或复印件中的文字,转化生成为可编辑的文本。

联系销售

应用场景

1.小语种多场景OCR转写
提供标语、广告牌、菜单、商品包装、文档等十余类日常场景下,小语种图像采集与OCR转写一体化服务。应用 AI 辅助,自动识别图像内容并转写成文本。当前小语种图像采集与转写难点在于:较多生活场景被英语同化;意大利语和葡萄牙语的书写顺序不固定,需人为判断;小语种含各类特殊字符如À,转写难度大;市面上小语种供应商少,且标注结果参差不齐。星尘提供含小语种票据、店铺名称、指示牌、菜单等大量数据资源,满足各类场景下的数据需求;应用成熟的多语种OCR算法,自动识别文本下边界点位置,辅助提升标注效率和数据质量;规范标注规则,输出优质结构化数据,帮助客户优化西语系预处理算法,提升图文识别模型成熟度和准确率。
门上方的字为英文,在意大利,有多处场景会使用英文
需标注出下边界点位置
小众语言,特殊字体
2.各类票据信息OCR转写
发票、资金划拨单、银行汇票、本票、支票等各类票据信息结构化提取。由于票据的印章字体成弧形、打印墨痕不清晰、中英文符号掺杂、文字重叠、横竖排版混乱、图像光线昏暗等问题,票据的结构化信息提取较普通OCR转写难度更大。星尘应用准确率99%+的多边形OCR算法,适应弧形图文识别场景;成熟的标注工具极高效的帮助标注员解决各类“疑难杂症”,加上系统自动质检、多层检查等层层把关,输出高质量结构化数据,交给客户满意答卷。
印章最外沿的文字,沿弧形走向,弧度较大
在暗光环境下的照片尤为明显,底部字迹和背景容易混杂在一起置
红框和黄框为两种不同的排列方式
3.车牌OCR识别
车牌信息识别,应用于无人、无卡车辆进出管理、道路违章车辆抓拍、远程车辆认证等智能场景。解决由于距离远、像素低、被遮挡、光线暗、视角倾斜导致的车牌信息模糊问题,精准识别车牌号、颜色等信息,包括蓝牌、黄牌、新能源车牌、军牌、警牌、领使馆车牌,支持同一场景下同时识别多个车牌。
4.国外论文OCR识别
应用成熟的多语种OCR识别算法,识别并转写国外论文标题、DOI码、作者、作者单位、摘要、关键词。

专业标注团队

我们在多省设立专属数据基地,拥有平台专业标注团队500+,所有平台标注人员需培训考核通过才可上岗,专业性强。

技术方案

文本识别

了解更多

我们将为您定制专属的服务内容并评估预算

填写需求表格
了解价格