哎呀好企业服务网
返回AI大全导航

天地大模型

计算机视觉已备案
访问官网
备案单位汉王科技股份有限公司
所属地区北京市
备案时间2024/3/11
备案编号Beijing-TianDi-20240226

AI介绍

在大语言模型技术高速普及、各行业数字化转型进入深水区的今天,非结构化文本信息的数字化提取与深度利用仍然是制约很多机构效率提升的核心痛点——大量纸质档案、票据、手写文档、实体证件中的信息难以自动识别加工,传统OCR技术仅能完成字符提取,无法实现内容理解、信息提炼与结构化整理,依赖人工二次处理的模式成本高、效率低,难以匹配海量业务的处理需求。汉王科技作为深耕文字识别领域三十余年的领军企业,依托自身在OCR技术领域积累的核心优势,推出了北京属地备案的OCR+文本专用大模型——天地大模型,该产品于2024年3月11日完成备案,备案编号为Beijing-TianDi-20240226,是面向文本处理全流程打造的行业专用大模型产品。

天地大模型的核心功能覆盖了从文字识别到文本深度处理的全链路需求,具体可分为三大模块:第一是全场景高精度文字识别功能,不仅支持常规印刷体文档识别,还针对复杂场景优化了识别能力,可精准处理褶皱污损文档、低清晰度扫描件、多样式手写笔记、多语言混合文档、倾斜扭曲证照等复杂介质的文字提取,解决了传统OCR在复杂场景下识别准确率不足的痛点;第二是文本结构化处理功能,可自动从识别出的非结构化文本中提取关键要素,按照业务需求生成标准化结构化数据,比如从人事档案中提取出生日期、学历、工作经历等核心信息,从增值税发票中自动拆分发票抬头、税额、商品明细等字段,无需人工二次整理;第三是文本理解与生成功能,支持基于提取文本的内容总结、要点提炼、多文档信息聚合、合规审查、内容改写等拓展能力,可直接满足各类业务的下游应用需求。

在技术特点层面,天地大模型深度融合了汉王科技三十年积累的OCR技术与千亿参数级大语言模型能力,走专用大模型的技术路线,相比通用大模型在文本处理领域优势显著:一方面,模型针对文字识别与文本处理任务做了专属预训练,在各类中文文本、复杂场景识别任务上的准确率远高于通用大模型,针对手写体、古文字、生僻字的识别支持也处于行业领先水平;另一方面,模型采用了轻量化部署优化,支持私有化本地部署与公有云调用多种部署方式,在保障数据安全的同时,推理速度远高于通用大模型,可满足高并发业务场景的处理需求;此外,天地大模型支持低代码的行业微调,企业可基于自身业务数据快速适配特定场景,适配成本比通用大模型降低60%以上。

目前天地大模型已经在多个领域形成了成熟的落地应用场景:在政务领域,可支持海量历史纸质档案的数字化加工,自动完成档案信息的提取与结构化入库,大幅提升档案数字化项目的效率,降低人工成本;在金融领域,可用于银行开户证件审核、保险理赔单据处理、信贷申请资料信息提取,可将单份单据的处理时间从十余分钟压缩到数秒,同时降低人工录入的错误率;在制造与物流领域,可识别各类纸质单据、手写运单信息,自动对接企业ERP与物流管理系统,实现供应链单据的自动化处理;在办公领域,可支持手写笔记的数字化整理、会议纪要的识别与要点提炼,帮助职场用户提升办公效率。

作为国内首个正式备案的OCR+文本专用大模型,天地大模型填补了通用大模型在垂直文本处理领域的能力空白,为各行业的非结构化文本数字化提供了高性能的专用AI方案,也为大模型的垂直化产业化落地探索了新的方向。