哎呀好企业服务网
返回AI大全导航
a

abab

通用大模型已备案
访问官网
备案单位上海稀字科技有限公司
所属地区上海市
备案时间2023/8/31
备案编号Shanghai-Abab-20230821

AI介绍

在生成式AI技术高速迭代、通用大模型产业落地需求持续升级的行业背景下,上海稀字科技有限公司依托上海人工智能产业集群的技术与生态优势,推出了面向全场景应用的通用大语言模型abab,该产品已于2023年8月31日完成备案,备案编号为Shanghai-Abab-20230821,是国内合规落地的主流MoE架构通用大语言模型之一。

作为基于混合专家架构(MoE)打造的通用大语言模型,abab从研发阶段就锚定了“高性能、低成本、广适配”的产品定位,既能够支撑通用场景的自然语言处理需求,也可以针对垂直领域进行轻量化微调适配,满足不同开发主体、不同行业的AI应用落地要求。

abab的核心功能覆盖当前通用大模型的主流需求场景,具体可分为四大模块:第一是通用自然语言理解与生成,支持多轮对话、文案创作、内容总结、逻辑推理、代码编写等基础能力,能够应对日常办公、内容创作、学习辅助等各类通用需求,在长文本处理领域,abab可支持百万字符级的上下文窗口,能够完整处理整本书籍、百万行代码、全量企业合同文档等超长内容输入,解决了常规大模型长文本记忆能力不足的痛点;第二是多领域知识问答与推理,依托训练阶段覆盖的科技、人文、工业、民生等多领域公开语料,abab可稳定输出逻辑自洽、符合行业常识的回答,在数学推理、常识问答、结构化信息提取等权威评测中,性能达到国内通用大模型第一梯队水平;第三是工具调用与生态对接,abab原生支持API调用、插件开发,可快速对接搜索、数据库、行业应用系统等外部工具,帮助开发者快速搭建自有AI应用;第四是私有化部署支持,针对企业数据安全需求,abab提供完整的私有化部署方案,可满足金融、政务等对数据保密性要求较高领域的部署需求。

在技术特点层面,abab采用当前主流的MoE混合专家架构设计,区别于传统密集型大模型,它将模型参数切分为多个独立的专家子模块,每一次推理仅激活部分专家网络参与计算,在保持百亿级总参数规模带来的泛化能力的同时,大幅降低了单次推理的计算成本,推理速度相较于同参数规模的密集型模型提升40%以上,推理成本下降超过35%,实现了性能与成本的平衡。同时,上海稀字科技针对MoE架构的负载均衡、专家漂移等行业痛点,研发了自研的动态门控调度算法,能够根据不同输入任务自动匹配最优专家组合,有效避免了部分专家闲置、任务分配不均的问题,进一步提升了模型输出的稳定性与准确性。此外,abab支持从1B到70B参数的弹性扩缩,开发者可根据自身硬件条件与需求选择合适的参数规格,降低了大模型应用落地的硬件门槛。

abab的应用场景覆盖To C、To B、To G等多个领域:在To C领域,可对接内容创作平台、个人AI助手、学习辅导产品,为普通用户提供聊天互动、文案生成、知识答疑、作业辅导等能力;在To B领域,可适配企业智能客服、内部知识问答、合同审核自动化、营销文案生成、代码辅助开发等场景,金融机构可基于abab搭建合规的智能投研助手,制造企业可基于abab整理技术文档、辅助工艺研发,电商企业可利用abab快速生成批量商品文案与营销素材;在To G领域,可通过私有化部署适配政务咨询、公共服务问答、政策文件整理等场景,助力政务服务智能化升级;此外,abab也为AI创业者与开发者提供了灵活的模型底座,支持开发者基于abab微调开发垂直领域大模型,快速推出行业定制化AI应用,降低大模型创业的技术门槛与研发成本。

作为上海本土企业研发的合规通用大模型,abab始终遵循我国生成式AI服务管理规范,在数据合规、内容安全层面建立了完善的审核机制,能够为各行各业提供安全、合规、可靠的大模型能力支撑,当前已经有数十家行业企业基于abab完成了AI应用的开发与落地,成为国内MoE架构通用大模型落地应用的代表性产品之一。