图片来源:由无界 AI生成
来源:赛智时代
自2022年11月ChatGPT公开发布以来,AI大模型迅速成为了市场上的热点,并逐渐深入应用于各行业领域,如Open-AI的GPT-3、华为云的盘古NLP、百度的文心大模型不仅在自然语言处理、计算机视觉、智能语音等领域取得了标志性的技术突破,在模型精度、通用性和泛化能力等方面也实现了跨越式发展,并在金融、医疗、能源等领域实现了多场景应用落地,提升了效率、降低了成本、创造了价值。
一、国内外行业大模型发展模式
(一)国外行业大模型发展模式
根据中国电信研究院研究,目前,国外行业大模型发展模式主要有三种,且以前两种发展模式为主。
一是“龙头大模型+原业务”。如微软利用GPT赋能Office之类的传统业务。这种模式的优势在于可以利用大模型的强大语言能力,提升原有业务的智能化水平,同时也可以借助原有业务的数据和用户资源,增强大模型的应用相关性和准确性。
二是“龙头大模型+外部数据”。一般是中小型公司采用这种方式,这种模式的优势不仅可以利用大模型的先进技术,同时与行业结合紧密,增强行业相关性和准确性。
三是“开源大模型+垂直行业数据搭建行业大模型”。这种模式的优势在于可以充分利用自有数据,打造出更为精准的行业大模型,同时也可以借鉴开源大模型的技术和经验,提升训练效率和效果。
总体来看,国外通用大模型能力强,且“龙头效应”明显,能直接满足多行业需求。据不完全统计,截至2023年5月,国外共有138个AI应用落地案例,主要集中在传媒、游戏、办公、医药等领域。
(二)国内行业大模型发展模式
目前,国内行业大模型发展模式主要有两种,一种是“自有通用大模型+外部行业数据”,另一种是“自有或其他开源大模型+自有行业数据”。
“自有通用大模型+外部行业数据”主要是自有通用大模型的企业以主模型衍生多个行业大模型,如百度基于“文心”拓展了金融、医疗、传媒等行业大模型。这种模式的优势在于可以利用通用大模型的强大语言能力,快速适应不同行业的需求,同时也可以借助外部数据源,增强行业相关性和准确性。
“自有或其他开源大模型+自有行业数据”,如深睿医疗基于Transformer架构的图像大模型自主研发了通用医学影像理解模型DeepWise—CIRP Model。这种模式与国外第三种模式类似,可以充分利用自有数据,打造出更专业的行业大模型,同时也可以借鉴其他开源大模型的技术和经验,提升训练效率和效果。
尽管国内通用大模型能力尚有欠缺,但行业大模型可弥补差距,成为大模型产业落地的加速器。据不完全统计,截至2023年7月底,国内10亿参数以上的各类行业大模型,已达113个。
二、大模型在主要行业的具体应用
(一)金融行业
金融行业是大模型重要应用领域,主要将大模型应用于客服、银行、保险等细分领域,实现了风控、效率等方面的提升。
一是智能投资。大模型在投资领域可以用来分析大量的历史数据和实时行情,帮助投资者作出决策,并综合盈利概率、个股走势、个股风险、行业风险、政策走向等多种因素,动态调整权限配比,得出对个股的评分。
二是提升声誉风险管理和应对能力。预训练大模型可以帮助金融机构降低声誉风险,企业可以使用预训练大模型对客户的投诉、社交媒体上的反馈、以及其他渠道中的文本数据进行情感分析和主题分类,快速了解客户的需求和反馈,增强客户信任感,提高品牌价值。
三是提高监管合规风险管理水平。预训练大模型可以审查大量数据文件,并确保它们的有效性和准确性符合政府和行业有关规定。在内部合规方面,预训练大模型可以记录、监测和分析员工电话记录、电子邮件流量、作息时间卡等信息,识别和提醒内部人员潜在风险和不当行为,有助于金融机构实现合规监管风险管理的目标。
四是反诈骗。金融反欺诈模型是通过数据采集手段,对风险行为或可疑行为监测与分析,根据不同风险事件或可疑行为的风险计量标准和规则模型,分别实施预警或干预等措施,从而有效减少金融欺诈的发生。
百度基于文心通用大模型,打造了金融行业大模型“文心金融”,为金融行业提供了智能问答、智能写作、智能摘要等多项能力。“文心金融”可以根据用户提出的问题,从海量的金融知识库中检索或生成答案,实现高效准确的智能问答服务;“文心金融”还可以根据用户的需求,自动生成金融相关的文章、报告。
(二)医疗行业
医疗行业是大模型应用创新的重要领域。医疗行业对大模型的精度、可靠性以及学习理解能力有着极高的要求。医疗行业主要将大模型应用于药物研发、健康管理、辅助诊断、互联网问诊等场景,实现了医疗质量、医疗效率、医疗覆盖等方面的提升。
一是医学影像领域。大模型技术可以帮助医生快速、准确地识别出疾病的影像特征,提高诊断准确率和效率。大模型技术可还以对患者的X光、CT、MRI等影像进行快速、准确的分析,帮助医生快速确定病情,提高了诊断效率和准确率。
二是疾病预测领域。大模型技术可以通过分析患者的基因、病史等数据,预测患者的疾病风险,提前进行预防和干预,降低患病率和死亡率。
三是诊断辅助。通过大模型可以对医学影像进行快速、准确的分析,为医生提供更精准的诊断结果。例如,在乳腺癌筛查中,大模型可以帮助医生快速识别出可疑的乳腺结节,提高筛查效率和准确率。
四是智能医疗机器人。大模型可以帮助医疗机器人更好地与患者进行交互,提供更好的医疗服务。例如,在手术室中,智能医疗机器人可以帮助医生进行手术操作,提高手术效率和安全性。
五是医疗知识图谱。大模型可以帮助构建医疗知识图谱,为医生提供更全面、更精准的医疗知识和信息。例如,在医生诊断时,医疗知识图谱可以帮助医生快速查找相关疾病的诊断标准、治疗方案等信息,提高诊断准确率和效率。
华为云基于盘古NLP系列大模型,打造了医疗大模型“盘古医疗”。“盘古医疗”可以根据给定的靶点或适应症,从海量的化合物库中筛选出候选药物,并预测其活性和毒性,实现高效准确的药物发现服务。“盘古医疗”还可以根据给定的药物或疾病,从海量的临床试验数据中提取出有效信息,并生成规范的临床试验报告,实现高质量、高效率的临床试验服务。
(三)能源行业
能源行业大模型的应用场景非常广泛,可以极大地提高各个环节的效率。例如在组织管理方面,可以帮助企业提高管理效率;在市场营销方面,可以更好掌握市场需求,提高营销效率。
一是预测能源需求。可以通过分析大量的能源数据,预测未来的能源需求和价格,提供投资建议和决策支持。
二是智能故障判断。大模型可以利用先进技术,对目前系统的故障可以进行自动检测、识别。特别是对于一些潜在的隐患,可以提前发现,避免更大的损失。
三是政策解读。能源行业大模型可以对目前能源环保行业的规则进行分析解读,对于企业遵守相关规定提供参考,避免不必要的损失。
清博智能公司的“先问大模型”是一种先进的技术解决方案,能够实现生产、管理、运营等环节的无缝连接和数据集成。
三、国内大模型行业应用发展趋势
大模型的成功必须依托于应用、场景、商业模式。大模型已触发三大革命性变化:
一是推动弱人工智能向通用人工智能(AGI)跃升;
二是推动生产力从算力向机器智力跃升;
三是推动数字社会向智能社会跃升。在产业互联网中的落地才是大模型的真正“主战场”,但需要化解私有化部署、数据安全、价值观对齐和业务系统紧密集成及性价比等挑战。
如在工业应用领域,现阶段工业领域大模型与小模型相辅相成,未来大模型可能会替代高度定制化的小模型,由于工业场景复杂、环境复杂、工艺复杂,现阶段主要以单模态模型服务为主,导致工业AI大模型开发难度大、数量少,我们认为AI大模型在工业制造业领域全面应用落地相对缓慢,但是单一垂直大模型迁移性较高。
随着工业AI视觉平台、AI摄像头等数据积累,机器视觉模型训练能力的门槛大大降低,工业AI质检和巡检已经应用在3C电子、汽车及零部件、消费品和原材料等诸多应用场景。
总体来讲,国内大模型的发展,将呈现基础大模型“剩者为王”、更关注过程、高质量数据成关键要素、行业大模型是行业应用落地重点、大模型要构建全栈国产化能力五大趋势。
一是基础大模型竞争“胜者为王”。也即大模型会逐步从数量发展到拼效率,而如何把大模型做小也将成为未来发展的重要方向。
二是高质量数据是制胜关键。在行业大模型研发中可以认识到,拥有高质量的数据才是大模型价值跃迁的制胜法宝。
三是关注行业落地。因为基础大模型没有办法解决行业专用问题,行业大模型才是帮助解决行业实际问题的重要手段。
四是从更关注过程。在大模型应用中也更关注技术安全,以及价值观伦理等方面。
五是自主可控。在大国博弈背景下,中国大模型要有构建全栈国产化的能力。