驰盈策略语料“加速器”、AI健康顾问，大模型上下游成果秀技

发布日期：2024-09-04 13:21 点击次数：157

7月4日开幕的2024世界人工智能大会（WAIC）正在上海举办驰盈策略，现场版“百模大战”连日来上演，在众多基础大模型集中亮相的同时，从在医疗、农业、金融等行业落地的大模型应用，到为大模型获取“语料”扫清堵点的大模型“加速器”，一批大模型上下游创新成果也集中亮相。

如果将大模型比喻为正在疾驰的科技列车，语料便是珍贵的“燃料”。对中国的大模型企业而言，语料短缺问题仍然严峻。据悉，当前大模型数据集主要为英文，中文语料占比较低，跨页表格、复杂公式等元素的处理仍是大模型语料处理中的“拦路虎”。作为支撑大模型语料训练的大模型行业上游关键技术之一，合合信息展出的大模型“加速器”，最快1.5秒就能完成对百页长文档中的文本、表格、图像等非结构化数据的解析，帮助大模型加速从海量文档中高效提炼“智慧燃料”。

在展区现场，参观者可以选择物理、医学、金融、社会学等多个知识领域的文档，向大模型提问专业问题，例如对特定表格内容的总结、关键要素的分析等。对比测试结果显示，加载了文档解析引擎的大模型，在回答问题的速度、准确度上更胜一筹。

大模型使用文档解析引擎之前（左）和之后（右）的效果对比

技术人员介绍，金融报表、行业报告等高知识密度的文档中，表格的含义是最精华的数据指标。失之毫厘差之千里，一个单元格的理解问题，可能导致整个表格的识别结果产生误差，所以表格的还原准确率，直接影响着模型问答的效果。而大模型“加速器”中的文档解析引擎，能够对研报、论文等文档中的柱状图、折线图、饼图、雷达图等十余种常见图表进行“还原”，巧妙转化大模型能够理解的格式，使数据和图表中的信息能够被大模型充分提取、理解。

合合信息智能创新事业部总经理唐琪透露，目前，大模型“加速器”已被百川智能等多家大模型厂商应用于金融、医学、财经、媒体等多领域的文档的解析中，助力大模型更顺利地接轨“专业课”。

专业的大模型做专业的事，成为近年来国内大模型厂商逐渐达成的共识，医疗、金融等垂直行业大模型涌现，成为展区中的一大亮点。

王小川创立的大模型明星创业公司百川智能，此次也展出了其通用医疗增强大模型和AI医疗应用的最新突破。工作人员介绍，百川智能的通用医疗增强大模型不仅在USMLE（美国医考）的评测中超越了GPT-4，并且在由协和医院等头部三甲高年资主任、主治医师和心理学专家作为评测主体，对模型进行多角度评测的真实人工评测中同样超越了GPT-4。

在此基础上，团队研发了一款全新的AI医疗应用——AI健康顾问，AI健康顾问依托百川智能的通用医疗增强大模型打造，不仅拥有丰富的医药学知识，并且还具备医生思维。它能够像从业多年的全科医生一样，在用户提出问询之后，根据用户的问题持续提问，从更多维度更深入地了解症状，收集到足够多病症信息后再进行综合判断，给出诊断结果和用药建议。

比如，用户问AI健康顾问“我肚子疼，该怎么办？”，收到问题之后，AI健康顾问会相继向用户提出，“是否有呕吐、恶心、腹泻等其他的症状？是否发烧？肚子疼的具体位置？”等多个角度的问题，最后根据用户的回答综合判断病因，给出治疗建议。

面壁智能开源业内首个端侧大模型工具集、支付宝发布多模态医疗大模型、首个面向C端用户的可控人物视频生成大模型Vimi……上千种人工智能新成果在大会期间组团亮相“秀技”。

记者：孙奇茹驰盈策略

上一篇：中证投资杭州银行(600926.SH)2023年度拟每股派0.52元 7月11日除权除息

下一篇：六安股票配资东方材料最新公告：控股股东、实控人许广彬所持约2978.25万股将被司法拍卖

驰盈策略 语料“加速器”、AI健康顾问，大模型上下游成果秀技

驰盈策略语料“加速器”、AI健康顾问，大模型上下游成果秀技