驰盈策略 语料“加速器”、AI健康顾问,大模型上下游成果秀技

发布日期:2024-09-04 13:21    点击次数:157


7月4日开幕的2024世界人工智能大会(WAIC)正在上海举办驰盈策略,现场版“百模大战”连日来上演,在众多基础大模型集中亮相的同时,从在医疗、农业、金融等行业落地的大模型应用,到为大模型获取“语料”扫清堵点的大模型“加速器”,一批大模型上下游创新成果也集中亮相。

如果将大模型比喻为正在疾驰的科技列车,语料便是珍贵的“燃料”。对中国的大模型企业而言,语料短缺问题仍然严峻。据悉,当前大模型数据集主要为英文,中文语料占比较低,跨页表格、复杂公式等元素的处理仍是大模型语料处理中的“拦路虎”。作为支撑大模型语料训练的大模型行业上游关键技术之一,合合信息展出的大模型“加速器”,最快1.5秒就能完成对百页长文档中的文本、表格、图像等非结构化数据的解析,帮助大模型加速从海量文档中高效提炼“智慧燃料”。

在展区现场,参观者可以选择物理、医学、金融、社会学等多个知识领域的文档,向大模型提问专业问题,例如对特定表格内容的总结、关键要素的分析等。对比测试结果显示,加载了文档解析引擎的大模型,在回答问题的速度、准确度上更胜一筹。

大模型使用文档解析引擎之前(左)和之后(右)的效果对比

技术人员介绍,金融报表、行业报告等高知识密度的文档中,表格的含义是最精华的数据指标。失之毫厘差之千里,一个单元格的理解问题,可能导致整个表格的识别结果产生误差,所以表格的还原准确率,直接影响着模型问答的效果。而大模型“加速器”中的文档解析引擎,能够对研报、论文等文档中的柱状图、折线图、饼图、雷达图等十余种常见图表进行“还原”,巧妙转化大模型能够理解的格式,使数据和图表中的信息能够被大模型充分提取、理解。

合合信息智能创新事业部总经理唐琪透露,目前,大模型“加速器”已被百川智能等多家大模型厂商应用于金融、医学、财经、媒体等多领域的文档的解析中,助力大模型更顺利地接轨“专业课”。

专业的大模型做专业的事,成为近年来国内大模型厂商逐渐达成的共识,医疗、金融等垂直行业大模型涌现,成为展区中的一大亮点。

王小川创立的大模型明星创业公司百川智能,此次也展出了其通用医疗增强大模型和AI医疗应用的最新突破。工作人员介绍,百川智能的通用医疗增强大模型不仅在USMLE(美国医考)的评测中超越了GPT-4,并且在由协和医院等头部三甲高年资主任、主治医师和心理学专家作为评测主体,对模型进行多角度评测的真实人工评测中同样超越了GPT-4。

在此基础上,团队研发了一款全新的AI医疗应用——AI健康顾问,AI健康顾问依托百川智能的通用医疗增强大模型打造,不仅拥有丰富的医药学知识,并且还具备医生思维。它能够像从业多年的全科医生一样,在用户提出问询之后,根据用户的问题持续提问,从更多维度更深入地了解症状,收集到足够多病症信息后再进行综合判断,给出诊断结果和用药建议。

比如,用户问AI健康顾问“我肚子疼,该怎么办?”,收到问题之后,AI健康顾问会相继向用户提出,“是否有呕吐、恶心、腹泻等其他的症状?是否发烧?肚子疼的具体位置?”等多个角度的问题,最后根据用户的回答综合判断病因,给出治疗建议。

面壁智能开源业内首个端侧大模型工具集、支付宝发布多模态医疗大模型、首个面向C端用户的可控人物视频生成大模型Vimi……上千种人工智能新成果在大会期间组团亮相“秀技”。

记者:孙奇茹驰盈策略




Powered by 益通网_配资炒股平台_网上正规实盘配资网站 @2013-2022 RSS地图 HTML地图