星尘数据MorningStar正式发布!狙击“数据债”成最大看点
2748 2025-07-11 05:29
Yi-34B-Chat-200K 可以对200多页的英文长篇小说《Frankentein》进行中文归纳总结和用表格例举书中人物。
而零一万物开发的多模态模型 Yi-VL-Plus,可支持文本、视觉多模态输入,面向实际应用场景大幅增强:
增强Charts, Table, Inforgraphics, Screenshot 识别能力,支持复杂图表理解、信息提取、问答以及推理。中文图表体验超过GPT-4V。
在 Yi-VL 基础上进一步提高了图片分辨率,模型支持 1024*1024 分辨率输入,显著提高生产力场景中的文字、数字 OCR 的准确性。
保持了 LLM 通用语言、知识、推理、指令跟随等能力。
在全球多项权威评测榜单中,Yi 大模型表现优异,性能直追 GPT-4。从实际测评结果显示,很多场景 Yi-VL-Plus 效果超过 GPT-4V。
例如,当我们把下述表格分别给 Yi-VL-Plus 和 ChatGPT 处理,发现两个模型的处理结果不同:
Yi-VL-Plus 得出了正确答案,GPT-4V 没有,可见 Yi-VL-Plus 对中文复杂表格的信息识别处理准确度高于 GPT-4V:
再例如,我们将下述模糊汉字的图片提交给 Yi-VL-Plus 和 ChatGPT 识别:
发现Yi-VL-Plus 回答正确了,ChatGPT 没能答对:
据零一万物透露,此前,Yi 大模型 API 小范围开放内测,全球已有不少开发者申请使用,并普遍反馈效果超出预期,其中,星云爱店 CTO 大董、工艺人负责人刘亚光和测试过零一万物 API 开放平台后,也给出了较高评价。
星云爱店是知识探索支持的先行者,该公司的业务包含2C的“学术科研助手”,2B的儿童心理健康诊疗、青少年科学素养培养三大领域。
大模型爆火后,针对科研学术场景,星云爱店“万能小in科研助手”可以加载大模型能力,帮助客户进行深层次文本资料解读、文献分析以及创造性写作;针对青少年科学素养培育计划,星云可以利用大模型来辅助制定个性化学习计划,提供学习辅导,评估学习成果,并引导学生举一反三,创造性提升学习效果。
所以要求大模型同时具备智商IQ和情商 EQ——做研究时大模型要有智商IQ,精确、严谨、化繁为简,而在支持客户时又有情商EQ,善解人意、无微不至。
星云爱店 CTO 大董参加过诸多一线大模型的测评,但他发现找到双商兼并的平台并不容易,他们要求大模型能达到:长文本精确摘要,对话文案专业化、精细化,拒答率低。这次,星云爱店成为零一万物 Yi 大模型 API 开放平台邀测的首批客户。大董说,相比其他大模型,满分 10 分的话,给 Yi 大模型 API 开放平台整体评分可达 8.5,属于他们测试大模型 API 中的头部玩家。
经过多次测试后,大董发现零一万物 Yi 大模型 API 开放平台,相对其他模型有以下优势:
(1)当执行复杂任务时,拒绝任务率低,完成度好,测试案例如下:
其他模型,被拒率达 40%。
切换到零一模型后,任务未发生拒绝执行,且篇幅控制准确,撰写创业优良,翻译专业准确。
(2)学习专业知识并立即用于解读,表现优良。有深度、有创意。
结合历史病历和从图片信息,零一模型可以较好的完成对青少年心理健康水平解读。并被中国顶级精神卫生诊所评价为:较准确。
(3)阅读18万字的报告集合,未遗漏重点
其他模型(左标黄图所示):无地缘政治风险。
零一模型(右图所示):英国脱欧导致索尼总部搬迁,导致索尼欧洲业务连续性受作用。
使用了 Yi 大模型API开放平台后,现在,星云爱店的业务能力和客户体验明显提升。
首先是复杂场景下多指令理解反馈高效精准。不管是学术研究还是为儿童青少年提供辅导,经常都会有“既要又要还要”的刁钻需求,比如需要总结一系列文章核心观点,并按照某一标准排序打分后进行语言翻译,这是对模型的指令遵循、创意内容生成以及推理速度的综合考验。大董说:“Yi-34B-Chat-200K面对几万字的超长提示词,10 秒钟就反馈回来了结果,极大提高大家的工作效率。”
其次是长文本中“大海捞针”精确度优异,这让星云爱店的产物可以在诸多文本分析与写作平台中独占鳌头。学术研究最难的并非找到1万篇文献的共同点,而是要在浩如烟海的文字中,找到可能会被前人忽略的关键信息。大董说,即使是做诗词韵律相关的分析,在测试中发现 Yi 大模型都可以准确理解文献表达的意思,很快抓住重点。30 万字的处理能力者对于知识库的分析整理很关键。Yi 大模型在语义理解、摘要总结等精确度等方面是他测试过的各类长文本模型里的领先者。
此外,不管是支持科研还是做心理咨询,“靠谱”是最关键的品质。大董说,以心理咨询场景为例,在线拒答率、回答文案的温暖程度极大作用客户体验。零一万物的API做到了靠谱且易用,这对一家业务正在持续增长,客户规模不断扩大的公司尤为关键。
而 Yi 大模型API开放平台的“靠谱易用”,还体现在 API 接入的顺滑程度上。星云爱店工艺负责人刘亚光说,接入 Yi 大模型 API 代码修改量极少,几乎是分分钟就可以搞定。
而客户能拥有上述体验则要源于零一万物对 API 的优化,据零一万物透露,为了提升 API 性能,零一万物在 API 侧进行了推理优化,因此 Yi-34B-Chat 系列 API 具备较快的推理速度,这不仅缩短了处理时间,同时也保持了出色的模型效果。此外,优化的 API 接口显著降低了模型回复的延迟,进一步提高了客户体验的流畅性和响应速度。
同时,Yi 系列模型 API 与 OpenAI API完全兼容,只需要修改少量代码,就能平滑迁移。
当然,目前看来 Yi 大模型 API 到底能不能与 GPT-4 Turbo、Gemini 1.5、Claude 3 这些模型的表现一较高下,还需要更多开发者一起考察。
据零一万物工艺副总裁及模型训练 AI Alignment、开放平台负责人俞涛透露,未来零一万物将会持续为开发者提供更多更强模型和 AI 开发框架,让大模型更好地完成落地,包括:
推出一系列的模型 API,覆盖更大的参数量、更强的多模态,更专业的代码/数学推理模型等。
突破更长的上下文,目标 100万 tokens;支持更快的推理速度,显著降低推理成本。
基于超长上下文能力,构建向量信息库、RAG、Agent 架构在内的全新开发者 AI 框架。旨在提供更加丰富和灵活的开发工具,以适应多样化的应用场景。
雷峰网特约稿件,未经授权禁止转载。详情见转载须知。