查看原文
其他

最全AI大模型盘点与深度测评,你Pick哪一款?

哎呀 制造前沿
2024-09-19


AI大模型是当代技术革新的前沿,它们通过海量数据训练,具备强大的语言理解、生成和逻辑推理能力,正在深刻地改变信息处理、决策支持、内容创作等多个领域。这些模型不仅提升了效率和准确性,还推动了个性化服务和智能交互的发展,成为推动各行各业数字化转型和智能化升级的关键驱动力。

作为人工智能领域的集大成者,AI大模型应用领域广泛而深入,涵盖了从自然语言处理、图像和视频分析、智能助手和聊天机器人的客户服务,到知识管理、教育个性化学习、医疗诊断辅助、金融风险评估、智能制造过程优化等。它们能够处理复杂的数据分析任务,提供决策支持,创造新的艺术作品,甚至在科学研究中模拟和预测复杂系统的行为,推动着社会生产力的飞跃和智能化生活的全面进步。

除了我们日常使用的语言模型(如GPT系列)、视觉模型(如ResNet、Transformer)、多模态模型,还诞生了一些针对特定领域的专业模型,如工业、医疗、法律和金融模型,它们经过特定数据训练以解决特定行业的复杂问题,小众但极具价值。还有决策支持模型,用于辅助或自动化决策过程,以及生成对抗网络(GANs)等,用于创建逼真的图像或模拟复杂场景。这些模型各有专长,正推动着人工智能技术的多样化发展和广泛应用。

『制造前沿』对国内市面上的主流大模型进行了盘点与测评,足足共31款,堪称全网最全!详细介绍了每款大模型的主要功能和亮点,并提供对应的网址,可复制打开直接使用。希望这些大模型能成为你的小助手,提高打工人的生产力。

我们按照开发者的公司属性做了分类,一类是百度、华为等科技大厂的大模型,另一类一些创业新势力,尤其是一些专注于工业、医疗、金融、智能决策等领域的行业大模型给了我惊喜!

视频生成的大模型我们后续单独做分析。

一定要收藏转发此文,让更多的人get这个新工具!


01科技大厂大模型

SUMMARY文心一言



开发者:百度

功能:

  • 文学创作:能够进行小说、歌词、诗歌、对联等文学创作。

  • 商业文案创作:辅助撰写商业文案、广告词等。

  • 数理逻辑推算:进行数学问题的推理和解答。

  • 中文理解:深入理解中文语境和语言习惯。

  • 多模态生成:结合文本、图像等多种模态的数据生成内容。

  • OCR技术:将图片中的文字转换成可编辑和可搜索的文本。

  • 机器翻译:将文本实时翻译成多种语言。

  • 情感分析:分析文本的情感倾向性。

  • 文本生成:根据主题或关键词自动生成文本。

  • 语音识别:将语音转换成文本,实现语音内容的识别和处理。

  • 实体关系抽取:从文本中抽取关键实体并建立实体间的关系模型。

亮点:

  • 文心一言大模型现已升级至4.0版本,通过百度智能云千帆大模型平台提供服务,包括推理服务及大模型微调等一系列开发和应用工具链。

  • 具备五大核心能力,支持多种应用场景,如搜索问答、内容创作生成、智能办公等。

  • 企业服务由千帆大模型平台提供,方便企业客户申请接入并使用。


网址:

https://yiyan.baidu.com/


讯飞星火



开发者:科大讯飞

功能:

  • 多模理解:图片素材识别理解,提供准确描述。

  • 视觉问答:围绕图片素材回答问题。

  • 多模生成:根据描述生成合成音频和视频。

  • 虚拟人视频:快速生成匹配视频内容。

  • 知识问答:上传文件进行对话,速览关键信息。

  • 内容创作:结合个人空间文档,生成报告、演讲稿、论文等。

  • 翻译/PPT生成:文件一键生成PPT、一键翻译。

  • AI润色:对文件进行修改、润色、扩展等二次创作。

  • 结构化创建:通过角色设定和对话模块,快速创建助手。

  • 流程图式编排:配置节点,实现复杂功能。

  • 轻应用开发:面向不同垂直场景的独立交互方式 。

亮点:

  • 全面对标GPT-4 Turbo:在文本生成、语言理解等方面实现超越。

  • 免费开放:Lite版本接入全免费,提供大模型生命周期定制工具。

  • 快速响应:采用流式接口设计,首帧响应最快可达毫秒级。

  • 多元场景:持续从海量数据和知识中学习与进化。

  • 灵活应用:提供丰富的参数设置,实现个性化模型体验。

  • 服务稳定:云服务达到等保三级标准,确保用户隐私安全。

  • 多语种支持:支持37个语种,包括自动语种判断和指定语种识别。

  • 高度拟人化:提供高度拟人化的语音合成能力,支持多语言多风格 


    网址:

    https://xinghuo.xfyun.cn/desk?b=1




    SUMMARY腾讯混元



    开发者:腾讯

    功能:

    • 多轮对话:具备上下文理解和长文记忆能力,能够流畅完成专业领域的多轮问答。

    • 内容创作:支持文学创作、文本摘要、角色扮演等多种创作形式。

    • 逻辑推理:能够准确理解用户意图,基于输入数据进行推理和分析。

    • 知识增强:有效解决事实性和时效性问题,提升内容生成效果。

    • 多模态能力:支持文字生成图像,将用户的想法转化为视觉图画。

    • 文档场景应用:提供文档创作、文本润色、校阅等能力,提高创作效率。

    • 会议场景应用:会中问答、会议总结、待办项整理等,简化会议操作。

    • 广告和营销场景应用:智能化广告素材创作,构建智能导购等。

    亮点:

    • 持续训练终身学习:模型不断学习进化,覆盖五大核心优势能力。

    • 腾讯元宝和腾讯元器:分别为工作生活提供便利和一站式智能体创作与分发平台。

    • 应用场景丰富:文档、会议、广告、营销等多样化服务逐步开放中。

    • 技术架构升级:采用混合专家模型(MoE)架构,参数规模达万亿,擅长处理复杂场景和多任务场景 

    • 合规性:已通过《生成式人工智能服务管理暂行办法》备案,符合国家相关标准要求 

    • 开源模型:腾讯混元文生图大模型发布并宣布开源,促进技术共享与创新 

    • 推理效率提升:针对混元文生图开源大模型的加速库,大幅提升推理效率,生图时间缩短75% 

    网址:

    https://hunyuan.tencent.com/


    通义千问



    开发者:阿里云

    功能:

    • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

    • 文本处理:润色文本、提取文本摘要等。

    • 编程辅助:编写和优化代码。

    • 翻译服务:提供多种语言的翻译服务。

    • 对话模拟:扮演不同角色进行交互式对话。

    • 数据可视化:图表制作和数据呈现等。

    亮点:

    • 在闭源和开源领域都取得了显著的成绩,特别是在中文场景下的性能超越了GPT-4 Turbo,成为地表最强中文大模型。

    • 模型在多轮对话、内容创作、逻辑推理等方面表现出色,并在多个基准测评中取得了优异的成绩。

    • 通义千问系列模型在开源社区中得到了广泛的认可和应用,提供了不同尺寸的模型以适应不同的部署需求。

    • 阿里云还发布了通义千问2.0版本,该版本在复杂指令理解、文学创作等方面进行了技术优化,提供了更丰富的产品模型和更好的开发者体验。

    网址:

    https://tongyi.aliyun.com/qianwen/?spm=5176.2810346&code=lapnbfugti&utm_content=se_1017928895





    SUMMARY盘古大模型

    开发者:华为云

    功能:

    • 盘古NLP大模型:业界首个千亿参数的中文预训练大模型,在CLUE打榜中实现了业界领先。

    • 盘古CV大模型:基于海量图像、视频数据构建的视觉基础模型,实现模型的按需抽取。

    • 盘古多模态大模型:融合语言和视觉跨模态信息,实现图像生成、理解、视频生成等。

    • 盘古预测大模型和科学计算大模型:面向结构化数据和科学计算领域,如气象、医药等,构建相应的能力。

    亮点:

    • 盘古大模型在小样本学习、微调和集成行业知识方面展现出特别的优势。

    • 它是一个以商业价值驱动研发创新的模型,注重AI工业化和现实场景的应用。

    • 盘古大模型在多个行业场景完成验证,如能源、零售、金融等,并获得了权威机构的广泛认可。


    网址:

    https://www.huaweicloud.com/product/pangu


    日日新SenseNova



    开发者:商汤科技

    功能:

    • 商量(SenseChat):自然语言处理模型,支持智能问答、对话等。

    • 秒画:文生图模型,能够根据文本描述生成图像。

    • 如影(SenseAvatar):数字人视频生成平台,用于创建虚拟角色和视频内容。

    • 多模态能力:支持长文本理解、综合推理、代码生成和跨模态交互。

    亮点:

    • 多模态多任务通用性:支持文本、图像、视频、音频等多种数据类型的处理,并支持中英文等多种语言。

    • 开源社区:商汤科技将“日日新SenseNova”大模型体系开放给AI开发者和研究者,共同探索AI应用场景和技术边界。

    • 性能提升:在长文本理解、综合推理、代码生成等方面具有出色的表现,部分能力超越了GPT-4系列模型。

    • 端侧大模型应用:商汤推出日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。

    网址:

    https://platform.sensenova.cn/home#/home?1=1&gioIndex=1




    SUMMARY火山方舟



    开发者:字节跳动旗下火山引擎


    功能:

    • 专注于AI和数据方向的创新。

    • 模型训练、推理、评测、精调等全方位服务。

    • 支持大模型生态,提供稳定可靠的安全互信方案。

    亮点:

    • 技术普惠:火山引擎认为,人人用得起的模型才是好模型,通过优惠的模型价格助力企业和开发者应用和试错,促进业务创新 

    • 安全可信:基于互信计算安全架构,实现模型和数据全生命周期安全增强,保障企业级AI应用落地 

    • 行业应用:已在金融、汽车、智能终端、电商零售、教育科研等多个行业实践落地,展现出全栈AI服务能力 

    网址:

    https://www.volcengine.com/product/ark


    360智脑



    开发者:360

    功能:

    360智脑大模型的功能包括但不限于:

    • 多轮对话:能够进行连续的对话交互。

    • 文本生成:提供文本创作和生成服务。

    • 图片能力:具备图像生成和识别能力。

    • 向量数据库:提供向量搜索和数据处理服务。

    • AI Box插件:提供定制化的AI插件服务。

    亮点:

    • 360智脑大模型基于大规模高质量语料训练,拥有准确的自然语言处理能力。

    • 支持多种API接入服务,易于快速上手和定制。

    • 采用行业领先的安全标准,保护用户数据隐私和安全。

    • 服务架构保证高可用性和稳定性。

    • 360智脑大模型已全面接入360系列产品,并向公众开放 

    • 具备生成创作、多轮对话、逻辑推理等十大核心能力,以及数百项细分功能。

    网址:

    https://ai.360.com/open




    SUMMARY蓝心大模型

    开发者:vivo

    功能:

    • 内容创作辅助:生成创意文本、撰写文章或博客。

    • 知识问答系统:提供准确的知识问答服务。

    • 逻辑推理与分析:在法律、金融等领域辅助决策制定。

    • 代码生成和软件开发:协助编写和优化代码。

    • 信息提取和数据分析:从文本中提取关键信息。

    • 自动化办公:撰写官方文档、报告,生成会议纪要和邮件回复。

    • 多语言翻译和本地化:提供高质量的翻译服务。

    • 创意娱乐:在游戏行业生成创意内容

    亮点:

    • 大规模模型参数:包含70亿、130亿和1750亿参数的大模型。

    • 丰富的多语言语料库:拥有2.6T的多语言语料库。

    • 大尺寸上下文处理能力:能够处理32K的大尺寸上下文。

    • 安全合规:重视大语言模型的安全性和合规性。

    • 高效的算法:由顶尖的算法团队开发。

    • 适用于丰富的场景:全链路自研,模型在多个场景下都展现出国内领先的效果

    网址:

    https://developers.vivo.com/product/ai/bluelm


    天工AI



    开发者:昆仑万维

    功能:

    • 文案创作:能够进行创意文本的生成和创作。

    • 知识问答:提供准确的知识问答服务。

    • 代码编程:辅助编写和优化代码。

    • 逻辑推演与数理推算:进行逻辑推理和数学计算。

    • AI搜索:提供快速、可靠的交互式搜索服务,具备实时信息查询能力。

    • AI音乐:通过“天工SkyMusic”音乐大模型生成音乐内容。

    • AI PPT:快速生成专业的PPT演示文稿。

    • AI视频转绘:将视频转换成二次元风格,并可用于制作动漫表情包等。

    亮点:

    • 天工AI大模型是国内首个对标ChatGPT的双千亿级大语言模型。

    • 通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。

    • 推出了国内第一款AI搜索产品“天工AI搜索”,提供人性化、智能化的搜索体验。

    • 天工3.0版本采用MoE架构,处理复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。

    网址:

    https://model-platform.tiangong.cn/





    SUMMARY



    开发者:浪潮信息

    功能:

    • 文本生成:能够生成各种类型的文本内容。

    • 知识问答:提供准确的知识问答服务。

    • 数学推理:进行数学问题的推理和解答。

    • 编程:辅助编写和理解代码。

    • 复杂逻辑理解:处理复杂的逻辑问题。

    亮点:

    • 采用新型的LFA(局部过滤的自注意力)模型结构,整体性能接近GPT4。

    • 源2.0版本在算法、数据和算力三大方向上进行了升级创新,特别是在Transformer结构中替换了自注意力层,引入了LFA结构,以更好地处理自然语言的语序排列问题。

    • 浪潮信息还公布了源大模型共训计划,允许开发者根据应用需求对源大模型进行增强训练,并保持开源。


    网址:

    https://www.airyuan.cn/home

    SUMMARY观澜



    开发者:海康威视

    功能:

    • 提升产品性能:利用大模型的小样本学习能力和泛化能力,推出更准确的算法。

    • 智能感知能力:增强产品的感知能力,如雷视产品的研发中,构建了雷视多模态大模型,提升了目标感知能力。

    • AI落地部署应用:大模型带来的平均性能提升超过50%,支持更多复杂的业务需求。

    亮点:

    • 观澜大模型在海康威视AI开放平台、海康云眸等平台中广泛部署,提高了目标的检出率和检准率,降低误报。

    • 在海康威视内部构建的多个跨行业的泛化任务上,大模型带来的性能提升显著,支持智慧城市管理、智慧社区管理、自然资源保护等场景。

    • 观澜大模型能够提升落地部署能力,加速AI工程化进程,降低对场景训练样本的依赖,并缩短从数据收集到算法部署的全过程。

    网址:

    https://ai.hikvision.com/


    小爱同学



    开发者:小米

    功能:

    • 全新的沉浸式交互体验,支持全屏浏览和自然连续的语音对话。

    • 新增的男声版小爱同学,提供不同的音色选择。

    • AI电话助理,能够在用户不便接听时识别通话内容并智能回复。

    • 语音订餐服务,一句话即可完成美食订购。

    • 智能语音输入,帮助用户快速输入各种信息。

    • 语音遥控器功能,将小爱同学作为电视遥控器使用。

    • 小爱捷径2.0,提供一键触达的便捷操作。

    • 语音找手机功能,帮助用户快速定位手机位置。

    亮点:

    • 小爱同学3.0版本实现了手机上的自然连续语音对话,用户可以一次唤醒后连续对话,并随时打断,让交互更自然流畅。

    • 支持用语音指令代替屏幕点击,提高了操作的便捷性。

    • 小爱同学大模型还提供了上网搜索并提炼回答的能力,能够提供高质量的答案并提炼要点,方便用户获取信息。

    网址:

    https://developers.xiaoai.mi.com/




    SUMMARY网易数帆



    开发者:网易

    功能:

    • 智能编程:通过分析用户在IDE中的上下文描述,实现自然语言生成低代码中的不同粒度和复杂度的可视化编程语言。

    • 智能设计:根据开发者提供的自然语言描述快速生成页面布局、主题风格、页面配图等。

    • 智能测试:通过对话形式实现接口和UI测试用例/测试场景的自动生成,测试异常的自动分析和纠正。

    • 智能运营:提高业务流程的自动化程度和效率,提升客户满意度,降低运营成本

    亮点:

    • 结合大模型微调和知识增强技术,降低实施交付成本,推动AIGC技术落地。

    • 玉言大模型曾获中文语言理解权威测评基准CLUE分类任务榜单冠军。

    • 利用知识增强技术和网易积累的业务开发个性化知识,帮助低代码开发者快速构建复杂的应用程序,减少重复性工作,提升开发效率 

    网址:

    https://sf.163.com/

    02创业新势力大模型

    Kimi



    开发者:月之暗面

    功能:

    • 多语言对话:擅长中文和英文的对话,能够理解和生成自然语言。

    • 长文本处理:支持最多20万字的输入和输出,适用于长文本写作、翻译和代码编写等任务。

    • 文件处理:能够读取和解析TXT、PDF、Word文档、PPT幻灯片和Excel电子表格等格式的文件。

    • 网页内容解析:用户发送网址或链接时,能够解析网页内容并结合这些内容回答问题。

    • 搜索能力:具备搜索能力,可以结合搜索结果为用户提供更好的回答。

    • 代码编写:能够提供完整的可执行代码,帮助用户解决编程问题。

    亮点:

    • 安全合规:遵守中华人民共和国的法律,拒绝涉及恐怖主义、种族歧视、黄色暴力、政治敏感等问题的回答。

    • 指令遵循:能够遵循用户的指令,提供有帮助的回复,完成用户指定的任务。

    • 角色扮演:能够根据用户的要求进行角色扮演,以适应不同的对话场景。

    • 个性化服务:用户可以通过特定的需求自定义Kimi模型(Kimi+功能)。

    网址:

    https://kimi.moonshot.cn/




    SUMMARY百小应

    开发者:百川智能公司

    功能:

    • 随时回答用户问题,速读文件、整理资料、辅助创作。

    • 具备多轮搜索、定向搜索等搜索能力,精准理解用户需求。

    • 通过提问帮助用户明确需求,给出精准答案。

    • 支持PDF、Word文档上传及网址输入,阅读并分析长篇内容。

    • 多模态能力,支持图片内容解读及语音交互

    亮点:

    • 基于Baichuan 4大模型,国内权威大模型评测机构SuperCLUE评测能力国内第一。

    • 融合搜索技术与大模型,具备懂搜索、会提问的能力。

    • 结构化呈现搜索结果,增加来源参考,优化信息布局。

    • 多模态交互,支持图片和语音输入

    网址:

    https://ying.baichuan-ai.com/chat


    智谱AI



    开发者:智谱AI公司

    功能:

    • 双语对话模型:支持中文和英文的问答和对话优化。

    • 代码生成:支持100余种编程语言,具备代码生成、续写、翻译、注释、bugfix等能力。

    • 图像生成:根据语言描述生成全新、独特又真实的高质量图片。

    • 多模态理解:理解图片实质属性、场景组成和画面风格的能力。

    • 个性化智能体定制:用户可以通过简单的提示词指令创建属于自己的智能体。

    亮点:

    • 智普AI大模型采用了独创的多阶段增强预训练方法,并针对中文问答和对话进行了优化。

    • 支持在消费级显卡上进行本地部署,用户可以在笔记本电脑上运行自己的ChatGLM。

    • 模型在不使用量化感知训练的情况下量化至INT4的精度,保证性能的同时,可以在多张RTX 3090(24G)显卡上进行快速推理

    • 智普AI大模型在多个权威通用能力评测中表现优异,如CMMLU、GAOKAO和AGI-Eval 。

    网址:

    https://www.zhipuai.cn/





    SUMMARYMiniMax



    开发者:海稀宇科技有限公司

    功能:

    • 逻辑推理、文本续写、文案生成、文本扩写、文本改写等文本处理能力。

    • 内容摘要、代码生成、知识检索等高级语言处理功能。

    • 声音大模型能力,适用于配音和音频交互场景。

    • 支持多轮记忆、信息提取、知识问答等。

    亮点:

    • 国内首个 MoE(Mixture-of-Experts)大语言模型,对标 OpenAI GPT-4。

    • 强大的多模态融合能力,适用于多种文本处理和交互场景。

    • 提供安全、灵活、可靠的API服务,助力企业和开发者快速搭建AI应用。

    • 拥有超大规模实验平台与超大规模推理平台,实现模型能力与用户交互量的极速增长。

    网址:

    https://www.minimaxi.com/


    紫东太初



    开发者:中国科学院自动化研究所联合武汉人工智能研究院和华为公司共同开发

    功能:

    • 音乐理解与生成

    • 三维场景导航

    • 信号理解

    • 多模态对话

    • 神经外科手术导航

    • 短视频内容审核

    • 法律咨询

    • 医疗多模态鉴别诊断

    • 交通违规图像研读

    亮点:

    • 紫东太初2.0是在1.0版本基础上升级的多模态大模型,加入了视频、信号、3D点云等模态数据,具备全模态理解、生成和关联能力。

    • 该模型以自动化所自研算法为核心,基于国产化基础软硬件平台昇腾AI,打造全栈国产化通用人工智能底座。

    • 紫东太初大模型已在多个领域展现出应用前景,包括医疗、法律、交通等,开始了一系列引领性、示范性应用。

    网址:

    https://taichu-web.ia.ac.cn/





    SUMMARY零一万物



    开发者:零一万物公司

    由国际AI专家李开复博士带队孵化。

    功能:

    • 通用聊天、问答、对话、写作、翻译等。

    • 200K上下文支持,适用于多文档阅读理解、超长知识库构建。

    • 多模态模型,支持文本、视觉多模态输入。

    亮点:

    • 200K上下文窗口支持,能够处理约30万个中英文字符,适合多篇文档内容理解、海量数据分析挖掘和跨领域知识融合。

    • 多模态模型Yi-VL-Plus在中文图表体验上超过GPT-4V,增强了对Charts, Table, Inforgraphics, Screenshot的识别能力。

    • 推理速度快,优化的API接口显著降低了模型回复的延迟。

    • 与OpenAI API兼容,实现平滑迁移。


    网址:

    https://platform.lingyiwanwu.com/


    4ParadigmSage(先知 AIOS 5.0)



    开发者:第四范式公司

    功能:

    • 行业大模型构建:通过自然语言交互方式辅助业务人员构建行业大模型。

    • 企业级模型纳管:集成新一代SageGPT大模型和企业级模型纳管平台Model Hub,支持模型构建、部署和管理。

    • 信创算力支持及性能优化:模型支持信创算力,使用大模型推理框架SLXLLM和推理加速卡SLX,显著提升推理性能。

    • 算法揭榜平台+人才网络:通过平台和人才网络提升行业模型应用价值和效率。

    • 多模态大模型:支持企业私有化部署,数据安全,无需调用外部大模型。

    • 知识库:融合知识图谱交叉验证生成内容,输出结果可溯源。

    • 企业级Copilot:具备执行可控和错误修正能力。

    • 思维链CoT:支持多步推理和复杂任务拆分。

    亮点:

    • 先知AIOS 5.0平台能够基于各行各业场景的X模态数据构建行业基座大模型,不局限于文本数据,可以处理包括水文数据、健康报告等在内的多种模态数据 

    • 提供了包括健康管理、水电设备管理、水务管理、声学等多个领域的大模型应用示例 

    • 支持企业构建针对核心业务痛点的场景大模型集合,实现行业战略效率提升 

    网址:

    http://webmanage.4paradigm.com/product/4ParadigmSage.html





    SUMMARY山海



    开发者:云知声智能科技股份有限公司

    国内AI语音领域的独角兽公司

    功能:

    山海大模型具备以下功能:

    • 通用能力:语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力。

    • 落地能力:插件扩展、领域增强、企业定制。

    • 行业应用:医疗专家、销售专家、知识管理专家、口语专家、智慧物联万能助理等。

    亮点:

    • 山海大模型是云知声AGI技术架构升级的重要里程碑,旨在打造MaaS模式的AI 2.0解决方案,提供更智能、更灵活的解决方案。

    • 云知声以山海大模型为基础,增强物联、医疗等行业能力,目标是年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT-4。

    • 山海大模型支持私有化部署,提供精简式回答以及回答依据溯源,帮助企业员工辅助理解内部专业技术文档。

    网址:

    https://shanhai.unisound.com/


    面壁智能



    开发者:面壁智能公司

    功能:

    面壁智能大模型具备以下功能:

    • 支持多语言能力和简易结构化输入输出。

    • 通过自研的高效微调技术,快速适配各种下游任务。

    • 支持问答、翻译、摘要、信息抽取、关系分析、情感分析等多种能力 

    • 面壁智能的“小钢炮” MiniCPM-V 2.6 模型支持实时视频理解、多图联合理解等端侧多模态核心能力 

    亮点:

    • 面壁智能的CPM系列基座模型升级为千亿参数大模型“面壁智能 CPM-Cricket”,在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2,与 GPT-4 相当 

    • MiniCPM-V 2.6 模型以小博大,实现端侧模型的高效率和低成本,量化后端侧内存仅占 6 GB,端侧推理速度高达 18 tokens/s 

    • 面壁智能发布首个“大模型+Agent” SaaS级产品ChatDev,推动软件开发革新 

    网址:

    https://modelbest.cn/





    SUMMARYMOSS



    开发者:复旦大学自然语言处理实验室邱锡鹏团队

    功能:

    MOSS是一个160亿参数的开源对话语言模型

    • 多轮对话能力。

    • 支持中英双语。

    • 能够使用多种插件,如搜索引擎、文生图、计算器、方程求解等。

    • 解方程、写代码、生成图片和回答道德伦理问题的能力。

    亮点:

    • 国内首个开放测试的类ChatGPT产品。

    • 支持在单张NVIDIA 3090显卡上运行(在精度要求不那么高的情况下)。

    • 开源地址在GitHub和Hugging Face上线,方便研究者和开发者使用。

    网址:

    https://github.com/OpenMOSS/MOSS


    孟子GPT


    开发者:澜舟科技


    功能:

    • 内容生成:撰写多种类型、题材的文章。

    • 语言理解:通过问答获取信息。

    • 知识问答:解答专业领域问题。

    • 推理、代码理解和生成:支持100多种编程语言。

    • 金融任务优化:专门针对金融领域进行深度训练和优化。

    亮点:

    • 实现类ChatGPT的对话能力,同时加入安全可控的功能引擎。

    • 支持不同参数量规模的迁移学习,按需投入资源进行训练。

    • 根据不同业务场景和用户需求进行对话效果定制,实现个性化服务。

    • 更好的融合行业数据、知识图谱和实时检索,构建行业大模型。

    网址:

    https://www.langboat.com/portal/mengzi-gpt




    SUMMARY中科闻歌雅意



    开发者:中科闻歌

    中国科学院孵化的人工智能公司,一家专注于认知与决策智能技术的公司

    功能:

    • 实时联网问答。

    • 领域知识问答。

    • 复杂场景信息抽取。

    • 多语言内容理解。

    • 多模态内容生成 此外,雅意2.0系列支持10余种主流语言,具备图文交互的多模态能力,并支持智能插件调用。

    亮点:

    • 拥有300亿参数,支持128k上下文窗口,相当于20万字文本处理。

    • 在中文知识问答和零样本中文信息抽取能力方面表现卓越,评测中排名第一。

    • 全系列模型开源,通过GitHub和Hugging Face免费申请商用。

    • 已在金融、法律、媒体、舆情、安全等多个领域落地应用。 

    网址:

    https://en.wengegroup.com/yayi/index.html


    悟道



    开发者:北京智源人工智能研究院


    功能:

    • 语言理解与生成:支持文本对话及多种语言类生成任务。

    • 多模态能力:结合视觉大模型,支持图文交互。

    • 代码生成:支持文本-代码生成模型。

    • 对话模型:支持类ChatGPT的对话能力。

    • 视觉大模型:包括图像内容的理解与生成。

    • 语言评测体系:构建开源大模型评测体系与开放平台。

    亮点:

    • 悟道3.0系列全面开源,包括语言大模型系列和视觉大模型系列。

    • 支持中英双语知识,符合国内数据合规要求。

    • 训练效率和性能优异,使用更小的数据集和更短的训练时间实现优秀性能。

    • 采用商用许可协议开源,推动大模型科研创新和产业落地。

    • 构建了大规模、高质量的中文语料库WuDaoCorpora2.0。

    网址:

    https://www.baai.ac.cn/portal/article/index/cid/49/id/518.html





    SUMMARYOm Al

    开发者:杭州联汇科技股份有限公司


    功能:

    • 图文向量化:将图像与文本信息转化为向量形式。

    • 大词表目标检测:对上千类目标物体进行识别及定位。

    • 开放目标检测:支持无限类目标物体的自定义识别。

    • 多模态大语言模型:结合语言和视觉信息,实现跨模态的深度融合

    亮点:

    • 专注于视觉语言场景,为AI应用开发提供全新范例。

    • 支持视觉推理、视觉描述、视觉对话等多模态理解和智能交互能力。

    • 已在零售、酒店、景区、政务等多个行业落地了数十种智能体应用,助力企业数字化转型

    网址:

    https://om.linker.cc/?_siteUrl=#/home


    奇智孔明AInnoGC



    开发者:创新奇智

    企业级AI解决方案供应商和领先的“AI+制造”解决方案供应商。

    功能:

    • 工业大模型AInno-15B:拥有150+亿参数量,专为工业场景设计的垂类大模型,通过预训练、指令微调和人类反馈强化学习获得,具有行业化、轻量化、多模态的特点。

    • 大模型服务引擎:作为企业专属大模型生产和应用管线,提供指令数据、模型精调、模型服务、提示工程等功能与服务,加速生成式AI应用开发、调试、部署、落地。

    • ChatX系列应用:

      • ChatRobot:生成式工业机器人任务编排应用,实现自然语言到机器语言的转化。

      • ChatBI:生成式企业私域数据分析应用,具备SQL生成能力和交互式可视化报表生成。

      • ChatDoc:生成式企业私域知识问答应用,能够从海量文档中筛选、定位并精准概括信息。

    亮点:

    • 结合创新奇智在制造业领域的丰富经验,AInnoGC产品矩阵旨在进一步赋能制造业,提供从感知到分析到决策生成的完整AI技术能力。

    • 通过大模型服务引擎,企业可以打造自有大模型,加速AI应用的开发和落地。

    • 产品矩阵的推出标志着创新奇智从AI1.0进化到AI2.0,实现技术双塔布局




    SUMMARY从容

    开发者:云从科技

    国内首家登陆科创板的AI平台公司

    功能:

    • 问答、伴随和托管三种交互方式。

    • 支持文章生成、代码编辑、俗语解释等。

    • 能够理解和生成自然语言,提供参考资料来源的标注。

    • 应用于金融、政务、教育、医疗、文娱等多个行业领域。

    亮点:

    • 从容大模型在问答、编程、写作、多语言和多模态等方面表现出色,提供个性化服务。

    • 具备上下文学习能力,实现更好的交互性,尤其在金融、游戏等交互场景中,多轮对话技术得到有效应用。

    • 已经在多个关键领域成功落地,展现AI技术深刻改变工作模式和生活体验的潜力 

    网址:

    https://maas.cloudwalk.com/web/#/login


    赤兔



    开发者:容联云

    聚焦企业营销&服务场景的数智化经营解决方案提供商

    功能:

    • AI基础能力:上下文意图、情感识别、实体识别、信息抽取等。

    • 会话洞察:对沟通记录进行智能标记、主动分析,提升客服与营销的效能。

    • 对话能力:基于大模型的丰富参数和内容生成能力,支持个性化问答回复。

    • 人机协同:利用大模型做AI助手的工程化设计,辅助坐席更好、更高效地完成业务 

    亮点:

    • 重构智能客服和数智化营销价值,赋能沟通智能2.0时代。

    • 取得良好的交互式数值理解、分析能力,为营销数据分析等场景提供更加自然、智能的交互式服务。

    • 容联云AI团队在AIGC关键技术的研发上取得多个权威竞赛和评测榜单的优异成绩,相关技术已转化到赤兔大模型中 

    网址:

     https://www.yuntongxun.com/chitu




    你觉得哪款AI大模型最好用?

    欢迎留言告诉我们~

    若有遗漏

    欢迎补充~

    往期推荐
    1

    《2024汽车AI大模型TOP10分析报告》(可下载)

    2

    《行业大模型调研报告》(可下载)

    3

    《工业大模型应用报告》重磅发布(可下载)

    4

      2024中国AI大模型产业发展报告(可下载)

    『制造前沿』还整理了很多大模型相关研报资料

    可扫描下方二维码,前往知识星球下载

    『制造前沿』知识星球已开通

    每日持续更新

    随时随地查看

    ↓↓


    为了能按时收到『制造前沿』的推送,辛苦各位看完文章后在文未点一下【在看】,这样我们就能出现在您的常读订阅号列表里,为您第一时间带来最新资讯。

    更多资料下载

    点击下方图片

    # 免责声明 #

    来源: 制造前沿,本公众号所载文章为本公众号原创或根据网络搜索下载编辑整理,文章版权归原作者所有,仅供读者学习、参考,禁止用于商业用途。因转载众多,无法找到真正来源,如标错来源,或因文中所使用的图片、文字、链接等如有侵权,请联系我们删除,谢谢!




    继续滑动看下一个
    制造前沿
    向上滑动看下一个

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存