国产AI大模型黑马:KimiChat
00 分钟
2024-3-13
2024-5-1
type
status
title
summary
slug
Created
Mar 13, 2024 03:39 PM
category
tags
Date
icon
password
在继百度文心一言阿里通义千问之后,国产AI大模型终于又杀出了一匹黑马,他就是月之暗面旗下的KimiChat,也叫Kimi智能助手。
 
这是AI产品榜统计的一份排名,可以看到Kimi虽然全球排名13,但是涨势喜人,相信要不了多久就会冲上前10
notion image
 
KimiChat是如何在目前竞争异常激烈的AI市场脱颖而出呢?这是因为他走了一条长上下文的道路。
 
KimiChat在2023年10月第一次发布时,就已经支持约20万汉字无损上下文输入,已经是当时的第一梯队,而在2024年3月18日的时候,已经从原来的20万汉字扩展到了200万汉字,整整扩大了10倍,简单提升了一个阶级(目前还在内测中)!
 
一、为什么KimiChat要攻坚长上下文?
这是因为长上下文是大模型领域最关键的技术之一。以往的大模型在处理问题时常常会出现“中间迷失”的现象,即在回答时会忽视长文本中的细节部分和缺乏对于上文的全面理解。
 
简单来说,拥有长上下文的AI模型,它能记住更多之前你问的东西,也就是他会更了解你这个人,这样在下一次回答的时候,就能根据之前的记录做出更适合的回答。
 
我们日常跟别人的沟通其实也是这样,当你与一个人聊得越多,他就会掌握更多关于你的信息,这样跟你聊天的时候也就会更顺畅,聊天的体验也会更好。
 
所以KimiChat攻坚长上下文其实是一个更长远的考虑,因为一个拥有更长上下文的AI模型,必定能提高用户的提问体验,增强对话的连贯性,用户的黏性也会更高!
 
二、KimiChat的长上下文现在处于什么地位?
为了看看KimiChat的实力,我这里以百度文心一言、阿里通义千问和ChatGPT4做一个简单的对比
 
首先是文心一言,目前在他的文档中并没有看到很明显的关于上下文数量的说明,只看到输入、输出长度的限制,从这一点看,KimiChat是优于文心一言的
notion image
 
其次是阿里通义千问,目前在其官方博客上看到,阿里开发了5种不同大小的模型,其中4种已开源,目前最长的上下文达到32K,比KimiChat的第一版还小得多。
notion image
 
最后是ChatGPT4,目前最大是支持到128K,而且还要付费
notion image
 
从长下文的角度,KimiChat确实可以吊打一众对手了,不过AI模型的好用与否,也不单单看上下文,还有很多因素决定。
 
三、KimiChat为什么这么厉害?
可能有些人会觉得都没听过月之暗面这个公司,为什么他研发出来的AI模型这么厉害?
 
月之暗面 (Moonshot AI) 虽然创立于2023年3月,但是他的创始人杨植麟在AI圈却是赫赫有名,人家虽然是个90后(长的也帅),但是本科毕业于清华大学计算机系师从清华教授唐杰。在计算机系就读期间,杨植麟以满分成绩通过所有程序设计课程。
 
2015年,他以年级第一的成绩毕业,随后远赴CMU(卡内基梅隆大学)语言技术研究所,跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。
 
相信大家都看过这张图片
notion image
注:杨植麟与Ruslan Salakhutdinov(右一)、William Cohen(左一)合影
 
在CUM就读期间,杨植麟不仅和图灵奖得主、深度学习三巨头之一Yoshua Bengio合作发布HotpotQA数据集,还以一作身份,发表XLNetTransformer-XL工作,前者成为NeurIPS 2019ACL 2019的最高引论文之一。
 
在腾讯新闻对杨植麟的访问也提到,杨植麟是如何吸引这些大佬与其合作的?答案很简单,就是共赢
notion image
 
除了创始人很厉害,KimiChat的联合创始人周昕宇、张宇韬同样也不容小觑,在其官方介绍中提到,其核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。
 
妥妥就是AI领域的尖刀连!
 
我其实挺早前就听说过KimiChat,当时吸引我的并不是他的长下文,而是月之暗面这个名称,因为起的很特别,我也一下子就记住了。后面读了腾讯新闻的访谈,感觉杨植麟大佬的愿景应该挺宏大,在访谈中也多次提到登月计划(moonshot),猜测是想在AI领域中创造出像第一次登月那样的成就吧,不过他确实也有这个实力。
 
四、KimiChat的体验如何?
在KimiChat火爆之前,我简单体验过ChatGPTGeminiPoeClaude文心一言DeepAI阿里通义千问Coze讯飞星火这九款工具,其中给我体验最好的就是KimiChat和DeepAI,当然我这里说的体验更多是在使用层面,并不是回答的准确性上(因为这个需要做比较多的测试)
 
像国外的AI模型,对国人其实是不太友好的,访问都需要费一番力气,而其中印象最深刻的当属Claude,登录进去之后账号就被封了。
 
KimiChat的设计非常简单直接,只需登录之后就可以使用,而且手机版和网页版也是同步的(目前是免费的)
notion image
 
而DeepAI就更直接,甚至不需要登录就可以体验
notion image
 
就目前KimiChat的使用场景,我目前最常用的就是文章总结,只需发下视频链接,或者文章链接,就可以得到一篇简短的总结,简直不要太爽
notion image
 
对于一些学术圈的朋友,KimiChat也是一个不错的利器,可以帮你对论文进行总结,方便你快速筛选。KimiChat的使用场景还有很多,有机会的话再单独出一篇说明。
 
总的来说,我还是挺看好月之暗面这家公司的,不管是从团队成员实力,融资情况,还是目前的产品体验,希望能越做越好,成为国内AI领域的领头羊!
 
 
我是AI技术巫,欢迎关注我,掌握第一手AI资讯与技巧!
notion image