原本想开发一个软件,就是一次性问多个大模型(或者说给大模型们拉个群,让他们畅聊),看他们分别怎么回答。但仔细用了发现,必要性不大,基本上不会有人付费,只需要浏览器同时开多个应用的网页就好了。
测试过很多问题,但这个问题还是有一点代表性,发出来大家批判一下。
即:
微信公众号、头条、百家号、搜狐等,各个平台的推荐机制,是不是大同小异?
这是个非常简单,而且不太需要追问的问题,一次成型。来看看各家分别是怎么回答的。
一、ChatGPT
ChatGPT的特点是稳,能很好的讲清楚细节,不足之处是,相对而言,中文语料库不够丰富,所以还是稳。
二、百度文心一言
百度的4.0是要收费的,所以用的3.5的。没有每个平台去分析,只是说了相同的地方,和不同的地方。但在搜狐的表达上,是有所偏差的,在自己公司的百家号针对权威性这个部分,有讲到点上。
百度只开放3.5的话,还是太自信。好像是目前唯一开始对C端收费的大模型,同时也是第一退队里面,整体效果最差的一个。
三、智谱清言
智谱日常的整体表现,时好时坏。可能因为做了多模态,比较分心。在本次的回答上,重点把几个不同的维度,都整理出来了。相对来说,按平台一般关注的权重,进行了排序。
回答可用。
四、通义千问
通义更懂商业。
尤其是提到了搜狐的SEO策略,的确在百度搜索引擎中,搜狐相对的内容排名,一般仅次于百家号。
五、KIMI
KIMI之前火透了半边天。
KIMI整体的回答,的确是有很强的逻辑性。
首先是明确标注了自己的数据来源,一共12篇资料;
其次是有几个点,是其他平台不知道的。一个是微信打开了公域的推荐机制,虽然这是半年前的事情了;另一个是头条的一级和二级流量;还有就是百度的搜索+信息流双引擎,以及作弊处罚。
六、总结
目前,国内的几个大模型,在文字领域,我们多次体验的结果是,相对于ChatGPT的差距在缩小,在部分中文领域,应该还更强了。因为算法、算力、算料,三个层面。我们至少算料是足的、电也是丰富的。
整体的体感是,作为基础办公。KIMI和通义是首选,智谱和文心作为补充,其余的天工、星火、混元、百川、豆包……等等,都还比较初级。
希望对你有用!
如果你也希望用大模型来创作,欢迎下载牛片APP,或者到牛片网找客服,我们一起交流。
评论列表 (0条)