DeepSeek与主流AI模型对比评测」的摘要信息

最近几天,中国低成本大语言模型深度求索(DeepSeek)欧美AI圈引起了不小的震动。据悉,来自杭州的初创企业深度求索1月20日发布DeepSeek-R1,该模型在测试表现、训练成本和开源开放程度等多个基准测试中均超越“ChatGPT之父”美国OpenAI公司的最新模型o1,但成本仅为o1的三十分之一。 纽约时报报道称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。 这一消息激起投资者的恐慌情绪,纷纷抛售美国科技股,导致美国人工智能巨头英伟达股价在1月27日暴跌近16%,市值蒸发近6000亿美元。 那么,这款AI大语言模型究竟实力如何?与其他AI聊天机器人相比又有哪些优势和差异?接下来,我对相关产品进行了一些简单的评测。 一、自然语言生成测试 评估目标是测试AI是否能够提供富有创意的答案,尤其是对于开放性问题。 我先测试了一个很简单的例子:“仿照《权力的游戏》里丹妮莉丝·坦格利安的称号,编一个特朗普的称号”。 DeepSeek R1给出的答案是: 唐纳德·特朗普 推特风暴之王,高墙铸造者,七海关税之主; 不羁金发的咆哮者,破产与复兴的凤凰,红领带之怒; 弹劾浪潮中的幸存者,诉讼迷宫中的舞者,真相的弹性诠释者; 自由世界的退群者,高尔夫球场领主,玛阿拉歌冬宫守护者。 ChatGPT给出的答案是: 美国的救世主,墙之建造者; 商业帝国之王,民众的声音; 白宫的统治者,现实之破坏者; 大国之骄傲,外交之火焰; 推特的君王,全球的震撼者。 从语言的艺术性、现实性、以及中文环境的语感上看,在这个问题上,DeepSeek在中文环境下的确比ChatGPT要胜出一筹。 于是我又测试的另一个题目:“使用一些口诀来总结罗斯的七个鲜见义务” DeepSeek R1给出的答案是: 忠...