GPT4、百度文心一言、讯飞星火、360智脑：谁更懂数据分析？

前面考察了几个大语言模型写高考作文的能力，文章见链接：《GPT作文能力比拼：GPT3.5、GPT4、百度文心一言、讯飞星火》

今天让他们做一个关于房价预测的数据分析题，和一道简单的24点计算题目，看看他们的智能程度。

参赛选手分别是：GPT3.5、 GPT4，百度文心一言、讯飞星火、360智脑。

分析一下这批数据，井根据数据预测2023年的月度数据。

将以上图片的通过OCR识别出文本，输入到大语言模型，看看各自语言模型是否能识别出这是一组数据，数据有两列，分别是【年月】、【

商品房销售额_当月值全国(亿元）

】。

下面是提示词：

分析一下这批数据，井根据数据预测2023年的月度数据。商品房销售额_当月值全国(亿元）2005-08 2005-09 1285.93 2005-10 1612.59 2005-11 1504.25 2005-12 3650.16 2006-02 2006-03 1310.77 2006-041422.65 2006-05 1654.69 2006-06 1687.44 2006-07 1482.6 2006-08 1430.64 2006-09 1544.62 2006-10 1637.83 2006-11 2088.19 2006-12 4368.32 2007-02 2007-03 1802.85 2007-04 1946.57 2007-05 2062.43 2007-06 2583.08 2007-07 2499.61 2007-08 2677.9 2007-09 2864.43 2007-10 2602.18 2007-11 2715.69 2007-12 5601.23 2008-02 2008-03 1941.22 2008-04 1808.82 2008-05 1932.452008-06 2488.19 2008-07 1895.74 2008-08 1592.27 2008-09 2065.09 2008-10 1711.5 2008-11 1671.16 2008-12 4810.22 2009-02 2009-03 2661.66 2009-04 2937.28 2009-05 3393 2009-06 4410.652009-07 3800.02 2009-08 3864.15 2009-09 4068.15 2009-10 3997.23 2009-11 4458 2009-12 8007.42 2010-02 2010-03 3861.06 2010-04 4448.44 2010-05 3334.95 2010-06 4059.66 2010-07 3065.84 2010-08 3532.55 2010-09 5498.34 2010-10 5075.6965 2010-11 5285.6124 2010-12 10200.8349 2011-02 2011-03 4910.3001 2011-04 3925.8176 2011-05 4542.3699 2011-06 5969.3198 2011-07 4262.6903 2011-08 4412.2911 2011-09 6047.1417 2011-10 4514.6993 2011-11 5220.6231 2011-12 10072.2263 2012-02 2012-03 4527.4436 2012-04 3749.0627 2012-05 4511.0704 2012-06 6381.8784 2012-07 5385,4377 2012-08 5311.6321 2012-09 6342.561 2012-10 5947.0909 2012-11 7225.1754 2012-12 10929.8514 2013-02 2013-03 6630.2951 2013-04 5855.5575 2013-05 6016.792 2013-06 7512.42872013-07 6172.4362 2013-08 6175.1417 2013-09 8304.1469 2013-10 7209.5014 2013-11 8708.3629 2013-12 11482.2887 2014-02 2014-03 6172.5394 2014-04 5043.6037 2014-05 5367.0786 2014-06 7459.1705 2014-07 5182.3244 2014-08 5345.8709 2014-09 7565.9972 2014-10 7157.924 2014-11 8095.6543 2014-12 11811.826 2015-02 2015-03 6050.7876 2015-04 5715.6464 2015-05 6669.894 2015-06 9850.5908 2015-07 6911.5538 2015-08 6870.8021 2015-09 8703,4371 2015-10 8044.772 2015-11 9732.4163 2015-12 12758.6492 2016-02 2016-03 9947.4532 2016-04 9131.3877 2016-05 9119.84132016-06 11906.8565 2016-07 8886.6974 2016-08 9053.9298 2016-09 13585.1795 2016-10 11273.9635 2016-11 11020.5529 2016-12 15124.3263 2017-02 2017-03 12376.717 2017-04 10040.3612 2017-05 10409.1144 2017-06 15520.1006 2017-07 9309.5341 2017-08 9634.2285 2017-09 13807.9419 2017-10 11086.8093 2017-11 12490.2551 2017-12 18220.7085 2018-02 2018-03 13143.5348 2018-04 10625.2979 2018-05 12555.0888 2018-06 18167.659 2018-07 11354.9193 2018-08 11095.8636 2018-09 14736.2188 2018-10 11781.4403 2018-11 13594.4241 2018-12 20464.6418 2019-02 2019-03 14235.42612019-04 12102:1034 2019-05 12631.9567 2019-06 18925.2292 2019-07 12464.2893 2019-08 12210.6015 2019-09 16118.3356 2019-10 12925.9598 2019-11 14588.5334 2019-12 20719.3441 2020-02；020-03 12161.3928 2020-04 11498.2282 2020-05 14406.3898 2020-06 20625.0888 2020-07 14527.4609 2020-08 15520.5098 2020-09 18704.7502 2020-10 16017.7975 2020-11 17303.6463 2020-1224643.9253 2021-02 2021-03 19227.0543 2021-04 15231.3605 2021-05 16924.5452 2021-06 22397.6093 2021-07 13499.1176 2021-08 12616.4378 2021-09 15748,0665 2021-10 12389.7274 2021-11 14482.0459 2021-12 20263.2468 2022-02 2022-03 14195,.9223 2022-04 8134.8046 2022-05 10547,.2016 2022-06 17735.7778 2022-07 9690.6175 2022-08 10106.5186 2022-09 13510.:762 2022-10.9452.5258 2022-11 9815.3759 2022-12 14660.2434

GPT3.5 数据分析结果：

题目二：计算24点

再来一道计算24点的题目，看看简单的计算能力：

一次做对：(8-2) x (5-1) = 6 x 4 = 24

GPT4 数据分析结果：

根据这批2005年至2022年的商品房销售额数据，我们可以大致观察到以下趋势：

商品房销售额整体呈上升趋势，尤其是在2009年后，销售额明显增长较快。
商品房销售额具有季节性波动，通常在每年的第二季度和第四季度较高，第一季度和第三季度较低。
商品房销售额在每年的2月份数据缺失，可能是由于春节假期的影响。

为预测2023年的月度数据，我们可以通过时间序列分析对这批数据进行建模。这里我们使用简单的线性回归模型进行预测。首先，我们需要将时间序列数据中的月份转换为数字，从2005年8月开始计算。

接下来，我们使用线性回归模型进行拟合：

import numpy as np

import pandas as pd

from sklearn.linear_model import LinearRegression


# 将时间序列数据转换为 DataFrame

data = [...] # 将数据粘贴到这里

df = pd.DataFrame(data, columns=['date', 'sales'])


# 将日期转换为数字（从2005年8月开始计算）

df['month_number'] = (df['date'].dt.year - 2005) * 12 + df['date'].dt.month - 8


# 拟合线性回归模型

X = df[['month_number']]

y = df['sales']

model = LinearRegression().fit(X, y)


# 预测2023年的月度数据

pred_month_numbers = np.array(range(217, 229)).reshape(-1, 1)

pred_sales = model.predict(pred_month_numbers)


# 输出预测结果

for month_number, sale in zip(pred_month_numbers, pred_sales):

 print(f"{month_number}: {sale:.2f}")

运行上述代码后，我们得到2023年的月度商品房销售额预测如下（单位：亿元）：

2023-01: 22170.12
2023-02: 22343.90
2023-03: 22517.69
2023-04: 22691.47
2023-05: 22865.26
2023-06: 23039.04
2023-07: 23212.83
2023-08: 23386.61
2023-09: 23560.40
2023-10: 23734.18
2023-11: 23907.97
2023-12: 24081.75

请注意，这仅是一个简单的线性回归预测，实际情况可能会受到许多因素的影响，如政策调整、市场需求变化等。为了获得更准确的预测结果，可以尝试使用更复杂的时间序列模型，如ARIMA、LSTM等。

题目二：计算24点

第一次答题错误，经过2轮的提醒，最终给出了正确答案。

讯飞星火数据分析结果：

网址：xinghuo.xfyun.cn

你提供的数据看起来像是某个时间段内的商品房销售额数据，但是没有给出具体的时间范围和单位。如果你能提供更多的信息，我会很乐意帮助你分析这些数据。

不过，从你给出的数据来看，我们可以计算出每个月的平均销售额：

python复制代码

import pandas 
as pd




data = {
'2005-02': 
1285.69, 
'2005-03': 
1347.59, 
'2005-04': 
1466.87, ...} 
# 这里省略了部分数据

df = pd.DataFrame(data)




monthly_average = df.mean(axis=
1)


print(monthly_average)

输出结果为：

复制代码

2005-02 1285.69

2005-03 1347.59

2005-04 1466.87

......

2022-11 9815.3759

2022-12 14660.2434

dtype:float64

这个结果表示在2005年到2022年之间，每个月的商品房销售额的平均值。

题目二：计算24点

计算不对，再给一次机会：

最终，讯飞星火的计算24点的题目，无法完成任务。

百度文心一言数据分析结果：

题目二：计算24点

360智脑数据分析结果：

题目一：

题目二：计算24点

给了两次机会，都没有做对。

(1*5+8)*2=30

(1*8+5)*2=36

（5-1）82-24

综合比较

：

对比这五个大语言模型的表现，首先是房价预测题目：

语言模型	现有数据分析	预测方法提示	预测数据计算
GPT3.5	有	有	有
GPT4	有	有	有
百度文心一言	有	有	无
讯飞星火‍	无	无	无
360智脑	有	有	无

第二个是计算24点的题目：

语言模型	题目理解	计算过程	结果显示
GPT3.5	能理解	正确	正确
GPT4	能理解	经提示后正确	正确
百度文心一言	能理解	正确十种解法	十种解法都正确
讯飞星火‍	能理解	错误	错误
360智脑	能理解	错误	错误

综合来看，GPT4给出了房价走势的预测方法和结论，采用简单的线性回归模型进行预测，预测结果自然就比较简单，呈现一个逐月上升的线性递增。没想到的是，在计算24点这个题目上，GPT4居然翻车了，第一次回答错误；后来给出两轮提醒，终于GPT4给出了正确的算式和结果。

GPT3.5

，在房价预测和24点计算方面，均表现不错。房价预测，可以考虑多种变量对房价的影响，譬如季节变化等因素，预测的结果也相对比GPT4的简单线性预测更贴近实际。24点的技术，则很快给出了一种解法和正确答案。

百度文心一言在算24点这个题目上稳操胜券，超出预期，有些惊喜，给出10种解法。预测房价走势的题目上，文心一言给出的分析思路算是不错，可惜没有继续给出计算的结果。

讯飞星火

，在房价预测和计算24点的题目方面，表现不佳，题目给出的数据是有月份和数值、单位的，但是星火没有识别出来。24点的计算，同样给了多次机会，没有计算出来。

360智脑，

对于房价预测，比较精炼，给出思路，没有过程和结果计算。24点的计算题目，同样无法给出正确的算式和结果。

房价预测能力从高到低排序依次是：

GPT3.5、GPT4、百度文心一言、360智脑、讯飞星火。

计算24点能力从高到低排序依次是：

百度文心一言、GPT3.5、GPT4；讯飞星火和360智脑都有待提升。

==========

欢迎留言，对以上四个大语言模型的数据分析能力给出自己的评价。

如果你对ChatGPT在工作和生活中的应用感兴趣，欢迎加我微信，邀请进群一起探讨学习如何用好ChatGPT。

加好友注明自己的真实身份：昵称（姓名）- 城市 - 职业（专业）

=======================

公众号：BLUES，已经持续更新了10年的公众号。20年丰富的职场经历，历经连续创业、腾讯、YY语音、迅雷等公司。目前致力于“教育+科技”产品创造，深圳梅沙科技合伙人。700多篇文章写互联网产品经理职业发展，企业管理，洞察职场与人生，欢迎大家留言交流。

继续阅读

阅读原文