import pandas as pd
import numpy as np
from scipy import stats
import plotly.express as px
import mytools大学生对待AI作品态度的影响因素分析
研究方法
  df1 = pd.read_excel(R"data\AI作品态度.xlsx")解释性研究是关于现象或事物之间因果关系的研究。解释性研究是在描述性研究的基础上,进一步探寻“为什么”。解释性研究要在描述性研究的基础上对变量之间的关系进行分析,以确定它们之间是否存在相关,并进而判断它们之间是否存在因果关系。
在定量研究方法中,解释性研究通常是首先提出研究假设,然后从理论假设出发,设计出调查方案(收集资料的方案)并采用各种调查方法去收集经验材料,最后通过对资料的分析来验证假设,达到对社会现象进行理论解释的目的。
明确数据分析目标
本案例属于解释性研究。
研究假设:批判性思维能力越强,对待ai作品的态度越积极。 原假设:批判性思维能力与对待ai作品的态度无关。
数据获取
时间、渠道、数量、抽样方法
数据清理
### 空白值处理
temp = df1[df1.isnull().T.any()]
temp| 序号 | 提交答卷时间 | 所用时间 | 来源 | 来源详情 | 来自IP | 1、Al作品与人类作品您认为是否有区别? | 2、请问以下哪个图是AI绘图形成: | 3、以下哪张图是传统绘画作品 | 4、你是否喜欢绘画? | ... | 15、你认为事实和立场,哪个更重要? | 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | 22、对于新事物,我喜欢去尝试和体验 | 23、请问您是否觉得此问卷有不足的地方或建议 | 总分 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 1 | 2022/11/21 21:39:19 | 233秒 | 微信 | NaN | 117.191.176.254(新疆-伊犁) | 有区别,人类作品能感受到创作情感。 | 图2 | 图1 | 从来不画画 | ... | 不知道,这个要看具体事情吧 | 62 | 79 | 39 | 38 | 50 | 66 | 80 | 无 | 414 | 
| 1 | 2 | 2022/11/21 21:46:40 | 50秒 | 微信 | NaN | 14.134.101.116(宁夏-固原) | 有区别,人类作品能感受到创作情感。 | 图2 | 图1 | 从来不画画 | ... | 事实 | 35 | 54 | 21 | 58 | 46 | 94 | 36 | (空) | 344 | 
| 2 | 3 | 2022/11/21 21:47:12 | 45秒 | 微信 | NaN | 210.26.15.148(甘肃-兰州) | 有区别,人类作品能感受到创作情感。 | 看不出来 | 图1 | 从来不画画 | ... | 不知道,这个要看具体事情吧 | 22 | 40 | 65 | 5 | 39 | 86 | 39 | 无 | 296 | 
| 3 | 4 | 2022/11/21 21:47:34 | 90秒 | 微信 | NaN | 42.93.105.122(甘肃-定西) | 有区别,人类作品能感受到创作情感。 | 看不出来 | 看不出来 | 从来不画画 | ... | 事实 | 33 | 64 | 48 | 63 | 45 | 52 | 79 | 无 | 384 | 
| 4 | 5 | 2022/11/21 21:48:47 | 49秒 | 微信 | NaN | 42.88.207.8(甘肃-武威) | 有区别,人类作品能感受到创作情感。 | 都不是 | 都是 | 从来不画画 | ... | 事实大于立场 | 83 | 50 | 50 | 41 | 28 | 68 | 66 | (空) | 386 | 
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | 
| 118 | 119 | 2022/11/24 21:58:36 | 259秒 | 微信 | NaN | 61.178.223.212(甘肃-兰州) | 有区别,人类作品能感受到创作情感。 | 都不是 | 图2 | 平时都不会画,除非有工作或学习上的要求 | ... | 事实和立场各占一半 | 57 | 14 | 13 | 52 | 89 | 65 | 89 | 无 | 379 | 
| 119 | 120 | 2022/11/25 12:43:34 | 180秒 | 微信 | NaN | 39.161.242.37(江西-南昌) | 有区别,人类作品能感受到创作情感。 | 图1 | 图2 | 还行,偶尔画画 | ... | 事实和立场各占一半 | 43 | 81 | 24 | 62 | 62 | 64 | 53 | (空) | 389 | 
| 141 | 142 | 2022/11/25 20:19:40 | 179秒 | 微信 | NaN | 110.185.95.191(四川-成都) | 有区别,人类作品能感受到创作情感。 | 看不出来 | 看不出来 | 从来不画画 | ... | 不知道,这个要看具体事情吧 | 34 | 100 | 77 | 100 | 77 | 56 | 54 | (空) | 498 | 
| 144 | 145 | 2022/11/25 20:38:00 | 310秒 | 微信 | NaN | 112.4.255.167(江苏-镇江) | 有区别,人类作品能感受到创作情感。 | 图1 | 都是 | 还行,偶尔画画 | ... | 不知道,这个要看具体事情吧 | 20 | 82 | 39 | 22 | 51 | 49 | 82 | (空) | 345 | 
| 149 | 150 | 2022/11/28 22:03:35 | 111秒 | 微信 | NaN | 36.142.173.157(甘肃-临夏) | 有区别,人类作品能感受到创作情感。 | 图2 | 图1 | 还行,偶尔画画 | ... | 事实大于立场 | 57 | 48 | 74 | 46 | 52 | 52 | 80 | (空) | 409 | 
103 rows × 30 columns
### 删除空值列——来源详情
df2 = df1.drop(columns="来源详情")
"""再次查看空白列"""
temp = df2[df2.isnull().T.any()]
temp| 序号 | 提交答卷时间 | 所用时间 | 来源 | 来自IP | 1、Al作品与人类作品您认为是否有区别? | 2、请问以下哪个图是AI绘图形成: | 3、以下哪张图是传统绘画作品 | 4、你是否喜欢绘画? | 5、你是否了解AI(创作)? | ... | 15、你认为事实和立场,哪个更重要? | 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | 22、对于新事物,我喜欢去尝试和体验 | 23、请问您是否觉得此问卷有不足的地方或建议 | 总分 | 
|---|
0 rows × 29 columns
## 查看重复值
df2[df2.duplicated(subset=['来自IP'],keep='first')][['来自IP']]| 来自IP | |
|---|---|
| 55 | 61.178.223.214(甘肃-兰州) | 
| 62 | 112.49.214.250(福建-福州) | 
| 95 | 61.178.223.214(甘肃-兰州) | 
# 删除重复值
df3 = df2.drop_duplicates(subset=['来自IP'],keep='first')# 查看变量类型
df3.dtypes.to_frame()| 0 | |
|---|---|
| 序号 | int64 | 
| 提交答卷时间 | object | 
| 所用时间 | object | 
| 来源 | object | 
| 来自IP | object | 
| 1、Al作品与人类作品您认为是否有区别? | object | 
| 2、请问以下哪个图是AI绘图形成: | object | 
| 3、以下哪张图是传统绘画作品 | object | 
| 4、你是否喜欢绘画? | object | 
| 5、你是否了解AI(创作)? | object | 
| 6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中? | object | 
| 7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选) | object | 
| 8、请问你认为借助AI创作出的作品可以被称为艺术品吗? | object | 
| 9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品? | object | 
| 10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗? | object | 
| 11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看? | object | 
| 12、你认为AI的发展会对绘画行业造成多大影响 | object | 
| 13、面对某一件事情,你更在乎过程还是结果? | object | 
| 14、对某一件事情的看法,你认为你更多的是出于理性还是感性? | object | 
| 15、你认为事实和立场,哪个更重要? | object | 
| 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | int64 | 
| 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | int64 | 
| 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | int64 | 
| 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | int64 | 
| 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | int64 | 
| 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | int64 | 
| 22、对于新事物,我喜欢去尝试和体验 | int64 | 
| 23、请问您是否觉得此问卷有不足的地方或建议 | object | 
| 总分 | int64 | 
| 填写问卷时长 | object | 
### 必要的数据转换
df3['填写问卷时长'] = df3['所用时间'].str.rstrip('秒')# 指定变量的类型
df4 = df3.astype({
    '提交答卷时间': 'datetime64[ns]',
    '所用时间': 'string',
    '填写问卷时长': 'int',
    '来源': 'string',
    '来自IP': 'string',
    '1、Al作品与人类作品您认为是否有区别?': 'category',
    '2、请问以下哪个图是AI绘图形成:': 'category',
    '3、以下哪张图是传统绘画作品': 'category',
    '4、你是否喜欢绘画?': 'category',
    '5、你是否了解AI(创作)?': 'category',
    '6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中?': 'category',
    '7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选)': 'string',
    '8、请问你认为借助AI创作出的作品可以被称为艺术品吗?': 'category',
    '9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?': 'category',
    '10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗?': 'category',
    '11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看?': 'category',
    '12、你认为AI的发展会对绘画行业造成多大影响': 'category',
    '13、面对某一件事情,你更在乎过程还是结果?': 'category',
    '14、对某一件事情的看法,你认为你更多的是出于理性还是感性?': 'category',
    '15、你认为事实和立场,哪个更重要?': 'category',
})
df4.dtypes.to_frame()| 0 | |
|---|---|
| 序号 | int64 | 
| 提交答卷时间 | datetime64[ns] | 
| 所用时间 | string | 
| 来源 | string | 
| 来自IP | string | 
| 1、Al作品与人类作品您认为是否有区别? | category | 
| 2、请问以下哪个图是AI绘图形成: | category | 
| 3、以下哪张图是传统绘画作品 | category | 
| 4、你是否喜欢绘画? | category | 
| 5、你是否了解AI(创作)? | category | 
| 6、如果你会使用AI绘图,你是否想要将其应用到你的生活和工作之中? | category | 
| 7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选) | string | 
| 8、请问你认为借助AI创作出的作品可以被称为艺术品吗? | category | 
| 9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品? | category | 
| 10、在今年美国科罗拉多轴博览会艺术比赛中的数字类别中,39岁游戏设计师JasonAllen的作品夺得头奖。这副画作是他使用AI绘图工具完成的,这引来了不少来自人类艺术家的指责。如果是你,你会支持JasonAllen吗? | category | 
| 11、“Al的产生到底是为了方便人的生产激发人的创造力,还是要践踏无数艺术家的创造力扶摇直上。”这句话你怎么看? | category | 
| 12、你认为AI的发展会对绘画行业造成多大影响 | category | 
| 13、面对某一件事情,你更在乎过程还是结果? | category | 
| 14、对某一件事情的看法,你认为你更多的是出于理性还是感性? | category | 
| 15、你认为事实和立场,哪个更重要? | category | 
| 16、AI绘画提供了更多创意,促进了艺术领域的繁荣 | int64 | 
| 17、市面上有各种各样的绘画材料,甚至价格不菲,而通过AI软件绘画则不需要购买这些材料。我认为,在未来AI的发展会打击绘画材料的市场 | int64 | 
| 18、越来越多的公司要求设计作品用电脑软件来完成,在未来商业上,我认为AI作品会取代手绘作品 | int64 | 
| 19、AI作画推广过程中,绘画创作行业产生激烈竞争,我会选择对这个行业避而远之 | int64 | 
| 20、比起对于低成本,高效率的工作方法,我更倾向具有工匠精神的工作方法 | int64 | 
| 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法 | int64 | 
| 22、对于新事物,我喜欢去尝试和体验 | int64 | 
| 23、请问您是否觉得此问卷有不足的地方或建议 | object | 
| 总分 | int64 | 
| 填写问卷时长 | int32 | 
## 异常值查找
df4['填写问卷时长'].describe()count    147.000000
mean     187.632653
std      117.642253
min       31.000000
25%      111.500000
50%      176.000000
75%      227.000000
max      937.000000
Name: 填写问卷时长, dtype: float64
fig = px.histogram(df4, x="填写问卷时长")
fig.show()Unable to display output for mime type(s): application/vnd.plotly.v1+json
## 逻辑一致性检查
df5 = df4.drop(df4.query('(填写问卷时长 >600) or (填写问卷时长 <= 50)').index)# 数据清理完毕
df = df5.copy()数据分析
描述统计
先描述样本背景,对样本质量进行评价。再描述样本特征信息、样本基本现状,最后描述样本基本态度及其他维度。
描述统计分析也应该有理论依据或概念合理的分类。
important_factors = mytools.gen_mcq_df(df,'7、假如你是AI绘画研发人员,在AI绘画推广过程中,你更看重?(多选)')
important_factors = important_factors.sort_values(by='比例')
important_factors| 次数 | 比例 | |
|---|---|---|
| AI绘画对传统绘画的冲击 | 54 | 39.705882 | 
| AI绘画推广过程中涉及的版权问题 | 57 | 41.911765 | 
| AI绘画工作的成本与效率 | 67 | 49.264706 | 
| AI绘画带来的商业价值 | 74 | 54.411765 | 
| 受众对AI绘画的认可程度 | 94 | 69.117647 | 
fig = px.bar(important_factors, x="比例",orientation='h')
fig.show()Unable to display output for mime type(s): application/vnd.plotly.v1+json
推论统计
对研究假设逐一进行检验。
为检验研究假设,需要首先构造研究假设中的自变量(批判性思维能力)、因变量(对待AI作品的态度)
"""
生成自变量:批判性思维能力
批判性思维能力 = 22、对于新事物,我喜欢去尝试和体验 + 21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法  
"""
df['批判性思维能力'] = df['22、对于新事物,我喜欢去尝试和体验']+df['21、在面对各种相互对立的想法时,我喜欢确定哪一种是做某件事情的正确方式和方法']
# df['批判性思维能力'] = df['22、对于新事物,我喜欢去尝试和体验']df['批判性思维能力'].describe()count    136.000000
mean     137.985294
std       33.043627
min       59.000000
25%      116.000000
50%      133.000000
75%      161.250000
max      200.000000
Name: 批判性思维能力, dtype: float64
fig = px.histogram(df, x="批判性思维能力")
fig.show()Unable to display output for mime type(s): application/vnd.plotly.v1+json
df['9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?'].cat.categoriesIndex(['其他', '其他〖ai作画挺欣赏的,但它是融合了其他画手的成果,感官复杂〗', '其他〖看不出来〗', '对于两者都喜欢,都可接受',
       '更喜欢AI作品,全新的视觉体验给观者带来愉悦的感觉', '更喜欢感受传统及现有艺术作品的魅力'],
      dtype='object')
"""
生成因变量:对待AI作品的态度(分值越高,态度越积极)
对待AI作品的态度 = 8、请问你认为借助AI创作出的作品可以被称为艺术品吗? + 9、    当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?
"""
def re_gen_attitude1(x):
    """
    依据变量的取值,重新生成变量
    """
    if x == "不可以,只是新兴技术在其他领域的具体体现":
        return -1
    elif x == "可以,是理性与感性的结合":
        return 1
    else:
        return 0
def re_gen_attitude2(x):
    """
    依据变量的取值,重新生成变量
    """
    if x == "更喜欢感受传统及现有艺术作品的魅力":
        return -1
    elif x == "更喜欢AI作品,全新的视觉体验给观者带来愉悦的感觉":
        return 1
    else:
        return 0
df['对待AI作品的态度'] = df['8、请问你认为借助AI创作出的作品可以被称为艺术品吗?'].apply(re_gen_attitude1) + df['9、当您作为观看者时,请问您更喜欢观赏传统及现有绘画艺术作品还是AI(绘画)艺术作品?'].apply(re_gen_attitude2)fig = px.histogram(df, x="对待AI作品的态度")
fig.show()Unable to display output for mime type(s): application/vnd.plotly.v1+json
假设检验
可将自变量和因变量视为定距变量,采用R方描述相关性,采用F检验进行假设检验。
fig = px.scatter(df,  # 数据集
                 x="批判性思维能力",  # x轴
                 y="对待AI作品的态度"  # y轴
                )
fig.show()Unable to display output for mime type(s): application/vnd.plotly.v1+json
x = '批判性思维能力'
y = '对待AI作品的态度'
r, p = stats.pearsonr(df[x], df[y])
info = f"积矩相关系数r为:{r:.3f},决定系数r平方为:{r*r:.3f},相关强度为{mytools.draw_on_r(r*r)}。"
print(info, p)积矩相关系数r为:0.029,决定系数r平方为:0.001,相关强度为极弱相关或不相关。 0.7244083050325453
计算147名受试者的批判性思维能力和对待AI作品态度的得分,两个变量的Pearson相关系数\(r(147)=0.029,p=0.724\),接受原假设,研究假设不成立,即两者不存在相关性。
