当前位置:首页 > AI > 正文内容

python怎么Fleiss Kappa

邻居的猫1个月前 (12-09)AI627

意图

查验数据共同性

示例

机器学习中触及新数据集发布的论文一般会描绘数据集的构建进程,一份数据集往往由多位标示员共同完成,不同标示员对数据的了解很简单存在误差,这极大程度上会影响数据集的共同性,然后约束算法的功能。因此在构建数据集的标示进程中,大多数构建数据集的作业都会对标示员之间的标示共同性进行评价,以确保数据集的质量。

假如有一个15个项目,7个评委,每行是一个项意图评委评分

代码

import numpy as np
from statsmodels.stats.inter_rater import fleiss_kappa

# 原始数据:一个15个项目,7个评委,每行是一个项意图评委评分
data = np.array([
    [5,5,5,5,5,5,5],
    [4,4,2,4,4,3,3],
    [3,4,5,5,3,5,4],
    [2,2,2,3,3,3,3],
    [1,3,3,3,3,2,3],
    [1,1,1,2,1,2,2],
    [1,2,1,3,4,2,1],
    [1,5,3,2,2,2,5],
    [1,1,2,2,3,1,3],
    [2,2,2,2,2,2,2],
    [1,1,1,2,1,2,2],
    [1,2,1,3,4,2,1],
    [5,5,5,5,5,5,5],
    [1,1,2,2,3,1,3],
    [2,2,2,2,2,2,2]
])

# 获取评分类别规模(假定评分为整数,类别从最小值到最大值)
categories = np.arange(data.min(), data.max() + 1)  # [2, 3, 4, 5]
num_categories = len(categories)

# 初始化 Fleiss' kappa 格局矩阵
ratings_matrix = np.zeros((data.shape[0], num_categories), dtype=int)

# 核算每个项目中每个类别的评分人数
for i, row in enumerate(data):
    for category in categories:
        ratings_matrix[i, category - categories.min()] = np.sum(row == category)

# 打印收拾后的矩阵
# print("收拾后的数据矩阵 (Fleiss' kappa 格局):")
# print(ratings_matrix)

# 核算 Fleiss' kappa
kappa = fleiss_kappa(ratings_matrix)

# 核算额定核算量
n = np.sum(ratings_matrix, axis=1)[0]  # 每个项意图评分人数(假定共同)
N = ratings_matrix.shape[0]  # 项目数
P = np.sum(ratings_matrix, axis=0) / (N * n)  # 每个类别的整体份额
P_bar = np.sum(np.sum(ratings_matrix**2, axis=1) - n) / (N * n * (n - 1))  # 均匀项目共同性
P_e = np.sum(P**2)  # 预期共同性

# 核算标准误差
se_kappa = np.sqrt((P_bar * (1 - P_bar) / (N * (1 - P_e)**2)))

# 核算 Z 值
z_kappa = kappa / se_kappa

# 核算 p-value
from scipy.stats import norm
p_value = 2 * (1 - norm.cdf(np.abs(z_kappa)))

# 核算 95% CI
ci_lower = kappa - 1.96 * se_kappa
ci_upper = kappa + 1.96 * se_kappa

# 打印成果
print("\nFleiss' kappa: {:.4f}".format(kappa))
print("Standard Error: {:.4f}".format(se_kappa))
print("Z-value: {:.4f}".format(z_kappa))
print("p-value: {:.4f}".format(p_value))
print("95% CI: ({:.4f}, {:.4f})".format(ci_lower, ci_upper))

目标解说

kappa核算成果为[-1,1],但一般kappa是落在 [0,1] 间

第一种剖析原则–可分为五组来表明不同等级的共同性:

0.0~0.20极低的共同性(slight)

0.21~0.40一般的共同性(fair)

0.41~0.60 中等的共同性(moderate)

0.61~0.80 高度的共同性(substantial)

0.81~1简直完全共同(almost perfect)

扫描二维码推送至手机访问。

版权声明:本文由51Blog发布,如需转载请注明出处。

本文链接:https://www.51blog.vip/?id=347

分享给朋友:

“python怎么Fleiss Kappa” 的相关文章

机器学习用品推荐,助力你的学习与研究

机器学习用品推荐,助力你的学习与研究

硬件推荐1. 计算机:如果您是初学者,一台普通的台式机或笔记本电脑就足够了。对于更高级的机器学习任务,您可能需要一台配置更高的计算机,例如拥有更强的CPU、GPU和内存。2. 图形处理单元(GPU):GPU对于机器学习任务至关重要,因为它可以加速计算过程。NVIDIA的GPU,如GeForce R...

ai写小说,技术革新与文学创作的未来

ai写小说,技术革新与文学创作的未来

当然可以!我可以帮助你创作一篇小说。请告诉我你想要的主题、风格、人物设定、情节概要等,这样我可以更好地为你服务。AI写作小说:技术革新与文学创作的未来一、AI写作小说的兴起背景在互联网时代,信息爆炸使得人们对于文学作品的阅读需求日益多样化。与此同时,传统文学创作方式面临着创作速度慢、题材单一等问题。...

机器学习 吴恩达,AI领域的入门经典

机器学习 吴恩达,AI领域的入门经典

吴恩达(Andrew Ng)是机器学习领域的知名学者和企业家,他在这个领域有着广泛的影响力和贡献。以下是关于吴恩达及其机器学习课程的一些信息:1. 吴恩达的背景: 吴恩达是斯坦福大学计算机科学系和电气工程系的客座教授,曾任斯坦福人工智能实验室主任。他还与达芙妮·科勒一起创建了在线教育平台Cou...

ai综合能源,推动能源转型新篇章

ai综合能源,推动能源转型新篇章

AI在综合能源领域的应用非常广泛,涵盖了从发电、输电到用电的各个环节,以下是主要应用和趋势:1. 提高能源利用效率: 智能化调度:通过机器学习算法,AI可以分析历史数据,预测未来的能源需求趋势,为能源规划和决策提供科学依据,优化运行参数、调度策略和用电设备控制,从而显著减少能源浪费和损耗。...

机器学习ppt,概述与重要性

机器学习ppt,概述与重要性

1. 温州大学《机器学习》课程课件: 这是由温州大学提供的机器学习课程课件,适用于研究生课程。课件内容丰富,适合深入学习。 下载地址:2. 吴恩达机器学习全套PPT课件及批注: 吴恩达是机器学习领域的知名学者,他的课程内容详尽,适合初学者和进阶学习者。 下载地址:3. 李宏毅...

欧美 ai综合,欧美AI发展现状与未来展望

欧美 ai综合,欧美AI发展现状与未来展望

欧美在人工智能(AI)领域的发展各有其特点和优势。以下是对欧美AI综合情况的详细分析: 欧洲在AI领域的现状和战略1. 市场份额和初创企业: 欧洲在全球人工智能初创企业数量上仅次于美国,拥有769家,占全球总数的22%。主要国家包括英国、法国、德国和瑞典。2. 投资水平: 尽管自2008...