【数据挖掘】银行信用卡风险大数据分析与挖掘

银行信用卡风险大数据分析与挖掘

1、实验目的

中国某个商业银行高层发现自家信用卡存在严重的欺诈和拖欠现象,已经影响到自身经营和发展。银行高层希望大数据分析部门采用数据挖掘技术,对影响用户信用等级的主要因素进行分析,结合信用卡用户的人口特征属性对欺诈行为和拖欠行为的影响因素进行分析,挖掘银行客户信用卡记录数据的潜在价值,为该银行的信用卡业务决策提供参考。银行大数据部门通过对银行的客户信用记录、申请客户信息、拖欠历史信息、消费历史记录等数据进行分析,可对不同程度的客户进行归类,研究信用卡贷款拖欠、信用卡欺诈等问题与客户的个人信息、信用卡使用信息的关系,为银行提前识别、防控信用卡业务风险提供参考,从而减少银行在信用卡业务方面的损失,并采用大数据分析与挖掘模型和算法设计构建信用卡风险识别系统,为银行的智慧运营奠定基础。本次分析的主要目的是通过对客户拖欠历史信息和消费记录进行信用卡风险客户识别模型的建立。

2、实验环境

实验环境采用的是R4.3.1版本,环境编程工具采用的是RStudio进行编程建立预测模型并评估模型的效果,对模型进行参数优化,得出响应的模型结果。

3、实验设计

3.1、题目设计

信用卡风险客户识别模型。通过对该应该用户是否有拖欠行为和欺诈行为的用户作为该银行的信用卡风险客户,制定风险客户标签。

3.2、数据获取与存储

采用R语言对原始数据进行读取,读取后的数据采用变量进行保存在R工作环境中,以便建模分析调取使用。由于数据文件为excel形式,因此利用R读取数据时采用readxl包中的read_excel函数进行数据的读取。

3.3、数据处理

在读取数据后需要对数据做处理,而由于需要用到不同的表格数据,需要先将不同表格数据通过关联的客户号进行连接后,建立目标变量是否风险客户,是否风险客户是通过是否有拖欠行为和是否欺诈行为判断,两者只要满足其一则为风险客户。建立好目标变量后需要对无用变量进行剔除,如客户姓名、客户号等对建模无用的基础信息进行剔除。剔除无用变量后发现数据中的变量有分部为类别变量,因此需要对类别变量的数据类型做转换,将是否类型或有无类型的变量采用0和1进行复制替换处理,有序类别变量则采用序列号赋值处理,无序类别变量则将其转换为因子的数据类型,最后得到模型的原始数据,再对原始数据进行训练集和测试集的划分,以便利用训练集和测试集分别进行模型的建立和模型的测试。

3.4、模型与参数确定

建立模型所选用的算法分别为逻辑斯蒂回

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/775490.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数字信号处理及MATLAB仿真(2)——离散系统

上回书说到如何来编写一些简单的离散时间序列,今天咱们就来谈谈一些关于常系数差分方程的操作吧。 说到这里咱们对于常系数差分方程可能最关心的就是怎么去求解了。 其中最关键的部分就是filter函数,可以用来计算系统在输入信号为x的输出信号y。大家学过…

【C++】日期类

鼠鼠实现了一个日期类,用来练习印证前几篇博客介绍的内容!! 目录 1.日期类的定义 2.得到某年某月的天数 3.检查日期是否合法 4.(全缺省)构造函数 5.拷贝构造函数 6.析构函数 7.赋值运算符重载 8.>运算符重…

elasticsearch-users和elasticsearch-reset-password介绍

elasticsearch 内置 elastic, kibana, logstash_system,beats_system 共4个用户,用途如下: elastic 账号:内置的超级用户,拥有 superuser 角色。 kibana 账号:用来连接 elasticsearch 并与之通信。Kibana 服务器以该用…

分享超级实用的3款AI工具,让工作效率轻松翻倍

Hey,职场小伙伴们!每天被堆积如山的工作压得喘不过气?加班成了日常,效率却不见提高?别急,今天就让我来给你们揭秘3款AI神器,它们将是你职场上的得力助手,让你的工作效率轻松翻倍&…

政务单位网站SSL证书选择策略

在数字化快速发展的今天,政务单位网站作为政府与公众沟通的重要桥梁,其安全性和可信度显得尤为重要。SSL证书作为保障网站安全的重要手段,其选择对于政务单位网站来说至关重要。本文将探讨政务单位网站在选择SSL证书时应该考虑的因素&#xf…

2024暑假集训第四次考试(终极测试)

作者的话 虽然这是最后一次考试,也是10天暑假集训的终极测试,但是题目难度反而没那么高,这里的难度是思考深度,但是主要是广范围的考所学知识的简单应用(也就是基本都是模版题的应用,只不过知识面广&#x…

国际水务交流 | 一带一路沿线水环境考察暨中马水务合作论坛

从具体区域来看,“一带一路"沿线国家环境问题复杂而多样,各国生态环境特征差异明显 东南亚尤其是东盟地区受热带季风影响,降水较多,洪水高发,也是世界生物最为多样最为丰富的地区之一,这一区域面临森…

WBCE CMS v1.5.2 远程命令执行漏洞(CVE-2022-25099)

前言 CVE-2022-25099 是一个影响 WBCE CMS v1.5.2 的严重安全漏洞,具体存在于 /languages/index.php 组件中。该漏洞允许攻击者通过上传精心构造的 PHP 文件在受影响的系统上执行任意代码。 技术细节 受影响组件:/languages/index.php受影响版本&…

欧洲智慧能源展揭幕,海博思创闪耀登场展示储能创新

近日,备受瞩目的欧洲智慧能源展(The Smarter E Europe)盛大开幕,吸引了全球能源行业的目光。在这场国际性的盛会中,中国储能行业的领军企业海博思创凭借卓越的技术实力和创新的解决方案,成为展会上一颗耀眼…

性能压测 -优化 Nginx的动静分离

两件事情 1.以后将所有的项目的静态资源都应该放在nginx里面 2.nginx 规则:/static/***所有请求都有nginx直接返回 nginx 配置一下配置文件,然后把html 的静态资源,绑定好是Nginx优先级高的静态资源路径,就去交给nginx静态资源…

电子发票时代企业如何实现电子发票无纸化管理?

“全电发票”、“报销入账归档”、“无纸化办公”与“金税四期”一道,成为数智化时代当之无愧的热词。2012年起,我国不断出台政策推动电子发票及电子会计档案,2020年更是连续出台《关于规范电子会计凭证报销入账归档的通知》,全电…

2024第二届电子通信与计算机科学技术国际会议(ICECCST 2024)

2024第二届电子通信与计算机科学技术国际会议(ICECCST 2024) 会议简介 2024第二届电子通信与计算机科学技术国际会议(ICECCST 2024)是一次重要的学术盛会,将在中国厦门举行。会议的主要目的是为全球的电子通信和计算机科学技术领域的专家、…

【信息学奥赛】CSP-J/S初赛07 排序算法及其他算法在初赛中的考察

本专栏👉CSP-J/S初赛内容主要讲解信息学奥赛的初赛内容,包含计算机基础、初赛常考的C程序和算法以及数据结构,并收集了近年真题以作参考。 如果你想参加信息学奥赛,但之前没有太多C基础,请点击👉专栏&#…

【车载开发系列】GIT安装详细教程

【车载开发系列】GIT安装详细教程 【车载开发系列】GIT安装详细教程 【车载开发系列】GIT安装详细教程一. GIT软件概念二. GIT安装步骤三. GIT安装确认三. GIT功能使用1)Git Bash2)Git CMD3)Git FAQs4)Git GUI 一. GIT软件概念 G…

【YOLOv5/v7改进系列】改进池化层为ASPP

一、导言 Atrous Spatial Pyramid Pooling (ASPP)模块是一种用于多尺度特征提取的创新技术,旨在提升深度学习模型在语义图像分割任务中的表现。ASPP模块通过在不同的采样率下应用空洞卷积,可以捕获不同大小的对象以及图像的上下文信息,从而增…

JMH320【亲测】【御剑九歌】唯美仙侠手游御剑九歌+WIN学习手工端+视频教程+开服清档+运营后台+授权GM物品充值后台

资源介绍: 这也是仙梦奇缘的一个游戏 注意:外网14位IP或域名 ———————————————————————————————————– ps后台介绍: 1区运营后台:http://ip:9981/admin/admintool/ 2区运营后台:http://ip…

小阿轩yx-LVS+Keepalived群集

小阿轩yx-LVSKeepalived群集 Keepalived 双机热备份基础知识 起初是专门针对 LVS 设计的一款强大的辅助工具主要用来提供故障切换(Failover)和健康检査(HealthChecking)功能—判断LVS 负载调度器、节点服务器的可用性当 master 主机出现故障及时切换到backup 节点保证业务正常…

溶解氧(DO)理论指南(1)

转载自梅特勒官网资料,仅用于学习交流,侵权则删! 溶解氧理论指南 1 溶解氧(DO)原理1.1 溶解氧和分压1.2 氧气在水中的溶解度1.3 溶解氧对生物的重要性1.4 溶解氧对工业的重要性 1 溶解氧(DO)原理 氧是宇宙中第三大常见元素,也是…

10.09面试题目记录

艾融软件 - 线上面试题 排序算法的时间复杂度 O(n^2):冒泡,选择,插入 O(logn):折半插入排序 O(nlogn):希尔,归并,快速,堆 O(nk):桶,…

PY32F030高性能单片机,主频高达48M,最大64 KB 闪存,8 KB SRAM

PY32F030是普冉的一颗32位高性能MCU,采用32 位 ARM Cortex-M0 内核,高达16~64 Kbytes Flash 和 2~8 Kbytes SRAM 存储器,最高 48 MHz 工作频率。PY32F030 单片机的工作温度范围为 -40 ~ 105 C,工作电压范围为1.7 ~ 5.5 V&#xff…