nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo journalinfonormal searchdiv searchzone qikanlogo popupnotification paper paperNew
2025, 06, v.36 19-23+30
基于决策树的会计核算数据结果自动分类方法
基金项目(Foundation): 安徽省教育厅质量工程项目(2022cxtd171); 安徽高校自然科学研究重点项目(KJ2021A1206)
邮箱(Email): 1294283513@qq.com;
DOI:
摘要:

会计核算数据存在连续变量离散化特性,在概念漂移情况下,难以捕捉数据中非线性连续变量交互效应,降低了数据分类的准确性。为此,提出一种基于决策树的会计核算数据结果自动分类方法。先通过获取会计核算数据集的统计概率密度特征量,捕捉数据的局部特征,实现连续变量的离散化处理。再对连续变量离散化结果进行模糊化处理,利用模糊信息增益最大值构建决策树,捕捉变量之间的非线性关系和交互效应,集成多棵决策树的分类结果,降低单一决策树的偏差,实现会计核算数据结果的自动分类。实验结果表明:所提方法能够高精度地处理会计核算数据,精准刻画其中的非线性关系。该方法满足实时性需求,为财务决策提供了及时、可靠的数据支持。

Abstract:

Accounting data has the characteristic of discretization of continuous variables.In the case of concept drift,it is difficult to capture the interaction effects of nonlinear continuous variables in the data,which reduces the accuracy of data classification. To address this,an automatic classification method for accounting data results based on decision trees is proposed. Obtain the statistical probability density feature quantities of the accounting data set,capture the local features of the data,and achieve the discretization processing of continuous variables. The discretization results of continuous variables are fuzzified. A decision tree is constructed by using the maximum gain of fuzzy information to capture the nonlinear relationships and interaction effects among variables. The classification results of multiple decision trees are integrated to reduce the deviation of a single decision tree and achieve the automatic classification of accounting data results.The experimental results show that the proposed method can process accounting data with high precision and accurately depict the nonlinear relationships therein. It meets the real-time requirements and can provide timely and reliable data support for financial decision-making.

参考文献

[1]蔡博,张海清,李代伟,等.基于增量加权的不平衡漂移数据流分类算法[J].计算机应用研究,2024,41(3):854-860.

[2]鲁淑霞,张振莲,翟俊海.代价敏感惩罚AdaBoost算法的非平衡数据分类[J].南京航空航天大学学报,2023,55(2):339-346.

[3]宋勇,齐迹.基于随机森林的电子档案资源快速分类研究[J].自动化技术与应用,2024,43(5):102-105.

[4]吴海燕,陈晓磊,范国轩.一种自适应核SMOTE-SVM算法用于不平衡数据分类[J].北京化工大学学报(自然科学版),2023,50(2):97-104.

[5]黄刚,侯燕,杨蒙蒙,等.基于改进超点图的移动激光点云数据自动分类[J].测绘与空间地理信息,2024,47(2):9-13.

[6]张震,胡贵恒,盖昊宇,等.基于谱聚类算法的高速网络数据流快速分类方法研究[J].齐齐哈尔大学学报(自然科学版),2023,39(5):24-30.

[7]张倩,吴琼,时庆涛.基于粒度神经网络的大数据标签分类算法研究[J].计算机仿真,2023,40(4):286-289,454.

[8]萧展辉,张世良,邓丽娟,等.数据缺失情况下配电网时间序列数据分类算法[J].沈阳工业大学学报,2025,47(1):29-36.

[9]丁剑,武红鑫,韩萌.基于动态异构集成的多标签数据流分类算法[J].计算机工程与设计,2023,44(10):3031-3038.

[10]王建琴.基于改进决策树的数据挖掘与分析算法设计[J].电子设计工程,2024,32(4):84-88.

[11]赵雪,李晓会.面向非独立同分布数据的联邦梯度提升决策树[J].计算机应用研究,2023,40(7):2184-2191.

[12]王植,张珏.基于Boosting算法的C5.0决策树不平衡数据分类算法[J].河南科学,2023,41(1):7-12.

基本信息:

中图分类号:TP274;F275

引用信息:

[1]葛宏俊,张海民.基于决策树的会计核算数据结果自动分类方法[J].中原工学院学报,2025,36(06):19-23+30.

基金信息:

安徽省教育厅质量工程项目(2022cxtd171); 安徽高校自然科学研究重点项目(KJ2021A1206)

检 索 高级检索