ارائه مدل شناسایی تقلب مالیاتی بر مبنای ترکیب الگوریتم درخت تصمیم ID3 بهبود یافته و شبکه های عصبی پرسپترون چندلایه

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری حسابداری، گروه حسابداری، واحد قائم شهر، دانشگاه آزاد اسلامی، قائم شهر، ایران.

2 استادیار، گروه حسابداری، واحد قائم شهر، دانشگاه آزاد اسلامی، قائم شهر، ایران

3 استادیار، گروه مهندسی کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران

چکیده

درآمدهای مالیاتی یکی از مهم­ترین منابع درآمدی دولت و تأمین­کننده بخش عمده­ای از هزینه­های دولت است. در سالهای اخیر تقلب در صورت‌های مالی و اظهارنامه های مالیاتی به طور فزاینده­ای به‌ یک مشکل جدی برای کسب و کار، دولت و سرمایه‌گذاران تبدیل شده است. اکثر مؤدیان مالیاتی به دنبال راهی برای دستکاری در صورتهای مالی و کاهش سود مشمول مالیات ابرازی خود می­باشند. از این­رو، شناسایی متقلبین مالیاتی و شرکتهایی که به تقلب در صورتهای مالی می­پردازند به امری حیاتی برای دولت تبدیل شده است.
هدف از این تحقیق ارائه مدلی است که در آن از الگوریتم درخت تصمیم­گیریID3 بهبود یافته استفاده شده است. همچنین برای بهبود عملکرد و دقت آن، با شبکه های عصبی پرسپترون چندلایه بهینه سازی شده توسط الگوریتم ژنتیک ترکیب گردید تا نسبت­های مالی مرتبط با تقلب مالیاتی انتخاب نموده و سربار محاسباتی کاهش یابد. درختی که در مدل پیشنهادی ایجاد می­شود دارای کمترین عمق ممکن می باشد که از این­رو دارای سرعت بالا و سربار محاسباتی پایینی می­باشد. بدین منظور صورتهای مالی 60 شرکت پذیرفته شده در بورس اوراق بهادار تهران در سالهای 1394 لغایت 1396 بررسی و 54 نسبت مالی از آن­ها استخراج گردید که به وسیله آزمون ANOVA تعداد 23 نسبت و نهایتاً توسط شبکه های عصبی تعداد 7 نسبت مرتبط با تقلب مالیاتی، به عنوان داده های ورودی مدل انتخاب گردید. مدل ارائه شده با دقت 81/4 درصد، در شناسایی شرکتهای دارای تقلب مالیاتی، موفق بوده که نسبت به الگوریتم آدابوست دارای بالاترین دقت و قدرت پیش بینی بوده است.

کلیدواژه‌ها


عنوان مقاله [English]

A Model for Identification Tax Fraud Based on Improved ID3 Decision Tree Algorithm and Multilayer Perceptron Neural Network

نویسندگان [English]

  • Akbar Javadian Kootanaee 1
  • Abbas Ali Poor aghajan Sarhamami 2
  • Mirsaeid Hosseini Shirvani 3
1 PhD student of Accounting, Department of Accounting, Qaemshahr Branch, Islamic Azad University, Qaemshahr, Iran
2 Assistant Professor, Department of Accounting, Qaemshahr Branch, Islamic Azad University, Qaemshahr, Iran.
3 Assistant Professor, Department of Camputer Engineering, Sari Branch, Islamic Azad University, Sari, Iran.
چکیده [English]

Tax revenues are one of the most important sources of governments and cover a large portion of government spending. In recent years, fraud in financial statements and tax returns has increasingly become a serious problem for businesses, governments and investors. Most taxpayers are looking for a way to manipulate their financial statements and reduce their taxable profits. Therefore, identifying tax fraudsters and companies that cheat on financial statements has become a vital issue for the government.
The purpose of this study is to present a model that uses the improved ID 3decision tree algorithm. Also, to improve its performance and accuracy, it was combined with multilayer perceptron neural networks optimized by genetic algorithm to select financial ratios associated with tax fraud and reduce computational overhead. The tree in the proposed model has the lowest depth possible, so it has high velocity and low computational overhead. For this purpose, the financial statements of 06companies listed in Tehran Stock Exchange during - 4330 4331were studied and 41
financial ratios were extracted. By ANOVA test, 33ratios and finally by neural networks 7ratios related to tax fraud was selected as the model input data. The proposed model, with %4411accuracy, has been successful in identifying fraudulent companies with the highest accuracy and predictive power over the adaboost algorithms.

کلیدواژه‌ها [English]

  • Tax fraud
  • declared tax
  • Improved Decision tree
  • Genetic algorithm
  • Adaboost Algorithm
*      اعتمادی، حسین و حسن زلقی، (1392)، کاربرد رگرسیون لجستیک در شناسایی گزارشگری مالی متقلبانه، مجله دانش حسابرسی، سال 13، شماره 51، 145-163.

*    پور حیدری، امید و مجتبی گل محمدی شورکی (1394)، تأثیر ریسک وضعیت مالیاتی شرکت بر حق‌الزحمه حسابرسی، بررسی های حسابداری و حسابرسی، شماره 22، صص 318-301.

*    تشدیدی الهه، سحر سپاسی، حسین اعتمادی و عادل آذر (1398)، ارائه رویکردی نوین در پیش­بینی و کشف تقلب صورتهای مالی با استفاده از الگوریتم زنبور عسل، مجله دانش حسابداری، دوره دهم، شماره 3، پاییز 1398، 139-167

*    تقوی فرد، سید محمدتقی، ایمان رئیسی وانانی و ریحانه پناهی (1396)، تحلیل آینده نگر تشخیص فرار مالیاتی مؤدیان مالیات بر ارزش افزوده با استفاده از الگوریتم­های طبقه­بندی و خوشه بندی، پژوهشنامه مالیات، شماره 35، 11-35

*    داغمه چی فیروزجایی، علی (1393)، پاسخگویی در گزارشگری مالی: کشف شرکتهای متقلب، پایان نامه کارشناسی ارشد، رشته حسابداری، دانشگاه مازندران.

*    زارع بهنمیری، محمد جواد (1395)، پیش بینی تقلب در صورتهای مالی با استفاده از نسبت های مالی، پایان نامه دکتری، رشته حسابداری، دانشگاه مازندران.

*    صدر موسوی، میرستار و اکبر رحیمی (1388)، مقایسه نتایج شبکه­های عصبی پرسپترون چندلایه با رگرسیون چندگانه در پیش­بینی غلظت ازن در شهر تبریز، پژوهش­های جغرافیای طبیعی، شماره 71، 65-72

*    عرب صالحی، مهدی و مجید هاشمی (1394)، تأثیر اطمینان بیش از حد مدیریتی بر اجتناب مالیاتی، بررسی های حسابداری و حسابرسی، شماره 22، 104-85

*    عرب مازار، علی اکبر و علی دهقانی (1388)، برآورد کارایی مالیات بر درآمد مشاغل و اشخاص حقوقی در استان‌های کشور، مجله پژوهش‌های مالیاتی، فصلنامه پژوهشنامه مالیات، سال 17، شماره 7، صص 64-45

*    فرقاندوست حقیقی، کامبیز و فرید برواری (1388)، بررسی کاربرد روش های تحلیل در ارزیابی ریسک تحریف صورتهای مالی(تقلب مدیریت)، مجله دانش و پژوهش حسابداری، شماره 16، 18-70.

*    قانون مالیاتهای مستقیم، مصوب 31/4/1394.

*    محمدموسایی جابر، بابک جمشیدی نوید، مهرداد قنبری و فرشید خیراللهی (1398)، تدوین مدل کشف تقلب با استفاده از رویکرد ترکیبی برپایه مدل تحلیل عاملی و روش شبکه عصبی مصنوعی در شرکت های پذیرفته شده در بورس اوراق بهادار تهران، مجله حسابداری مدیریت، دوره 12، شماره 42، پاییز 1398، 75-87.

*    مهام، کیهان و ابوالفضل ترابی (1391)، ارائه مدل رتبه بندی ریسک در تقلب گزارشگری مالی، همایش جهاد اقتصادی (با تاکید بر تولید ملی، حمایت از کار و سرمایه ایرانی)، دانشگاه مازندران.

*    مهرانی، ساسان و سیدجلال سیدی، (1393)، بررسی تأثیر مالیات بر درآمد و حسابداری محافظه کارانه بر اجتناب مالیاتی شرکت‌ها، فصلنامه علمی پژوهشی دانش حسابداری و حسابرسی مدیریت، شماره دهم، 33-13.

*    نمازی، محمد و محمدصادق زاده مهارلوئی (1396)، پیش بینی فرار مالیاتی با استفاده از الگوریتم های داده­کاوی درخت تصمیم، فصلنامه حسابداری مالی، سال نهم، شماره 36، زمستان 96، 76-100

*    همتی، هدی و محمدعلی جابری و کریم ایمانی و محمدعلی شامحمدی، (1398)، بررسی رابطه نوع اظهارنظر و اندازه موسسه حسابرسی با اجتناب از مالیاتی با استفاده از روش دو مرحله ای همکن، نشریه تحقیقات حسابداری و حسابرسی، پاییز 1398، شماره 43، 171-186.

*      همراز، سعید (1385)، ماشین یادگیری همه منظوره، پایان نامه کارشناسی، رشته مهندسی کامپیوتر- نرم افزار، دانشگاه علم و صنعت ایران

*      A.V Senthil Kumar et. al. 2013, “Diagnosis of heart disease using Advanced Fuzzy Resolution Mechanism” International Journal of Science and Applied Information Technology (IJSAIT), Vol. 2, No.2, Pages: 22-30 (2013).

*      Didimo, W., L. Giamminonni, G. Liotta, F. Montecchiani, and Pagliuca, D. (2018). A Visual Analytics System to support Tax Evasion Discovery. Decision Support Systems.

*      Hanlon, M, Heitzman, Sh. (2010). “A review of tax research”. Journal of Accounting and Economics 50. Pp. 127-178.

*      Hao Wang, Chengzhi Mao, Hao He, Mingmin Zhao, Tommi S. Jaakkola, Dina Katabi, “Bidirectional Inference Networks: A Class of Deep Bayesian Networks for Health Profiling”, Machine Learning (stat.ML); Artificial Intelligence (cs.AI); Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs. LG),2019.

*      https://chistio.ir

*      Kantesh Kumar Oad, Xu DeZhi & Pinial Khan Butt et. al, “A Fuzzy Rule based Approach to Predict Risk Level of Heart Disease”. Global Journal of Computer Science and Technology: C Software & Data Engineering, Volume14

*      Kim, Yeonkook J., Baik, Bok. Cho, Sungzoon. (2016). Detecting financial misstatements with fraud intention using multi-class cost-sensitive learning, Expert Systems with Applications, No. 62, pp. 32-43.

*      Kirkos, E., Spathis, C., & Manolopoulos, Y. (2007). Data Mining techniques for the detection of fraudulent. Expert Systems with Applications, 32(4), 995–1003

*      Lari. Dashtbayaz, Mahmoud. (2015). Data search and discovery process for financial statement fraud, Research Journal of Finance and Accounting, Vol.6, No.3.

*      Sergio Ledesma, Gustavo Cerda, Gabriel Avina, Donato Hernandez and Miguel Torres, Feature Selection using Artificial Neural Networks, A. Gelbukh and E.F. Morales (Eds.): MICIAI 2008, LNAI 5317, pp. 351-359.

*      Ojeme Blessing Onuwa et. all, “Fuzzy Expert System for Malaria Diagnosis”., An International Open Free Access, Peer Reviewed Research Journal, Published by: Oriental Scientific Publishing Co., India. June2014, Vol.7, No. (2): Pgs. 273-284 [ISSN: 0974-6471].

*      Ravisankar, P., Ravi, V., Rao, R., & Bose, I. (2011). Detection of financial statement fraud and feature selection using data miningtechniques. Decision Support Systems,50(2), 491–500.

*      Rasa Kanapickiene, Zivile Grundiene, (2015), The Model of Fraud Detection in Financial Statements by Means of Financial Ratios, 20th International Scientific Conference Economics and Management, 2015

*      Sergio Ledesma, Gustavo Cerda, Gabriel Avina, Donato Hernandez, and Miguel Torres, “Feature Selection Using Artificial Neural Networks”, A. Gelbukh and E.F. Morales (Eds.): MICAI 2008, LNAI 5317, pp. 351–359, 2008.

*      Seyedhossein Naslmosavi, Arezoo Aghaei Chadegani and Mohammadghorban Mehri. (2011), Comparing the Ability of Bayesian networks and Adaboost for Predicting Financial Distress of Firms listed on Tehran Stock Rxchange (TSE), Australian Journal of Basic and Applied Sciences, 5(10): 629-634, 2011

*      Shin, K & Lee, Y. (2002). A Genetic Algorithm Application in Bankruptcy Prediction Modeling. Expert Systems with Applications, Vol. 23, Issue. 3, pp.321-328.

*      Sudan Chen. (2016). Detection of fraudulent financial statements using the hybrid data mining approach, Springer Plus, No. 5:89.

*      Vanhoeyveld Jellis, David Martens, Bruno Peeters. (2020), Value-added tax fraud detection with scalable anomaly detection techniques. Applied Soft Computing Volume 86, January 2020.

*      Watts, R. (2003a). Conservatism in Accounting Part I: Explanations and Implications.AccountingHorizons 17 (3): 207-222.

*      Xin-Ping Song, Zhi-Hua Hu, Jian-Guo Du, Zhao-Han Sheng, 2014, Application of Machine Learning Methods to Risk Assessment of Financial Statement Fraud: Evidence from China, Journal of Forecasting, J. Forecast. 33, 611–626 (2014)

*      Ziming Yin, Yinhong Zhao, Xudong Lu, and Huilong Duan, 2014, Screening of Alzheimer’s Disease Based on Multiple Neuropsychological Rating Scales, Hindawi Publishing Corporation Computational and Mathematical Methods in Medicine, Volume 2015.

*      Zhou, W., & Kapoor, G. (2011). Detecting evolutionaryfinancialstatement fraud. Decision Support Systems, 50(3), 570-575.