خوشه\/بندی همزمان دیدگاه\/های مختلف در بررسی داده\/های مالیاتی

Document Type : Research Paper

Authors

1 دانشگاه تحصیلات تکمیلی و فناوری پیشرفته کرمان

2 استان کرمان اداره مالیات

Abstract
استفاده از روشهای داده کاوی در تحلیل داده\/های مالیاتی از جمله تقلب و یا فرار مالیاتی از راهکارهای جدید و مورد توجه می\/باشد. در این مقاله ابتدا مفاهیم خوشه\/بندی طیفی، خوشه\/بندی $k$-میانگین و انتخاب ویژگی را مورد مطالعه قرار می\/گیرد و سپس روش جدیدی بر اساس در نظر گرفتن حالتهای متفاوتی از انتخاب ویژگی معرفی می\/گردد. در این روش ماتریس مشخصه خوشه\/بندی با در نظر گرفتن همزمان همه ماتریسهای مشخصه حاصل از انتخاب تعداد متفاوت ویژگیها، به همراه ضریب وزن تاثیر هر حالت، به دست می\/آید. سپس روش های ذکر شده روی داده\/های مالیاتی مورد بررسی قرار می\/گیرند و ویژگیهای مهم مرتبط با فرار مالیاتی با استفاده از انتخاب ویژگی به دست می\/آید. همچنین نتایج حاصل از انتخاب ویژگی و سه روش خوشه\/بندی $k$-میانگین، خوشه\/بندی طیفی و روش خوشه\/بندی پیشنهادی جدید ارائه و مقایسه می\/گردد. ملاحظه می\/شود که بر اساس معیارهای ارزیابی خوشه\/بندی، این خوشه\/بندی ها نتایج نسبتا خوبی ارایه می\/نمایند و در نتیجه راهکاری مناسب برای تحلیل داده\/های مالیاتی می\/باشند و با استفاده از این روشها می\/توان فرار مالیاتی را، در داده\/هایی به صورت ارائه شده، مورد بررسی یا پیش بینی قرار داد.

Keywords