هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوي در کشف دانش پنهان ميان داده هاي سامانه 137 شهرداري تهران می باشد. تحقيق حاضر از نوع کاربردي مي باشد و به بررسي به کارگيری برخی روش‌هاي داده کاوي در مورد داده‌هاي سامانه 137 شهرداري تهران مي‌پردازد.

 

 

 

سامانه 137 يک مرکز گيرنده پيام‌هاي مردمي جهت رسيدگي به مشکلات و معضلات مشکلات شهري شهروندان تهراني مي‌باشد. در اين راستا کل پيام‌هاي سال 1389 اين سامانه در بانک اطلاعاتي2008  SQL Server گردآوري و مورد تحليل قرار گرفت.سامانه 137 با هدف رفع مشکلات و معضلات شهري و با رويکرد مشارکت بيشتر شهروندان در مديريت شهري راه اندازي شده است. تعداد کل پيام ها در طول سال مورد بررسي و پس از مرحله آماده سازي داده ها مجموعاً 1.082.195 بوده است که به لحاظ تحليل‌هاي آماري تعداد قابل توجه و براي تحليل‌هاي داده‌کاوي مناسب مي‌باشد. 

 

 

 

 

رويکرد محقق در اين تحقيق به کارگيري تکنيک هاي مختلف داده کاوي به منظور شناسايي و پيش بيني، نيازها و مشکلات شهري بر اساس داده هاي بدست آمده از سامانه مديريت شهري 137 مي باشد. تمرکز اصلي در اين تحقيق بر استفاده از روش‌هاي داده کاوي و نرم افزار SPSS Clementine مي‌باشد. همان طور که در فصل قبل بيان شد، دليل استفاده از اين نرم افزار، توانايي آن در پردازش مجموعه هاي داده اي بزرگ و متداول بودن آن در ميان کاربران است. در بخش آماده سازي داده ها، رسم نمودارها و جداول از نرم افزارهايي نظير Sql server 2008، Excel 2007 و Spss 16 استفاده شده است. 

 

 

 

 


در مرحله ي توصيف اطلاعات، ابتدا توزيع فراواني و درصد فراواني متغيرهاي گوناگون و همين‌طور برخي از شاخص‌هاي سرانه را مورد بررسي قرار داديم و در بخش تحليل داده ها با استفاده از تکنيک هاي داده کاوي، گروه مدل‌ها و تحليل‌هاي زير مورد بررسي قرار گرفته است:
•    شناسايي مناطق همگن از منظر سامانه 137
•    پيش بيني وضعيت تماس هاي آب گرفتگي هر يک از مناطق به ازاي بارش هر ميلميتر باران
•     تعيين ارتباط ميان آب گرفتگی نواحی مختلف يک منطقه
•    تعيين نواحي مستعدتر درهر منطقه در بروز مشکلات و معضلات شهري 

 

 

 

 

 

 


فهرست مطالب

فصل اول: کليات
مقدمه    1
1-1-   بيان مساله    2
1-2-   هدف تحقيق    3
1-3-   سوالات تحقيق    3
1-4-   اهميت و ضرورت تحقيق    4
1-5-   قلمرو تحقيق    5
1-5-1-    از منظر سازماني    5
1-5-2-    از منظر زماني و مکاني    5
1-5-3-    از منظر  موضوعي    5
1-6-   روش تحقيق و جمع آوري اطلاعات    5
1-7-   تعريف واژه ها و اصطلاحات فنی    6
1-8-   خلاصه فصل اول    6

 

 

فصل دوم: ادبيات تحقيق
مقدمه        8
2-1-   مباني نظري    9
2-1-1-    تاريخچه داده کاوي    9
2-1-2-    تعريف داده کاوي    10
2-1-3-    انواع داده کاوي    11
2-1-4-    دلايل استفاده از داده کاوي    12
2-1-5-    پيش نيازهاي يک داده کاوي موفق    12

2-1-6-    مراحل فرايند داده کاوي ( استاندارد CRISP-DM )    13

2-1-6-1شناخت کسب و کار    14
2-1-6-2شناخت داده ها    14
2-1-6-3آماده سازي داده ها    15
2-1-6-4مدل سازي    15
2-1-6-5ارزيابي مدل    15
2-1-6-6توسعه ي مدل    16
2-1-7-    قابليت هاي اساسي داده کاوي    16
2-1-7-1   طبقه بندي    16
2-1-7-2   پيش بيني    17
2-1-7-3    تحليل خوشه اي    17
2-1-7-4    تخمين    18
2-1-7-5    گروه بندي شباهت يا قوانين وابستگي    19
2-1-7-6    توصيف و نمايه سازي    20

2-1-8-    دسته بندي الگوريتم هاي داده کاوي    20

2-1-9-    الگوريتم هاي خوشه بندي    21
2-1-9-1روش افرازي ( تقسيم بندي)    21
2-1-9-1-1الگوريتم K-MEANS    22
2-1-9-2روش هاي سلسله مراتبي    22
2-1-9-3روش هاي مبتني بر چگالي    23
2-1-10-    الگوريتم هاي وابستگي قواعد    23
2-1-10-1الگوريتم Naïve    23
2-1-10-2 الگوريتم Apriori    24
2-1-11-    الگوريتم هاي طبقه بندي    26
2-1-11-1الگوريتم درخت طبقه بندي و رگرسيون  (CART)    26
2-1-11-2الگوريتم درخت تصميم C4.5    27
2-1-11-3الگوريتم هاي شبکه هاي بيزين    29
2-2-1-    مديريت شهري و شهرداري    30
2-2-2-    نقش فن آوري اطلاعات در توسعه ي مديريت شهري    31
2-2-3-    معرفي سامانه مديريت شهري 137 شهرداري تهران    33
2-2-3-1نحوه ي عملکرد سامانه مديريت شهري 137    36
2-2-3-2ماموريت هاي مرکز سامانه مديريت شهري 137    38
2-2-3-3رويکردهاي اجرايي مرکز سامانه مديريت شهري 137    38
2-2-3-4چشم انداز مرکز سامانه مديريت شهري 137    39
2-2-3-5ساختار سازماني سامانه مديريت شهري 137    39
2-2   مدل مفهومي تحقيق    40
2-3-   ادبيات ياپيشينه تحقيق    40
2-4-   خلاصه فصل دوم    44

 

 


فصل سوم: روش تحقيق
مقدمه        46
3-1-  نوع تحقيق    46

3-2-  مدل فرايندي داده کاوي بر اساس استاندارد CRISP-DM    47

3-2-1-    شناخت کسب و کار    47
3-2-2-    شناخت داده ها     48
3-2-3-    آماده سازي داده ها    48
3-2-4-    مدل سازي    49
3-2-5-    ارزيابي مدل    49
3-2-6-    توسعه مدل    49
3-3-    داده هاي تحقيق    50
3-4-    جامعه آماري, روش نمونه گيري و حجم نمونه    50
3-5-    روش گردآوري اطلاعات و ابزار سنجش    50
3-6-    نوع داده ها و مقياس آن ها    51
3-7-    ساختار اجرايي تحقيق    51
3-7-1-    درک مساله کسب و کار    51
3-7-2-    درک داده ها    52
3-7-3-    آماده سازي داده ها    53
3-7-4-    مدل سازي    55
3-7-5-    ارزيابي نتايج    56
3-7-6-    به کارگيري مدل    56
3-8-    مدل اجرايي تحقيق    56
3-9-    خلاصه فصل سوم    58

 

 

فصل چهارم: تجزيه و تحليل داده ها
مقدمه        60
4-1-   توصيف داده ها    60
4-2-   تحليل توصيفي داده ها با استفاده از جداول و نمودارهاي توصيفي    63
4-2-1-    طبقه بندي بر اساس نوع مشکل    63
4-2-2-    طبقه بندي بر اساس منطقه بروز مشکل    66
4-2-3-    شاخصهاي توصيفي سرانه    67
4-3-   تحليل داده ها با استفاده از تکنيک هاي داده کاوي    70
4-3-1-    شناسايي مناطق همگن از منظر سامانه 137    70
4-3-1-1ارزيابي خوشه ها    76
4-3-2-    پيش بيني وضعيت تماس هاي آب گرفتگي در هر يک از مناطق به ازاي بارش هر ميليمتر باران    77
4-3-2-1 مدل تعميم يافته خطي    77
4-3-2-2مدل شبکه‌هاي عصبي    82
4-3-3    تعيين ارتباط ميان آب گرفتگي نواحي مختلف يک منطقه    84
4-3-4    تعيين نواحي مستعدتر در هر منطقه در بروز مشکلات و معضلات شهري    86
4-4-   خلاصه فصل چهارم    87

 

 

فصل پنجم: بحث و نتيجه گيری
مقدمه        89
5-1-خلاصه        89
5-2-   دلايل با اهميت بودن نتايج و دستاوردهاي تحقيق    90
5-3-   جنبه ي نوآوري تحقيق    91
5-4-   نتايج تحقيق    91
5-4-1-    نتايج تحليل توصيفي    91
5-4-2-    نتايج حاصل از تحليل داده کاوي و ارائه ي دانش استخراج شده    94
5-4-2-1نتايج حاصل از شناسايي مناطق همگن با استفاده از روش خوشه بندي دو مرحله اي    94
5-4-2-2- نتايج پيش بيني تماس هاي آب گرفتگي در هر يک از مناطق به ازاي بارش هر ميليمتر باران    95
5-4-2-3تعيين ارتباط میان آب گرفتگي نواحي مختلف يک منطقه    96
5-4-2-4نتايج تحليل قوانين وابستگي براي شناسايي نواحي مستعدتر در هر منطقه در بروز مشکلات و معضلات شهري    97
5-5-  پاسخ به سوالات تحقيق    97
5-6-  محدوديت‌هاي تحقيق    98
5-7-  پيشنهادات تحقيق    99
5-8-  پيشنهادات جهت تحقيقات آتي    100
5-9-  خلاصه فصل پنجم    101

 

فهرست منابع        102
چکیده انگلیسی    105

 

 

 

 


فهرست  جداول
جدول 2-1 : نمونه اي از جدول پيام    35
جدول 2-2: تحقيقات خارجي در زمينه کاربرد داده کاوي در مراکز تماس    444
جدول4-1 : فيلد هاي جدول پيام    61
جدول 4-2: فيلد هاي جدول اطلاعاتي مربوط به اعتبار مصوب عمراني مناطق    61
جدول4-3: فيلد هاي جدول اطلاعاتي مربوط به بارش مناطق    61
جدول4-4: فراواني گروه هاي تماس    63
جدول4-5 پراکندگي مشکلات مربوط به گروه جمع آوري و نصب    65
جدول4-6 : طبقه بندي مشکلات بر اساس منطقه    66
جدول 4-7  سرانه تماس و بودجه مناطق بيست و دو گانه تهران    68
جدول4-8: شاخص‌هاي نيکويي برازش    78
جدول4-9: آزمون درستنمايي مدل خطي تعميم يافته    78
جدول4-10  آزمون عوامل مدل خطي تعميم يافته    79
جدول4-11 آزمون ضرائب مدل خطي تعميم يافته    79
جدول4-12 بخشي از ارتباط‌هاي دنباله‌اي شناسايي شده    85
جدول4-13 قوانين شناسايي شده به روش GRI    86

 

 

 

 

 


فهرست شکل ها
شکل 2-1 مراحل فرايند کشف دانش و جايگاه داده کاوي.    11
شکل2-2 مراحل فرايند CRISP-DM    13
شکل 2-1 چرخه گردش پيام- ماخذ: مرکز سامانه 137    36
شکل 2-2ساختار سازماني سامانه مديريت شهري سامانه 137-ماخذ: مرکز مديريت سامانه 137    39
شکل2-3 مدل مفهومي تحقيق    40
شکل3-1وضعيت ايستگاه هاي پنج گانه هواشناسي مستقر در شهر تهران مي باشد.    53
شکل3-2 روش اجرايي تحقيق    57
شکل4-1: درصد فراواني هر کدام از گروه‌هاي تماس    64
شکل 4-2 :سهم مناطق در تماس هاي از نوع "جمع آوري خاک و نخاله" و "نصب سطل زباله مخزن دار"    66
شکل4-3: رابطه ميان تعداد تماس، جمعيت و اعتبار مصوب عمرانی    69
شکل4-4 بررسي نه عامل اول در خوشه بندي    73
شکل4-5 بررسي نه عامل دوم در خوشه بندي    74
.شکل 4-6 بررسي هفت عامل آخر در خوشه بندي    75
شکل 4-7 اعضاي خوشه هاي اول و دوم    76
شکل 4-8 : آناليز مدل خطی تعميم يافته    81
شکل 4-9: نمودار صعود    81
شکل 4-10: مدل شبکه عصبي    83
شکل 4-11: آناليز مدل شبکه عصبی    84
شکل 5-1 : رابطه ميان تعداد تماس، جمعيت و اعتبار مصوب عمراني    93
شکل 5-2 اعضای خوشه اول و دوم    94