نوع مقاله : مقاله پژوهشی
نویسندگان
1 کارشناس ارشد گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران.
2 استادیار، دانشکده مهندسی نقشه برداری و اطلاعات مکانی، پردیس دانشکدههای فنی، دانشگاه تهران، تهران، ایران.
3 دکترای GIS، دانشکده مهندسی نقشه برداری و اطلاعات مکانی، پردیس دانشکدههای فنی، دانشگاه تهران، تهران، ایران.
4 استاد گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران.
چکیده
کلیدواژهها
علوم و تکنولوژی محیط زیست، دوره نوزدهم،ویژه نامه شماره 5، تابستان1396
پیشبینی غلظت آلاینده منوکسیدکربن در کلانشهر تهران با استفاده از شبکههای عصبی مصنوعی
حمیدرضاجدی[1]
رحیم علیعباسپور[2]*
مینا خالصیان[3]
سیدکاظم علویپناه[4]
تاریخ دریافت: 06/12/1393 |
تاریخ پذیرش:07/10/1394 |
چکیده
زمینه و هدف:. راهکارهای متعددی برای کنترل آلودگی هوا وجود دارد که یکی از آنها پیشبینی میزان آن است. هدف از این تحقیق ارایه یک مدل شبکه عصبی مصنوعی با ساختار چندلایه، برای آلاینده CO در شهر تهران برای پیشبینی 24ساعت آینده آن میباشد.
روش بررسی: از مشخصههای سرعت باد، جهت باد، دما، رطوبت نسبی و فشار هوا به عنوان دادههای هواشناسی و از غلظت منوکسیدکربن به عنوان پارامتر آلودگی هوا به منظور پیشبینی مقدار آلایندهCO در روز آتی (24 ساعت آینده) استفاده شد. جهت حذف نویز دادهها، در مرحله پیشپردازش دادهها، از دو روش تبدیل موجک و تعیین حد آستانه به کمک توزیع نرمال استفاده گردید.
یافتهها: نتایج حاصل از شاخصهای آماری ضریب همبستگی، شاخص توافق، دقت پیشبینی و جذر میانگین مربعات خطا برای مدل1 با دادههای تکراری به ترتیب 9012/0، 915/0، 848/0 و 1012/0 و برای مدل2 با دادههای تکراری به ترتیب9572/0، 978/0، 963/0 و 0385/0 میباشد.
نتیجه گیری: نتایج حاصل نشان میدهد توافق خوبی بین دادههای اصلی و دادههای پیشبینی شده توسط مدلها وجود دارد و مدلهای ارایه شده در پیشبینی آلودگی هوا از قابلیت بالایی برخوردارند.
واژههای کلیدی: پیش بینی آلودگی هوا، شبکه عصبی مصنوعی، آلاینده منواکسیدکربن.
Prediction of Carbon Monoxide Concentration in Tehran using Artificial Neural Networks
Hamid Reza Jeddi[5]
Rahim Ali Abbaspour[6]*
Mina Khalesian[7]
Seyed Kazem Alavipanah[8]
Abstract
Background and Objective: Nowadays, air pollution is one of the most important problems almost all over the world. There are many strategies to control and reduce air pollution, one of which is prediction of this event and getting ready to deal with the negative effects of it. The aim of this study is to provide a multi-layer structure of artificial neural networks (ANN) for predicting of carbon monoxide pollution at subsequent 24 hours in Tehran metropolis.
Method: To predict the amount of CO emissions in near future (subsequent 24 hours), wind speed and direction, temperature, relative humidity, and barometric pressure characteristics are used as meteorological data, and concentration of carbon monoxide is considered as a pollution parameter. To eliminate the noise of data, wavelets transform method and determining the threshold with normal distribution are used before training the ANN. Finally, two neural networks as two general models are proposed and used for modelling.
Findings: The results show that the correlation coefficient, index of agreement, accuracy of prediction, and root mean square error for model no. 1 with duplicate data are 0.9012, 0.915, 0.848, and 0.1012 and for model no. 2 with duplicate data are 0.9572, 0.978, 0.963, and 0.0385 respectively. Moreover, the results of listed parameters for model no. 1 with new data are 0.9086, 0.89, 0.885, and 0.0825 and for model No. 2 with new data are 0.8678, 0.928, 0.932, and 0.1163 respectively.
Conclusion: Results showed that there is a good agreement between predicted and observed values, hence the proposed models have a high potential for air pollution prediction.
Keywords: Prediction of air pollution, Artificial Neural Network (ANN), Carbon Oxide (CO).
مقدمه
امروزه آلودگی هوا یکی از مهمترین مشکلات جوامع بشری است. حجم این آلودگی به حدی است که خود پالایی نتوانسته از شدت آن جلوگیری نماید و این مساله را به یکی از مباحث مطرح زیست محیطی در دهههای اخیر تبدیل کرده است(1). یکی از راهکارهای کنترل آلودگی هوا پیشبینی آن است. مدلها، الگوریتمها و روشهای متعددی به منظور پیشبینی آلودگی هوا گسترش یافتهاند و هرکدام دارای نقاط قوت و ضعف مخصوص به خود میباشند(2، 3 و 4). یکی از روشهایی که به منظور پیشبینی آلودگی هوا مورد تاکید محققان بوده است، استفاده از شبکههای عصبی مصنوعی میباشد. تاکنون تحقیقات زیادی با استفاده از شبکههای عصبی مصنوعی در زمینه پیشبینی آلودگی هوا در داخل و خارج از کشور صورت گرفته است.
Ibarra-Berastegi (2008) در تحقیقی به منظور پیشبینی کوتاه مدت آلودگی هوا در کشور اسپانیا انجام دادند، از دادههای آلودگی، ترافیک و دادههای هواشناسی به منظور ورودی شبکه عصبی مصنوعی استفاده نمودند. مقایسه مقادیر بهدست آمده از مدل شبیهسازی شده با مقادیر واقعی نشان داد که مدل شبکههای عصبی مصنوعی ابزاری قدرتمند به منظور شبیهسازی پارامترهای آلودگی هوا بوده و ارزشهای شبیهسازی شده توسط مدل از توافق بالایی با مقادیر مشاهده شده برخوردارند(5). Ul-Saufie (2011) از دو مدل رگرسیون خطی چندگانه و شبکه عصبی پس انتشار خطا به منظور پیشبینی آلودگی هوا در کشور مالزی استفاده کرد و نتایج بهدست آمده از مقایسه آماری مقادیر دقت پیشبینی، شاخص توافق[9]، ضریب تشخیص[10]، خطای مطلق نرمال شده[11] وخطای RMSE، نشان داد مدل شبکه عصبی در مقایسه با مدل رگرسیون خطی چندگانه از قابلیت بالاتری در پیشبینی آلودگی هوا برخوردار است(6). Tecer (2007) به منظور پیشبینی مقدار غلظت SO2 و PM از مدل شبکههای عصبی مصنوعی استفاده نمود و نتایج نشان داد که مدل شبکههای عصبی قابلیت بالایی در پیشبینی آلودگی هوا دارند به طوری که مقادیر حاصل از مدل، همبستگی بالایی با مقادیر بهدست آمده از ایستگاههای سنجش آلودگی هوا دارند(7). بوداقپور(1390)، در تحقیقی به پیشبینی میزان آلاینده NOx در شهر تهران پرداخت. به این منظور از آمار غلظت گازهای آلاینده هوای ثبت شده توسط حسگرهای نصب شده درایستگاه بازار در سالهای 1381 تا 1386 و ازمدل اتورگرسیون و سریهای زمانی جهت تعیین ورودیهای شبکه عصبی استفاده شد و بر اساس این مدل غلظت گاز در زمان جاری به غلظت گازهای 7روز گذشته وابسته بود. نتایج این بررسی نشان داد که مدلهای ارایه شده توانایی چشمگیری در پیشبینی میزان آلودگی هوای شهرتهران دارند(8). نژادکردی و همکاران (2012) در تحقیقی که بر روی شهر تهران انجام دادند به پیشبینی حداکثر غلظت PM10 در 24 ساعت آتی پرداختند. بهاینمنظور از دادههای هواشناسی و غلظت آلایندهها به عنوان پارامترهای ورودی شبکه عصبی پس انتشار خطا استفاده شد. نتایج پیشبینی PM10 در همه ایستگاههای مورد مطالعه شاخص توافق بیش از 83% را نشان داد (9). صدرموسوی(1387) از شبکههای عصبی مصنوعی برای پیشبینی غلظت CO در کلانشهر تبریز استفاده نمود. نتایج حاصل بیانگر آنست که استقرار مراکز بزرگ صنعتی درغرب و جنوب غرب شهر تبریز مهمترین منبع آلودگی هوا است(10). در بین عمدهترین منابع آلودگی هوا، منوکسیدکربن، به دلیل تأثیر قابل توجه بر سلامت انسان و گسترش روز افزون استفاده از سوختهای فسیلی مخصوصاً در کلانشهرها، بهعنوان یکی از مهمترین آلایندههای هوا به شمار میرود (11). اکثر مطالعات انجام گرفته در زمینه بررسی شاخصهای کیفیت هوا، این گاز سمی را یکی از آلایندههای مهم در پایین بودن کیفیت هوا در روزهای غیربهداشتی معرفی کردهاند(12، 13، 14 و 15). بر این اساس پژوهش پیشرو سعی در ارایه مدلی جهت پیشبینی غلظت آلاینده CO در هوای شهر تهران دارد تا بتوان به کمک آن راهکارهای مناسبی را به فراخور زمان و شرایط موجود در راستای کنترل آلودگی هوا ارایه و اجرا نمود.
موادوروش ها
شبکههای عصبی مصنوعی
شبکههای عصبی مصنوعی سیستمهای محاسباتی هستند که برای یادگیری ماشینی در جهت پیشبینی پاسخهای خروجی از سامانههای پیچیده ایجاد شدهاند (16). ایدهی اصلی این گونه شبکهها الهامگرفته از نحوه کارکرد سیستم عصبی زیستی در پردازش دادهها برای یادگیری است. عنصر اصلی این ایده، ایجاد ساختارهایی جدید برای سامانه پردازش اطلاعات است. با استفاده از برنامهنویسی رایانهای میتوان ساختار دادهای طراحی کرد که همانند یک نرون عمل نماید و سپس با ایجاد شبکهای از این نورونهای مصنوعی به هم پیوسته، ایجاد یک الگوریتم آموزشی برای شبکه و اعمال این الگوریتم به شبکه، آن را آموزش داد. این شبکهها برای تخمین و تقریب کارایی بالایی از خود نشان دادهاند(17). نرونها سادهترین واحد ساختاری سیستمهای عصبی هستند (شکل1). نرونها از سه قسمت اصلی تشکیل شدهاند: 1-بدنه سلول،2-دندریت، 3-اکسون که دو قسمت اخیر عناصر ارتباطی نرون هستند(18).
شکل1-ساختار یک نرون طبیعی (17)
Figure 1- Structure of a natural neuron (17)
یک نرون مصنوعی مدلی محاسباتی است که از نرونهای عصبی واقعی انسان الهام گرفته است (19). در یک نگاه ساده، مدل یک سلول عصبی مصنوعی باید شامل ورودیهایی باشد که در نقش سیناپس انجام وظیفه کنند. این ورودیها در وزنهایی ضرب میشوند تا قدرت سیگنال را تعیین کنند. نهایتاً یک عملگر ریاضی تصمیمگیری میکند که آیا نرون فعال شود یا خیر و اگر جواب مثبت باشد، میزان خروجی را مشخص میسازد (17). شکل(2) مدل ریاضی یک نرون را نشان میدهد.
شکل2-مدل ریاضی سلول عصبی با چندورودی(17) Figure 2- Mathematical model of a neural cell with multiple input (17) |
در مقایسه این مدل با یک نرون بیولوژیکی، معادل شدت سیناپس، مجموعهی جمعکننده و تابع محرک معادل هسته سلول و معادل سیگنال گذرنده از اکسون است. خروجی نرون با معادله (1) تعریف میشود:
معادله(1)
پارامترهای و به ترتیب خروجی و ورودی نرون هستند. میزان تاثیر بر روی به وسیله تعیین میشود. تابع محرک (تابع تبدیل) که میتواند خطی یا غیر خطی باشد و جمله بایاس است. پارامترهای و قابل تنظیم هستند و تابع محرک نیز توسط طراح انتخاب میشود (16).
دو یا چند نرون میتوانند با هم در قالب یک لایه ترکیب شوند. در یک شبکه چند لایه، هر لایه ماتریس وزن (W) ویژه خود، بردار بایاس(b) خود، یک بردار ورودی(n) مربوط به خود و یک بردار خروجی (a) ویژه خود را دارد (19). هرچند نحوه مدل کردن نرون جزء نکات اصلی در کارآیی شبکه عصبی میباشد، اما نحوه برقراری اتصالات وچیدمان (توپولوژی) شبکه نیز عامل بسیار مهم و اثرگذاری است. یکی از کارآمدترین چیدمانهای پیشنهادی برای استفاده در مدلسازی، مدل پرسپترون چندلایه یا به اختصار MLP میباشد که از یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی تشکیل شده است (19). در این ساختار، تمام نرونهای یک لایه به تمام نرونهای لایه بعد متصلند (شکل3). این شبکهها قادرند با انتخاب مناسب تعداد لایهها و سلولهای عصبی، که اغلب تعداد آنها زیاد نیست، یک نگاشت غیر خطی را با دقت دلخواه انجام دهند(19). قاعده یادگیری پرسپترون در دسته قواعد یادگیری نظارت شده قرار میگیرد. در این روش، هنگامیکه ورودی به شبکه اعمال میشود، خروجی آن با هدف مقایسه میگردد، سپس از قواعد یادگیری برای تنظیم وزنها و بایاسها استفاده میشود تا خروجی شبکه را به هدف نزدیک نماید(18).
توپولوژی شبکه عصبی با تعداد لایهها، تعداد نرونها در هر لایه، الگوریتم یادگیری وتابع انتقال درشبکه تعیین میگردد. بهینهسازی توپولوژی شبکه عصبی گام مهمی در مدلسازی شبکه به شمار میآید. روند طراحی شبکه شامل مراحل زیر است (20):
شکل3-ساختار شبکه عصبی چند لایه(17 ) Figure 3-Structure of a multilayer neural network
|
منطقه مورد مطالعه
کلانشهر تهران، در کوهپایههای جنوبی رشتهکوه البرز با حدود 700 کیلومتر مربع مساحت گسترده شدهاست. شهر تهران دارای موقعیت خاص جغرافیایی است (اختلاف ارتفاع زیاد در شمال و جنوب آن) و دارای شرایط نامناسب بافت شهری است. وسائط نقلیه بسیار زیادی در طول شبانهروز در آن به فعالیت مشغولند و بادهای غربی در تمام طول سال دود کارخانجات و سایر عوامل آلودهکننده را به سطح شهر تهران وارد میسازند. عوامل متعددی در آلودگی شهر تهران مؤثرند که در بین آنها عوامل جغرافیایی و هواشناسی از اهمیت بیشتری برخوردارند. چنین گفته میشود که بهطور کلی مهمترین منابع تولید آلایندهها اشتعال سوختهای فسیلی میباشد.
شکل4-موقعیت تعدادی از ایستگاههای پایش آلودگی هوا شهر تهران Figure4- Position for some of the air pollution monitoring stations in Tehran |
ایستگاههای سنجش و پایش آلودگی هوا
سازمان محیط زیست و مرکز کنترل کیفیت آلودگی شهر تهران نهادهایی هستند که به بررسی و پایش آلودگی در شهر تهران میپردازند. در حال حاضر 19 ایستگاه سنجش آلودگی وابسته به سازمان محیط زیست در شهر تهران فعال هستند (شکل 4). هر چند این ایستگاهها به صورت پیوسته به اندازهگیری و ثبت آلاینده ها میپردازند، با این حال اغلب به دلیل نقص فنی دستگاههای ثبت آلودگی، وجود گپ و شکاف در دادهها اجتناب ناپذیر بوده و در بیشتر دادههای ارایه شده به چشم میخورد. در این بررسی نیز با توجه به وجود شکاف در بین دادههای موجود در تمامی ایستگاههای پایش آلودگی، از اطلاعات ثبت شده در ایستگاه پایش آلودگی آزادی واقع در میدان آزادی، با عرض جغرافیایی 35 درجه و 42 دقیقه و 16 ثانیه شمالی و طول جغرافیایی 51 درجه و 20 دقیقه و13 ثانیه شرقی، که دارای کمترین دادهی از دست رفته در طول سالهای 2008 و 2009 در مقایسه با سایر ایستگاهها بود استفاده شده است (شکل4).
پیش پردازش و آمادهسازی دادهها
باتوجه به اینکه یکی از مسایل مهم در بحث شبکههای عصبی مصنوعی، تهیه دادههای اولیه برای آموزش شبکه میباشد وتوانایی شبکه عصبی درپاسخ به مسایل جدید تا حد زیادی به دادههای اولیه بستگی دارد، لازم است به بررسی، جمعآوری، اندازهگیری و محاسبه ورودیهای شبکه عصبی پرداخته شود تا در مراحل بعدی با استفاده از این دادهها به آموزش و آزمایش شبکههای عصبی گوناگون پرداخته و بهترین شبکه برگزیده شود. در این بررسی به عنوان مشخصههای ورودی شبکه عصبی از میانگین روزانه دادههای آب و هوایی شامل سرعت باد، رطوبت نسبی، جهت باد، دما و فشارهوا و دادههای آلودگی هوا )غلظت آلاینده مونوکسیدکربن( استفاده گردید. به این منظور کل دادههای موجود به دو گروه تقسیم شدند:
با توجه به اینکه هدف این مطالعه پیشبینی روزانه میزان تغییرات غلظت مونوکسیدکربن است، لذا از متوسط غلظت ساعتی ثبت شده بهعنوان غلظت روزانه استفاده شد. جدول (1) پارامترهای ورودی شبکه عصبی مصنوعی را نشان میدهد.
جدول1-پارامترهای ورودی مدل شبکه عصبی مصنوعی Table 1- Input parameters to artificial neural network |
||||
انحراف معیار |
بیشینه |
کمینه |
میانگین |
پارامتر |
089154/2 |
509458/5 |
703708/1 |
22700/5 |
منوکسید کربن ((ppm |
46832/17 |
8525/89 |
99475/9 |
78399/36 |
رطوبت نسبی(%RH) |
6496/106 |
475/1057 |
9565/717 |
9211/898 |
فشار هوا (mBar) |
11197/10 |
98792/37 |
26171/5- |
83703/19 |
دما (°DegC) |
00512/46 |
05/282 |
22/86 |
1182/189 |
جهت باد (Deg) |
657424/0 |
737292/5 |
678083/0 |
622231/1 |
سرعت باد (m/s) |
روند تغییرات ماهیانه غلظت منوکسید کربن در سالهای 2008 و 2009 در نمودار شکل(5) نشان داده شده است. این نمودار نشان میدهد که روند تغییرات در ماههای آخر سال 2008 و اوایل سال 2009 ( فصل زمستان) شدیدتر بوده و بالاترین مقادیر غلظت منوکسیدکربن را به خود اختصاص داده است. همچنین میانگین غلظت ماهیانه منوکسید کربن در سال 2009 نسبت به ماههای مشابه در سال 2008 بهطور کلی بیشتر است.
شکل5-روند تغییرات ماهانه منوکسید کربن در سالهای 2008 تا 2009 Figure 5- Monthly changes trends of CO from 2008 to 2009
|
در این تحقیق دادههای جا افتاده یا ثبت نشدهو داده های پرتکه به علت نقص دستگاه و خطای اندازهگیری بهوجود میآید، دو مشکل اساسی در استفاده از مجموعه دادههای اصلی بود. به منظور رفع مشکل دادههای پرت از دو روش تبدیل موجک و تعیین حد آستانه به کمک منحنی توزیع نرمال استفاده گردید.
تعیین حد آستانه به کمک منحنی توزیع نرمال
به این منظور ابتدا دادهها از نظر تبعیت از توزیع نرمال بررسی شدند.(جدول2). با توجه به جدول 2، عدد متناظر با Sig. اگر مساوی یا بزرگتر از 05/0= P باشد (همانطور که در تست کولموگراف برابر با 2/0 و در تست شاپیرو برابر با 691/0 است)، به این معنی است که متغیر مورد نظر دارای توزیع نرمال است. با توجه به برخورداری دادهها از توزیع نرمال برای هر یک از پارامترهای ورودی شبکه حد آستانهای با استفاده از معادله (2) تعیین و دادههای خارج از این محدوده حذف گردیدند.(22). لذا، از 731 روز دادههای مورد مطالعه، 40 روز داده ثبت نشده و 31 روز داده پرت و مابقی به عنوان داده اصلی لحاظ شد.
معادله (2)
که در این رابطه داده های اصلی ، تعداد کل دادهها، میانگن دادهها و T مقدار حد آستانه است.
جدول2-نتایج تست کولموگروف
Table 2-The results of Kolmogorov-Smirnov test
شاپیرو-ویلک |
کولموگروف-اسمیرنوف |
آزمون آماری |
||||
Sig. |
df |
Statistic |
Sig. |
df |
Statistic |
|
691/0 |
10 |
952/0 |
20/0 |
10 |
174/0 |
متغیر |
تبدیل موجک
از آنجاییکه سیگنال بازسازی شده تقریبی از سیگنال اولیه است که با قرار دادن صفرها بین نمونهها بهدست میآید، لذا هرچه درجه تجزیه بیشتر باشد، سیگنال بازسازی شده انحراف بیشتری از سیگنال اولیه دارد. زیرا جزییات بیشتری را از دست داده و در واقع از فیلترهای پایینگذر بیشتری عبور داده شده است. بنابراین، جهت بهدست آوردن معیاری برای سطح تجزیه از الگوریتم معکوس تبدیل موجک استفاده میشود. در این تحقیق موجک Haar با درجه تجزیه 2 در نظر گرفته شده است، چرا که در این سطح، سیگنال بازسازی شده بیشترین شباهت را به سیگنال اصلی داشته است و از این سطح تجزیه به بعد، انحراف سیگنال بازسازی شده از سیگنال اصلی بسیار زیادتر بوده است. در پایان، بازسازی موجکها بر اساس حد آستانه انتخاب شده و درجه N انجام گرفته است(شکل6).
شکل 6- سیگنال بازسازی شده Figure 6-Reconstructed signal
|
نرمال سازی دادهها
پس از انجام مراحل فوق، در جهت آموزش بهینه شبکه مشخصههای آب و هوایی و آلودگی، پیش از اینکه وارد شبکه شوند، مطابق معادله (3) درمحدوده صفر تا یک نرمالسازی شدند. از جمله فواید نرمالسازی دادههای ورودی این است که از به وجود آمدن وزنهای با مقدار عددی خیلی بزرگ یا کوچک در طول محاسبات جلوگیری میکند(25)
معادله (3) =
و مقادیر کمینه و بیشینه مشاهده شده داده اصلی و داده نرمال سازی شده است. دادههای نرمال سازی شده پس ازمدلسازی، با بهرهگیری ازفرمول زیر(معادله4) به داده اصلی (X) برگردانده میشوند.
معادله (4) X = [(+
معماری شبکه عصبی
برای تعیین بهترین توپولوژی شبکه عصبی شامل بهترین تعداد لایه، تعداد نرون در هر لایه، تابع انتقال و الگوریتم آموزش، برنامههای لازم در محیط نرم افزار متلب پیادهسازی شد. الگوریتم بهگونهای طراحی شد که قابلیت بررسی تمامی حالات ممکن از نظرتعداد لایه، تعداد نرون در هر لایه، توابع انتقال مختلف و همچنین الگوریتمهای آموزش متفاوت را دارا باشد. به این منظور از تابعF مطابق تعریف زیر، به عنوان تابع هدف در بهینهسازی شبکه استفاده شده است(معادله5). تابع F طوری تعریف شد که میزان خطای مرتبط با هر سه گروه داده شامل دادههای آزمایش، آموزش و تایید را در نظر بگیرد. از طرفی با توجه به اینکه الگوریتم بهگونهای طراحی شد که 60 % دادههای ورودی در جهت آموزش شبکه و 20% به عنوان دادههای تاییدو 20% به عنوان داده های آزمایشدر نظر گرفته شد، به مقدار خطای حاصل از داده های آموزش، ضریب کمتری اعمال شد تا نتایج حاصل، کمتر تحت تاثیر این پارامتر قرار گیرند.
F= 0.3perf + 0.35vperf + 0.35tperf معادله (5)
tperf عملکرد شبکه در ارتباط با دادههای آزمایش، vperf عملکرد شبکه در ارتباط با دادههای تایید و perf عملکرد شبکه در ارتباط با دادههای آموزش شبکه است.
روند کار اینگونه است که برای مثال در اولین تکرار الگوریتم، بردارهای ورودی (دادههای سالهای 2008 و 2009) به شبکهای با ساختار A لایه پنهان که دارای B نرون در هر یک از لایهها با تابع انتقال X و الگوریتم آموزش Y است، اعمال و مقادیر بهدست آمده برای سه پارامتر عملکرد شبکه در ارتباط با دادههای آزمایش، دادههای تایید و دادههای آموزش در ضرایب در نظرگرفته شده در معادله(5) ضرب و مقدار F برای ساختار شبکه عصبی با مشخصات فوق حاصل میشود. این روند برای تمامی ساختارهای دیگر شبکه عصبی در یک تکرار برنامه ادامه یافته و در نهایت پس از پایان یک دور تکرار، مقادیر متفاوتی از تابع F برای ساختارهای مختلفی از شبکه عصبی حاصل میشود. حال نوبت به انجام دور دوم برنامه میرسد و با توجه به این نکته که مقدار دهی اولیه وزنها و بایاسها کاملا تصادفی است، این بار نیز با مقدار F متفاوتی برای همان ساختار شبکه عصبی با A لایه پنهان که در بالا اشاره شد مواجه میشویم. به این منظور مقدار میانگین تابع F برای 2 تکرار محاسبه و در آرایهای ذخیره میشود. در نهایت این الگوریتم روند ذکر شده را برای 1000 دور تکرار متوالی انجام و مقادیر بهدست آمده برای تابع F با ساختارهای مختلف با یکدیگر مقایسه و ساختار مربوط به کمترین مقدار تابع F به عنوان بهترین ساختار شبکه عصبی انتخاب گردید. در روند آموزش شبکه در هر تکرار برنامه برای جلوگیری از آموزش بیش از حدشبکه که منجر به ایجاد خطا در نتایج میشود، شروط زیر در نظر گرفته شد:
- روال آموزش در صورتی که خطای ارزیابی طی 10 تکرار متوالی افزایش یابد، متوقف شود.
- روال آموزش هر زمان که عملکرد نهایی شبکه به مقداری کمتر از 01/0 رسید، متوقف گردد.
- روال آموزش در صورتی که در 500 تکرار متوالی هیچ یک از دو شرط بالا محقق نشد، متوقف شود.
در این مرحله، ابتدا از دادههایی که با استفاده از روش تعیین حد آستانه به کمک منحنی توزیع نرمال، حذف نویز شده بودند و سپس از دادههایی که با استفاده از روش تبدیل موجک حذف نویز گردیده بودند، به عنوان بردارهای ورودی آموزش شبکه استفاده شد. بر این اساس، در ارتباط با دادههایی که با روش اول حذف نویز گردیدند، ساختار شبکه عصبی با 2 لایه پنهان شامل 4 نرون در لایه اول و 6 نرون در لایه دوم با توابع انتقال تانژانت سیگموئد (tansig) در دو لایه پنهان و تابع خطی (purelin) در لایه خروجی (شکل7) و با الگوریتم آموزش لونبرگ- مارکوئت (Levenberg-Marquardt) دارای کمترین مقدار F بوده است. در ادامه، از این ساختار شبکه با عنوان مدل 1 یاد خواهد شد(شکل8). همچنین در ارتباط با دادههایی که با روش دوم حذف نویز گردیدند، ساختار شبکه عصبی با 2 لایه پنهان شامل 8 نرون در لایه اول و 7 نرون در لایه دوم با توابع انتقال تانژانت سیگموئد (tansig) در دو لایه پنهان و تابع خطی(purelin) در لایه خروجی و با الگوریتم آموزش لونبرگ- مارکوئت دارای کمترین مقدار F است. در ادامه، از این ساختار شبکه با عنوان مدل 2 یاد میشود(شکل9).
یافته ها
در این تحقیق از شاخصهای آماری ضریب همبستگی، شاخص توافق(IA)، دقت پیشبینی(PA) و جذر میانگین مربعات خطا (RMSE) برای بررسی دقت مدلهای ارایه شده استفاده شد. به منظور ارزیابی دقت مدلهای شبکه عصبی در امر پیشبینی، دو گروه داده به مدلهای ارایه شده اعمال گردید، به این صورت که در مرتبه نخست از همان دادههایی که برای آموزش شبکه استفاده شده بود (دادههای سال2008 و 2009 )، مجدداً به عنوان ورودی به مدلها استفاده شد(دادههای تکراری). در ادامه نیز دادههای زمستان سال 1389(21 دسامبر 2010 تا 20 مارس 2011) که در روند آموزش شبکه استفاده نشده بودند (دادههای جدید)، به مدلهای شبکه عصبی اعمال شد که جدول(3) به مقایسه نتایج شاخصهای آماری بهدست آمده از مدلها پرداخته است.
شکل7-تابع انتقال خطی(a) ، تابع انتقال تانژانت سیگموئد(b)
Figure 7-linear transfer function, (b) Tan-Sigmoid transfer function
شکل9-ساختار شبکه عصبی(مدل2) Figure 9- Structure of neural network (model no. 2) |
شکل8-ساختار شبکه عصبی(مدل1) Figure 8- Structure of neural network (model no. 1) |
جدول3-شاخصهای آماری
Table 3- Statistical indices
شاخصهای آماری |
دادههای تکراری |
دادههای جدید |
||
مدل 1 |
مدل 2 |
مدل 1 |
مدل 2 |
|
خطای جذر میانگین مربعات |
1012/0 |
0385/0 |
0825/0 |
1163/0 |
ضریب همبستگی |
9012/0 |
9572/0 |
9086/0 |
8678/0 |
شاخص توافق |
915/0 |
978/0 |
89/0 |
928/0 |
شاخص دقت پیشبینی |
848/0 |
963/0 |
885/0 |
932/0 |
در مرحله حذف نویز و پیشپردازش بردارهای ورودی، استفاده از تبدیل موجک در مقایسه با تعیین حد آستانه نتایج بهتری دارد. شکلهای 10 و 11 ضریب همبستگی دادههای واقعی و شبیهسازی شده توسط مدلها را نشان میدهد. برای داده های جدید، مدل 1 ضریب همبستگی بالاتری از مدل 2 دارد، در حالی که در ارتباط با دادهای تکراری مدل 2 نتایج بهتری دارد.
|
|
شکل(10الف)-ضریب همبستگی بین دادههای جدید و شبیهسازی شده توسط مدل 1 Figure 10-(a) Correlation coefficient between new data and simulated data generated by model no. 1 |
شکل(10ب)-ضریب همبستگی بین دادههای تکراری و شبیهسازی شده توسط مدل 1 Figure 10-(b) Correlation coefficient between repeated data and simulated data generated by model no. 1 |
شکل(11الف)-ضریب همبستگی بین دادههای جدید و شبیهسازی شده توسط مدل 2 Figure 11-(a) Correlation coefficient between new data and simulated data generated by model no. 2 |
شکل(11ب)-ضریب همبستگی بین دادههای تکراری و شبیهسازی شده توسط مدل 2 Figure 11-(b) Correlation coefficient between repeated data and simulated data generated by model no. 2 |
همانطور که از مقایسه مقادیر شبیهسازی شده با مقادیر واقعی مشخص است (شکلهای12 الف و 12ب، 13الف و 13ب )، مدلهای شبکه عصبی مصنوعی ارایه شده در این بررسی ابزارهایی قدرتمند به منظور شبیهسازی پارامترهای آلودگی هوا بوده و ارزشهای شبیهسازی شده توسط مدلها از توافق بالایی با مقادیر مشاهده شده برخوردارند. این توافق در دادههای شبیهسازی شده با بردارهای ورودی تکراری، بارزتر است که مهمترین دلیل آن استفاده از همین بردارها در مرحله آموزش شبکه است(شکلهای 4-5 و 4-7)، اما در ارتباط با دادههای زمستان 1389(دادههای جدید) که هیچ نقشی در روند آموزش شبکهها نداشتهاند، توافق کمتری مشاهده میشود.
شکل(12الف)-دادههای شبیهسازی شده توسط مدل 1 برای دادههای جدید(زمستان 1389) Figure 12-(a) simulated data generated by model no. 1 for new data (winter 2008-2009) |
شکل(12ب)-دادههای شبیهسازی شده توسط مدل 1 برای دادههای تکراری (سالهای 2008 و 2009) Figure 12-(b) simulated data generated by model no. 1 for repeated data (winter 2008-2009) |
شکل(13الف)-دادههای شبیهسازی شده توسط مدل 2 برای داده های جدید(زمستان 1389) Figure 13- (a) simulated data generated by model no. 2 for new data (winter 2008-2009) |
شکل(13ب)-دادههای شبیهسازی شده توسط مدل 2 برای دادههای تکراری (سالهای 2008 و 2009) Figure 13- (b) simulated data generated by model no. 2 for repeated data (winter 2008-2009) |
با توجه به معیارهای ارزیابی، نتایج نشان دهنده توانایی بالای مدل مورد استفاده است. برای مقایسه نتایج حاصل از این پژوهش با پژوهش های مشابه مورد اشاره در پیشینه تحقیق، با توجه به تفاوت شاخصهای مورد استفاده و تمرکز این پژوهش ها بر برخی از پارامترها، عملاً امکان مقایسه فراهم نگردید.
بحث و نتیجه گیری
منوکسیدکربن یکی از عمدهترین منابع آلودگی هوا است. پژوهش پیشرو سعی در ارایه مدلی جهت پیشبینی غلظت آلاینده منوکسیدکربن در هوای تهران دارد تا بتوان به کمک آن راهکارهای مناسبی را به فراخور زمان و شرایط موجود در راستای کاهش و کنترل آلودگی هوا ارایه و اجرا نمود.
روش مورد استفاده در این پژوهش بدین گونه است که پس از پیشپردازش دادهها و حذف دادههای نویزی و دارای خطا با استفاده از دو روش تبدیل موجک و تعیین یک حد آستانه به کمک توزیع نرمال، دو مدل شبکه عصبی مصنوعی به منظور پیشبینی میزان آلودگی برای روزهای آتی ارایه شد.
نتایج نشان میدهد با توجه به اینکه ماهیت تغییرات و نوسانات غلظت آلاینده مونوکسیدکربن و به طور کلی پدیدههای طبیعی، غیر خطی است و با بررسی نمودارها و جداول موجود در این پژوهش میتوان دریافت که مدلهای شبیهسازی ارایه شده، به خوبی توانایی شبیهسازی شرایط آینده را دار هستند، این خود نشان از قابلیت بالای شبکههای عصبی در تخمین و تقریب نگاشتهای غیر خطی است. مقایسه نتایج حاصل از مدلهای ارایه شده بیانگر اهمیت پیشپردازش و آمادهسازی دادههای ورودی شبکه عصبی است، چرا که ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ راﺑطه ﻣﺴﺘقیم ﺗﻮان ﻋﺼﺒﯽ و آﻣـــﺎرﻫـــﺎی اﺳﺘﻔﺎده ﺷــﺪه در آﻣـــﻮزش آن، ﻻزم اﺳﺖ در ﺗهیه دادهﻫﺎی آﻣــﻮزش ﺷبکه ﻋﺼﺒﯽ دﻗﺖ ﻻزم ﺑﻪ ﻋﻤﻞ آید ﺗﺎ ﺷﺒکه ﻋﺼﺒﯽ تعمیم ﭘذیری ﻣﻨﺎﺳﺒﯽ در ﻣﻮاﺟﻬﻪ ﺑﺎ دادهﻫﺎی ﺟدید داﺷﺘﻪ ﺑﺎﺷﺪ.
منابع
1- اصیلیان. حسن، قانعیان. محمدتقی و غنیزاده. قادر، 1386، آلودگی هوا، انتشارات میترا.
2- Zannetti, p. 1990; Air pollution modeling, theories, computational methods and software’s, computational mechanics publication, WIT Press.
3- Collett RS, Oduyemi K. 1997; Air quality modelling: a technical review of mathematical approaches. Meteorological Applications. 4(03):235-46.
4- Sharma N, Chaudhry K, Rao CC. 2005; Vehicular pollution modeling using artificial neural network technique: A review. Journal of Scientific and Industrial research. 64(9):637.
5- Ibarra-Berastegi G, Elias A, Barona A, Saenz J, Ezcurra A, de Argandoña JD. 2008; From diagnosis to prognosis for forecasting air pollution using neural networks: Air pollution monitoring in Bilbao. Environmental Modelling & Software. 23(5):622-37.
6- Ul-Saufie AZ, Yahya AS, Ramli NA, Hamid HA. 2011; Comparison between multiple linear regression and feed forward back propagation neural network models for predicting PM10 concentration level based on gaseous and meteorological parameters. International Journal of Applied. 1(4).
7- Tecer LA, 2007; Prediction of SO2 and PM Concentrations in a Coastal Mining Area (Zonguldak, Turkey) Using an Artificial Neural Network. Polish J. of Environ. Stud. 16(04): 633-638
8- بوداقپور. سیامک،1390، پیش بینی میزان غلظت آلایندههای هوای تهران با استفاده از شبکه عصبیمصنوعی، علوم و تکنولوژی محیط زیست، دوره 13، صص 1-10.
9- Nejadkoorki, F. and S. Baroutian, 2012. "Forecasting extreme PM10 concentrations using artificial neural networks." Int. J. Environ. Res 6(1): 277-284.
10- سبحانی اردکانی. س، اسماعیلی ساری. ع، چراغچی. م، طیبی. ل و قاسمرودی. م، 1386، تعیین کیفیت بهداشتی هوای تهران در سال 1383 با استفاده از شاخص کیفیت هوا ، علوم تکنولوژی و محیطزیست، شماره 4، صص 38-33.
11- صدر موسوی. میرستار، و رحیمی. اکبر، 1387، ارزیابی کاربرد شبکههای عصبی مصنوعی در پیشبینی منوکسید کربن در هوای شهر تبریز، فصلنامه منابع طبیعی ایران ، سال شصت و یکم، شماره 3
12- سبحانی اردکانی. س و اسماعیلی ساری. ع، چراغچی. م، طیبی. ل و قاسمرودی. م، 1386، تعیین کیفیت بهداشتی هوای تهران در سال 1383 با استفاده از شاخص کیفیت هوا ، علوم تکنولوژی و محیط زیست، شماره 4، صص 38-33.
13- نظم آرا. ش، هاشم خانی. م، ذوقی. الف، 1386، بررسی وضعیت CO موجود در شهر تهران با استفاده از شاخص کیفیت هوا (AQI) دهمین همایش ملی بهداشت محیط ، دانشگاه علوم پزشکی همدان.
14- اله حسینی، الف، هاشمی. ه و نیکروان، م، 1389، تحلیل و بررسی آماری دادههای شاخص آلودگی هوای تهران از سال 1381 الی 1387، پنجمین کنگره ملی مهندسی عمران ، دانشگاه فردوسی، مشهد.
15- منهاج. محمدباقر، 1384 ،مبانی شبکه های عصبی مصنوعی، انتشارات دانشگاه صنعتی امیر کبیر.
16- Patterson, W. 1996; Artificial Neural Network: Theory and Applications, second edition, Prentice Hall Press.
17- Shepherd, G.M, 1990, The synaptic organization of the brain, third edition, Oxford university press
18- Fausett, Larson. 1994; Fundamental of neural network: architecture, algorithms, and applications, prentice Hall Press.
19- Chelani, Asha B., Chalapati Rao, K.M. Phadke & M.Z. Hasan, 2002; Prediction of Sulphur dioxide concentration using artificial neural networks. Environmental Modelling & Software; 17: 161–168.
20- شرعی پور. زهرا، 1389،بررسی غلظت آلایندههای هوا و ارتباط آن با پارامترهای هواشناسی، چهاردهمین کنفرانس ژئوفیزیک ایران، ایران.
21- Narasimhan, S.V., Nandini Basumallick, S. 2011, Introduction to Wavelet Transform: A Signal Processing Approach.
1- کارشناس ارشد گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران.
2*-(مسوول مکاتبات): استادیار، دانشکده مهندسی نقشه برداری و اطلاعات مکانی، پردیس دانشکدههای فنی، دانشگاه تهران، تهران، ایران.
[3]- دکترای GIS، دانشکده مهندسی نقشه برداری و اطلاعات مکانی، پردیس دانشکدههای فنی، دانشگاه تهران، تهران، ایران.
[4]- استاد گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران.
1- MSc in GIS/RS, Department of GIS/RS, Faculty of Geography, University of Tehran, Tehran ,Iran.
2- Assistant Professor, Faculty of Surveying and Geospatial information engineering, College of Engineering, University of Tehran, Tehran ,Iran.* (Corresponding Author)
[7]- PhD Faculty of Surveying and Geospatial Information Engineering, College of Engineering, University of Tehran, Tehran ,Iran.
[8]- Professor Department of GIS/RS, Faculty of Geography, University of Tehran, Tehran , Iran.
1-Index of agreement
2-Coefficient of determination
3-Normalized absolute error