طبقهبندی برگهای گیاهان دارویی بر اساس ویژگیهای چندطیفی و بافتی با استفاده از رویکرد یادگیری ماشین
منبع:
Naeem, S., Ali, A., Chesneau, C., Tahir, M. H., Jamal, F., Sherwani, R. A. K., & Ul Hassan, M. (2021). The classification of medicinal plant leaves based on multispectral and texture feature using machine learning approach. Agronomy, ۱۱(۲), ۲۶۳.
مقدمه:
گیاهان دارویی در درمانهای سنتی و پزشکی نوین جایگاه ویژهای دارند، اما شناسایی گونههای مختلف آنها بر اساس شکل برگ با دشواریهایی مواجه است، بهویژه در شرایطی که گونهها شباهت مورفولوژیکی دارند. در این میان، استفاده از فناوریهای پردازش تصویر و یادگیری ماشین میتواند نقش بسزایی در شناسایی سریع و دقیق این گونهها ایفا کند.
مقاله حاضر با هدف طبقهبندی خودکار برگهای شش گونه گیاه دارویی شامل ریحان مقدس (Tulsi)، نعناع فلفلی (Peppermint)، نعناع بائل (Bael)، بادرنجبویه (Lemon Balm)، پونه گربه ای (Catnip) و استویا (Stevia)، سیستمی ترکیبی را معرفی میکند که در آن از ویژگیهای چندطیفی (Multispectral) و بافتی (Texture) برگها استفاده شده است. برای گردآوری دادهها، از یک سیستم تصویربرداری چندطیفی استفاده شده که شامل کانالهای نوری قرمز، سبز، آبی، نزدیک فروسرخ (NIR) و فروسرخ کوتاه (SWIR) است. در کنار آن، تصاویر دیجیتالی نیز بهمنظور استخراج ویژگیهای ظاهری و بافتی بهکار رفتهاند. در مرحله بعد، ویژگیها با روش آماری کی-اسکوئر (Chi-square) کاهش داده شدند تا فقط ویژگیهای مهم باقی بمانند. سپس مدلهای مختلف یادگیری ماشین مانند MLP، LogitBoost، Random Forest، Bagging و Simple Logistic برای طبقهبندی مورد استفاده قرار گرفتند.
نوآوری تحقیق در آن است که با ترکیب اطلاعات چندطیفی و بافتی، و استفاده از نواحی مختلف تصویر برگ (ROI) در دو اندازه مختلف، میزان دقت مدلها مقایسه و تحلیل شده است. هدف نهایی مقاله، ارائه مدلی سریع، دقیق و قابلاعتماد برای طبقهبندی گیاهان دارویی بهویژه در مواردی است که استفاده از متخصص گیاهشناسی دشوار یا زمانبر است.
نتایج:
نتایج تحقیق نشان میدهد که میان مدلهای مورد آزمایش، شبکه عصبی چندلایهای (MLP) بالاترین دقت طبقهبندی را داشته است. زمانی که اندازه ناحیه انتخابی (ROI) برابر با ۲۲۰ در ۲۲۰ پیکسل در نظر گرفته شد، دقت مدل MLP به ۹۵٫۸۷٪ رسید و در مقابل، مدلهای LogitBoost، Bagging، Random Forest و Simple Logistic بهترتیب دقتهایی معادل ۹۵٫۰۴٪، ۹۴٫۲۱٪، ۹۳٫۳۸٪ و ۹۲٫۵۶٪ از خود نشان دادند. هنگامی که اندازه ROI به ۲۸۰ در ۲۸۰ پیکسل افزایش یافت، دقت تمامی مدلها بهبود یافت بهطوریکه مدل MLP دقت ۹۹٫۰۱٪، LogitBoost دقت ۹۸٫۰۱٪، Bagging دقت ۹۷٫۰۲٪، Random Forest دقت ۹۶٫۰۳٪ و Simple Logistic دقت ۹۵٫۰۴٪ را ثبت کردند. معیارهای عملکرد دیگر مانند نرخ مثبت واقعی (TPR)، آمار کاپا، F-measure و سطح زیر منحنی ROC نیز نشان دادند که MLP در مقایسه با سایر مدلها از عملکرد پایدارتری برخوردار است. برای نمونه، مقدار کاپا برای مدل MLP در ROI بزرگتر برابر با ۰٫۹۸۷۶ و TPR آن برابر با ۰٫۹۹۰ گزارش شد. ماتریس اغتشاش بهکار رفته برای ارزیابی دقت مدل نیز نشان داد که مدل MLP توانسته بیش از ۹۹٪ نمونههای هر کلاس را بهدرستی طبقهبندی کند، بهجز موارد بسیار اندکی که شباهتهای بین کلاسها موجب خطا شده بود. در مجموع، افزایش اندازه ROI موجب افزایش اطلاعات مفید در تصویر و در نتیجه افزایش دقت مدلها شده است. بهطور خاص، مدل MLP در هر دو حالت با اختلاف معناداری نسبت به سایر مدلها بهتر عمل کرد و توانست در شرایط واقعی نیز قابلاعتماد باشد.
بحث:
تحلیل نتایج بهخوبی نشان داد که ترکیب ویژگیهای چندطیفی و بافتی برگها باعث بهبود قابلتوجه عملکرد مدلهای یادگیری ماشین میشود، بهویژه زمانی که انتخاب ویژگیها بهدرستی با روشهای آماری مانند کی-اسکوئر انجام شود. همچنین افزایش اندازه ROI بهعنوان یک عامل کلیدی در بهبود دقت شناخته شد؛ زیرا با افزایش ناحیه مورد بررسی، اطلاعات غنیتری از ساختار برگ در اختیار مدل قرار میگیرد. از میان مدلهای آزمایششده، MLP بهترین عملکرد را داشت، که به دلیل توانایی آن در یادگیری روابط پیچیده بین ویژگیها و کلاسهاست. این موضوع نشان میدهد که استفاده از مدلهای عمیقتر و پیچیدهتر میتواند مزیتهای قابلتوجهی در زمینه طبقهبندی دقیق گیاهان دارویی داشته باشد. مقایسه با تحقیقات پیشین نیز این نکته را تقویت میکند؛ بهعنوان مثال، در مطالعاتی که از ویژگیهای رنگی و شکلی همراه با SVM یا CNN استفاده شده بود، دقت مدلها به ۹۶ تا ۹۸ درصد محدود میشد. در حالیکه در این تحقیق، مدل MLP توانست به دقت ۹۹ درصد برسد. با این حال، برخی محدودیتها نیز وجود دارد؛ از جمله اینکه تحقیق فقط بر روی شش گونه گیاه دارویی تمرکز داشته و دادهها در شرایط کنترلشده تصویربرداری شدهاند. همچنین استفاده از ROI بزرگتر ممکن است باعث افزایش نویز در دادهها شود. برای تحقیقات آینده پیشنهاد میشود که از طیفسنجیهای پیشرفتهتری مانند hyperspectral imaging و نیز رویکردهای شیء-محور استفاده شود و دامنه گونههای مورد بررسی نیز گسترش یابد. در نهایت میتوان گفت که تحقیق حاضر گامی مؤثر در جهت ساخت سیستمهای خودکار و دقیق برای شناسایی گیاهان دارویی است که قابلیت پیادهسازی در کاربردهای عملی مانند نرمافزارهای تلفن همراه یا دستگاههای قابلحمل را نیز دارد.
https://medplant.ir/?p=38104
