تشخیص ترک بتن بر مبنای دید رایانه ای با استفاده از شبکه های کاملا پیچشی U-net
تشخیص ترک بتن بر مبنای دید رایانه ای با استفاده از شبکه های کاملا پیچشی U-net
(تشخیص ترک بتن توسط دید رایانه ای)
چکیده
برای اولین بار، U-Net برای شناسایی ترک های بتنی در مطالعه حاضر استفاده می شود. عملکرد از دست دادن کانون به عنوان عملکرد ارزیابی انتخاب می شود و الگوریتم آدام برای بهینه سازی استفاده می شود. U-Net آموزش دیده قادر است با اثربخشی و استحکام بالا مکان ترک را از تصاویر خام ورودی در شرایط مختلف (مانند روشنایی، پس زمینه نامرتب، عرض ترک ها و …) شناسایی کند. (تشخیص ترک بتن توسط دید رایانه ای)
علاوه بر این، روش تشخیص ترک بتن مبتنی بر U-Net پیشنهاد شده در مطالعه حاضر با روش مبتنی بر DCNN مقایسه می شود و در می یابیم که U-Net با استحکام بیشتر، اثر بخشی بیشتر و تشخیص دقیق تر، از ظرافت بیشتری نسبت به DCNN برخوردار است.
علاوه بر این، با بررسی پارامترهای اساسی نشان دهنده عملکرد روش، مشخص می شود که U-Net حاضر با مجموعه آموزش کوچکتر از FCN های قبلی به دقت بالاتری می رسد.
کلید واژه ها: تشخیص ترک، U-net، FCN، مبتنی بر دید، داده محور
مقدمه
تعداد زیادی از ساختمانها به تدریج به طول عمر پیش بینی شده خود رسیده اند. بنابراین، لازم است یکپارچگی ساختار بررسی شود. در عین حال، با پیر شدن جمعیت و افزایش هزینه های نیروی کار، نحوه نظارت مستمر و خودکار بر ساختار با کمترین میزان نیروی انسانی به یک جهت مهم تحقیقاتی تبدیل شده است [1–3].
در گذشته، نتایج با تکیه بر بازرسی نیروی انسانی حساس بودند، نه تنها نتایج غیر قابل اعتماد بودند، بلکه وقت گیر نیز بودند.
علاوه بر این، هنگام تشخیص پل ها یا تونل ها، بستن آنها ضروری است، که نه تنها بر عملکرد طبیعی ترافیک تأثیر می گذارد، بلکه ایمنی بازرسان را نیز تضمین نمی کند. در موارد جدی، ممکن است حوادث خطرناک رخ دهد. (تشخیص ترک بتن توسط دید رایانه ای)
بنابراین، بسیاری از گروه های تحقیقاتی، فناوری نظارت بر سلامت ساختاری (SHM) را پیشنهاد کرده اند [4–11]. به منظور استقرار یک سیستم SHM، از روش شناسایی سیستم ساختاری مبتنی بر ارتعاش با استفاده از روش تبدیل عددی استفاده شده است.
به عنوان مثال، Chatzi و همکاران روشی را برای تشخیص محل نقص در یک سازه با استفاده از الگوریتم XFEM-GA [6] پیشنهاد کردند و یک تخمین کوتاه کلی را با کوچکترین خطای اندازه گیری سنسور برای نشان دادن موقعیت آن اعمال کردند.
با این وجود، به دلیل عدم قطعیت های مختلف و اثرات نابرابر زیست محیطی، این روش هنوز با چالش های متعددی در نظارت بر زیرساخت های مهندسی عمران در مقیاس بزرگ روبرو است [7].
اگرچه چندین SHM وجود دارد که قادر به تشخیص ساختاری در مقیاس بزرگ هستند [8،9] ، اما آنها به تعداد زیادی ابزار مانند نصب تعداد زیادی سنسور، تلفیق داده ها از منابع توزیع شده و جبران اثرات زیست محیطی نیاز دارند.
علاوه بر این، از شکل گیری سیستم SMH به راحتی نمی توان تأیید کرد که آیا داده های جمع آوری شده به وضوح آسیب ساختاری یا خرابی سیستم سنسور، سیگنال نویز یا ترکیبی از موارد فوق را نشان می دهد.
بنابراین، تعداد زیادی از روشهای پردازش تصویر (IPT) مبتنی بر روش های تشخیص آسیب ارائه شده است.
یک مزیت قابل توجه IPT این است که تقریباً همه نقص های سطح قابل شناسایی هستند. Yeum و Dyke مطالعه ای را با استفاده از IPT همراه با فناوری پنجره لغزنده برای تشخیص ترک انجام دادند [12].
این تحقیق نمایانگر توانایی بالقوه IPT است. اگرچه نمونه های آزمایشی آنها دارای بسیاری از ویژگی های ترک مانند است، اما این ویژگی های غیر ضروری به طور موثر برطرف می شوند و ترک های قابل توجهی با استفاده از فیلترهای Frangi [13] و آشکارسازهای لبه مبتنی بر ماتریس Hessian [14] استخراج می شوند.
با این حال، تشخیص لبه یک مسئله ناجور است [15]. نتایج به نویز حساس هستند، که عمدتا توسط نور و اعوجاج ایجاد می شود.
یک روش موثر برای غلبه بر این مشکلات، اجرای تکنیک های حذف نویز است. حذف نویز تغییر کلی یک روش شناخته شده است که نویز داده های تصویر را کاهش می دهد و قابلیت تشخیص لبه تصویر را افزایش می دهد [16].
با این حال، کاربردهای پردازش تصاویر با استفاده از دانش قبلی محدود است زیرا داده های تصویر گرفته شده در دنیای واقعی بسیار متفاوت است.(تشخیص ترک بتن توسط دید رایانه ای)
IPT نیاز به طراحی الگوریتم استخراج ویژگی مناسب برای داده های خاص دارد، اما استخراج ویژگی های سطح بالا (به عنوان مثال اطلاعات معنایی مانند محل و عرض ترک ها) از عکس ها بسیار دشوار است.
علاوه بر این، لازم است که یک الگوریتم طبقه بندی کننده مناسب برای خروجی طراحی شود که یک کار بسیار دشوار برای برنامه نویسان است [17].
شکل 1. شماتیک U-Net آموزش دیده برای تشخیص ترک بتن.0
تکنیک یادگیری عمیق روشی مبتنی بر داده است که نیازی به قوانینی ندارد که به صورت دستی طراحی شده باشد. روند ساخت یک مدل فقط به انتخاب یک ساختار شبکه مناسب (به عنوان مثال ، یک سری نگاشت های ساده تو در تو)، یک تابع برای ارزیابی خروجی مدل (به عنوان مثال تابع از دست دادن) و یک الگوریتم بهینه سازی مناسب نیاز دارد.
بسیاری از محققان سعی کرده اند از روشهای یادگیری عمیق، مانند آسیب جاده [18] و آسیب سازه [19،20]، در مهندسی عمران استفاده کنند.
این تحقیقات در زمینه استفاده از یادگیری عمیق برای شناسایی آسیب ها به خوبی در وظایف مربوطه انجام شده است. با استفاده از فناوری یادگیری عمیق، دو روش اصلی برای تشخیص ترک های بتنی وجود دارد.(تشخیص ترک بتن توسط دید رایانه ای)
رویکرد اول مبتنی بر روش تشخیص شی است [21،22]. تشخیص اشیا یک وظیفه مهم در بینایی رایانه است و وظیفه اصلی آن یافتن همه اشیا مورد نظر در تصویر و تعیین موقعیت آنها است.
نمونه های معمول این روش ها NB-CNN است که توسط Chen و همکاران پیشنهاد شده است [23] و DDLNet که توسط Li و همکاران پیشنهاد شده است.
[24] با این حال، فناوری تشخیص شی از یک قاب مستطیل شکل برای قرار دادن جسم استفاده می کند، در حالی که توزیع ترک و شکل سطح بتن نامنظم است. بنابراین، دقت تشخیص این روش ها محدود است.
رویکرد دوم طبقه بندی تصویر بر اساس تقسیم منطقه است. یعنی هر بار یک ناحیه کوچک از تصویر را انتخاب کنید و قضاوت کنید که آیا ترکی در ناحیه انتخاب شده وجود دارد یا خیر.
طبقه بندی تصویر نیز یک وظیفه مهم در بینایی رایانه است. این کار انواع مختلف تصاویر را با توجه به اطلاعات معنایی متمایز می کند.(تشخیص ترک بتن توسط دید رایانه ای)
استفاده از فناوری طبقه بندی تصویر برای طبقه بندی هر قسمت کوچک از تصویر بتنی و ترکیب فناوری پنجره لغزنده برای ایجاد تشخیص کل تصویر می تواند به نتایج خوبی برسد. یک روش معمول توسط Cha و همکاران پیشنهاد شد (CNN Cha) [25،26].
CNN Cha از یک شبکه عصبی کانولوشن برای طبقه بندی تصاویر و اسکن تصاویر با استفاده از استراتژی های مختلف پنجره لغزنده برای تکمیل تشخیص کل تصویر استفاده می کند، که به طور موثر می تواند ترک های تصویر را پیدا کند، اما به سختی می تواند تشخیص ترک های بتونی در سطح پیکسل را فراهم کند.
به منظور بهبود دقت، وظیفه تشخیص ترک بتن به عنوان یک کار تقسیم بندی معنایی تلقی می شود. تقسیم بندی معنایی نیز یک وظیفه مهم در بینایی رایانه ای است.
هدف آن طبقه بندی هر پیکسل در تصویر است. اگر بتوان به سرعت تقسیم بندی معنایی تصاویر را به دست آورد، بسیاری از مشکلات قابل حل است. به عنوان مثال، تشخیص ترک بتن مناطق ترک و غیر ترک را به دو دسته تقسیم می کند تا نتایج تشخیص سطح پیکسل را ایجاد کند، که تا حد زیادی دقت تشخیص را اثبات می کند.
FCN به عنوان یک ساختار شبکه یادگیری عمیق که برای کارهای تقسیم بندی معنایی تصویر پیشنهاد می شود، روشی ایده آل برای تقسیم بندی معنایی تصویر است. این روش FCN نامیده می شود زیرا با یک عمل پیچشی جایگزین لایه کاملاً متصل CNN می شود.
اخیراً، Yang و همکاران [27] از FCN برای تشخیص ترک بتن استفاده کردند، که در آن تصاویر بزرگتر از 800 (224 × 224) برای انجام اعتبار سنجی پنج برابر استفاده شد که 80٪ برای تغذیه مدل و 20٪ برای اعتبار سنجی استفاده شد.
دقت، فراخوانی و نمره F1 به ترتیب در دوره 14 ام، 81.73٪ ، 78.97٪ و 95. 79٪ است، پس از آن، بیش برازش اتفاق می افتد.
Dung و Anh [28] یک مدل FCN را با 500 تصویر 227 × 227 پیکسل آموزش دادند و حداکثر F1 89.6٪ را در مجموعه اعتبار بدست آوردند. با این حال، مجموعه های بزرگ آموزشی در FCN توسط یانگ و همکاران [27] و دونگ و آنه [28] قبل از استفاده از مدل آموزش دیده، به نیروی انسانی زیادی احتیاج دارند. بنابراین یافتن روشی با مجموعه آموزش بسیارکوچکتر اما با دقت مناسب معنا دار است.(تشخیص ترک بتن توسط دید رایانه ای)
یک ساختار شبکه U-Net مبتنی بر FCN به عنوان مولفه اصلی روش در تحقیق حاضر انتخاب میشود که در ابتدا توسط Ronneberger و همکاران ایجاد شده است.
و برای تقسیم بندی تصویر زیست پزشکی اعمال می شود [29]. U-Net شبکه ای از ساختارهای رمزگذار-رمزگشاست، و رمزگذار با استفاده از کانولوشن، ادغام و غیره ویژگی هایی را استخراج می کند که به تدریج بعد ورودی را کاهش می دهد.
با توجه به اطلاعات ارائه شده توسط رمزگذار، رمزگشا ویژگی های دقیق را با ادغام ویژگی چند مقیاسه، نمونه برداری بالا و غیره اصلاح می کند و از دقت بالاتری برخوردار است.
موفقیت U-Net در تقسیم بندی تصاویر زیست پزشکی با تصاویر آموزشی کمتر و نتیجه دقیق تر از CNN، نویسندگان را بر آن می دارد تا عملکرد U-Net را در تشخیص ترک بررسی کنند.
در مقایسه با تشخیص سلول، شرایط بسیار متفاوت در دنیای واقعی مانند نور و تغییر سایه دشواری زیادی را برای تشخیص ترک ایجاد می کند. من باید اولین نشریه ای باشم که از U-Net برای شناسایی ترک های بتنی با بهترین دانش نویسندگان استفاده می کنم.
یک شماتیک U-Net در این مطالعه در شکل 1 نشان داده شده است. در بخشهای بعدی، ساختار U-Net، ارزیابی مدل و روش بهینه سازی مدل معرفی می شود. روش تنظیم ابرپارامترها با توجه به عملکرد در اعتبارسنجی مدل نیز ارائه خواهد شد.
مقایسه عملکرد روش پیاده سازی شده در این مقاله با CNN Cha در همان تصویر آزمون نیز انجام می شود.
علاوه بر این، برخی از عملکردهای اساسی مانند اندازه مجموعه آموزش و دقت در FCN توسط یانگ و همکاران [27] و Dung & Anh [28] با U-Net فعلی مقایسه می شوند.(تشخیص ترک بتن توسط دید رایانه ای)
شکل 2. معماری کلی، IN :ورودی،:OUT خروجی، :CB مجموعه ای از عملکرد کانولوشن.
بحث و نتیجه گیری
این مطالعه بر روی روش استفاده از فناوری بینایی رایانه ای برای شناسایی ترک های بتنی متمرکز است. با توجه به ویژگی های ترک های بتنی، این روش به عنوان یک مسئله تقسیم معنایی در بینایی رایانه تعیین می شود و از ساختار شبکه U-Net برای ساخت یک مدل یادگیری عمیق برای تشخیص ترک استفاده می شود.(تشخیص ترک بتن توسط دید رایانه ای)
کد منبع و شرح کد را می توان در https://data.mendeley.com/submissions/ evise / edit / c7cpnw32j6؟ submit_id = S0926-5805 (19) 30124-4 & token = 28a20faa-fbea-4e78- 88db-b3881eceb506. مشاهده کرد.
عملکرد روش تشخیص ترک بتن بر اساس ساختار شبکه U-Net مورد آزمایش قرار گرفت و با ChaN CNN مقایسه شد.
U-Net با استحکام بیشتر، اثربخشی بیشتر و تشخیص دقیق تر، از ظرافت بیشتری نسبت به DCNN برخوردار است. با بررسی پارامترهای اساسی و ارائه مجدد عملکرد روش، مشخص می شود که U-Net حاضر با مجموعه آموزش کوچکتر از FCN های قبلی به دقت بالایی می رسد و باعث کاهش کار نیروی انسانی می شود.
اگرچه روش موجود در این مقاله عملکرد خوبی را نشان می دهد، اما هنوز برای کاربردهای مهندسی فاصله زیادی وجود دارد. در این آزمایش، ما چندین جهت پیدا کردیم که می توان آنها را امتحان کرد و بهبود بخشید.
اولاً، به منظور نمونه اولیه سازی سریع یک مدل و بررسی امکان آن، مدل موجود در این مقاله فقط ورودی تصویر 512 × 512 ×3 را می پذیرد.
در صورت پردازش تعداد زیادی از تصاویر، تصویر باید بریده یا مقیاس بندی شود. اما این یک راه حل اساسی نیست.
چگونگی بهبود الگوریتم برای انطباق با ورودی بیشتر، جهتی است که باید بهبود یابد. ثانیا، بسیاری از ابر پارامترهای تنظیم شده مصنوعی در اجرای روش وجود دارد.
این ابر پارامترها از مجموعه آموزش و مجموعه اعتبار سنجی گرفته شده اند. بررسی تأثیر این ابر پارامترها بر عملکرد مدل هنوز به آزمایش های زیادی نیاز دارد. در آخر، حفظ یک مجموعه داده بزرگتر و آموزش یک مدل قوی تر نیز مسیر آینده است.(تشخیص ترک بتن توسط دید رایانه ای)
برای مشاهده مطالب بیشتر به سایت فرزدان مراجعه نماید.