Kako s strojnim učenjem odkriti rastlinske bolezni: 6 korakov
Kako s strojnim učenjem odkriti rastlinske bolezni: 6 korakov
Anonim
Kako s strojnim učenjem odkriti rastlinske bolezni
Kako s strojnim učenjem odkriti rastlinske bolezni

Postopek odkrivanja in prepoznavanja obolelih rastlin je bil vedno ročen in dolgočasen postopek, ki od ljudi zahteva vizualni pregled rastlinskega telesa, kar lahko pogosto vodi do napačne diagnoze. Predvideno je bilo tudi, da se bodo zaradi podnebnih sprememb globalni vremenski vzorci začeli spreminjati, da bodo bolezni pridelkov postale hujše in razširjene. Zato je pomembno razviti sisteme, ki hitro in enostavno analizirajo pridelke in prepoznajo določeno bolezen, da bi omejili nadaljnjo škodo na pridelkih.

V tem navodilu bomo raziskali koncept strojnega učenja, znan kot "transferno učenje", da razvrstimo slike obolelih rastlin riža. Ista metoda se lahko uporabi za kateri koli drug problem klasifikacije slik.

1. korak: Vrste bolezni riža

Vrste riževih bolezni
Vrste riževih bolezni

Riž je ena izmed najbolj priljubljenih osnovnih živil, pridelanih predvsem po Aziji, Afriki in Južni Ameriki, vendar je dovzetna za različne škodljivce in bolezni. S fizikalnimi značilnostmi, kot je razbarvanje listov, lahko ugotovimo več bolezni, ki lahko vplivajo na pridelek riža. Na primer, v primeru rjave pege, glivične bolezni, ki prizadene zaščitno ovojnico listov, so listi pokriti z več majhnimi ovalnimi rjavimi lisami s sivimi sredicami, medtem ko so v primeru listne blasti listi pokriti z večjimi rjavimi lezijami. Podobno lahko liste, ki jih prizadene škodljivec Rice Hispa, prepoznamo po dolgih sledovih, ki se razvijejo na površini lista.

2. korak: Kako so prejšnje metode odkrivale bolezni?

Kako so prejšnje metode odkrivale bolezni?
Kako so prejšnje metode odkrivale bolezni?

Predhodne metode za samodejno razvrščanje slik obolelih rastlin, kot so klasifikatorji, ki temeljijo na pravilih in se uporabljajo v [1], se opirajo na določen niz pravil za segmentiranje listov na prizadeta in neprizadeta območja. Nekatera pravila za pridobivanje lastnosti vključujejo opazovanje spremembe povprečja in standardnega odstopanja med barvo prizadetih in neprizadetih regij. Pravila za pridobivanje značilnosti oblike vključujejo posamezno postavitev več primitivnih oblik na prizadeto območje in določitev oblike, ki pokriva največjo površino prizadetega območja. Ko so značilnosti izvlečene iz slik, se za razvrščanje slik uporabi niz fiksnih pravil glede na bolezen, ki je morda prizadela rastlino. Glavna pomanjkljivost takega razvrščevalca je, da bo za vsako bolezen zahteval več določenih pravil, zaradi česar bo lahko dovzeten za hrupne podatke. Zgornje slike prikazujejo, kako lahko drevo odločitev, ki temelji na pravilih, razdeli sliko na dve regiji.

1. Santanu Phadikar et al., “Razvrstitev bolezni riža z uporabo metod izbire lastnosti in ustvarjanja pravil,” Računalniki in elektronika v kmetijstvu, letn. 90, januar 2013.

3. korak: Prenesite učenje

Prenos učenja
Prenos učenja

Tehnika razvrščanja slik, opisana v tem navodilu, uporablja osnovno strukturo CNN, ki je sestavljena iz več konvolucijskih slojev, združujoče plasti in zadnje popolnoma povezane plasti. Konvolucijski sloji delujejo kot niz filtrov, ki odstranjujejo značilnosti slike na visoki ravni. Največje združevanje je ena od običajnih metod, ki se uporabljajo pri združevanju plasti za zmanjšanje prostorske velikosti izvlečenih elementov in s tem zmanjšajo računsko moč, potrebno za izračun uteži za vsako plast. Izvlečeni podatki se nato prenesejo skozi popolnoma povezan sloj skupaj s funkcijo aktiviranja softmax, ki določa razred slike.

Toda usposabljanje CNN -jev po meri iz nič morda ne bo prineslo želenih rezultatov in ima lahko zelo dolg čas usposabljanja.

Za spoznavanje značilnosti slik za usposabljanje uporabljamo metodo, imenovano Transfer Learning, pri kateri se „zgornje“plasti vnaprej usposobljenega modela odstranijo in nadomestijo s plastmi, ki se lahko naučijo lastnosti, ki so značilne za nabor podatkov za usposabljanje. Prenosno učenje skrajša čas usposabljanja v primerjavi z modeli, ki uporabljajo naključno inicializirane uteži. Naša metoda uporablja šest različnih vnaprej usposobljenih modelov, in sicer AlexNet, GoogLeNet, ResNet-50, Inception-v3, ShuffleNet in MobileNet-v2.

Na sliki je prikazana arhitektura GoogLeNet, kjer se modra uporablja za konvolucijske plasti, rdeča za združevalne plasti, rumena za sloje softmax in zelena za konkatne plasti. Več o notranjem delovanju CNN -a lahko izveste tukaj.

Nabor podatkov o riževi bolezni je sestavljen iz slik listov zdravih in obolelih rastlin riža. Slike lahko razvrstimo v štiri različne razrede, in sicer Brown-Spot, Rice Hispa, Leaf-Blast in Healthy. Podatkovni niz je sestavljen iz 2092 različnih slik, vsak razred vsebuje 523 slik. Vsaka slika je sestavljena iz enega zdravega ali obolelega lista, postavljenega na belo ozadje.

Podatkovni niz podatkov smo razdelili na sklope slik za usposabljanje, preverjanje veljavnosti in testiranje. Da bi preprečili preoblikovanje, slike vadbe povečamo tako, da jih povečamo in obrnemo, da povečamo skupno število vzorcev usposabljanja.

Koda in odvisnosti so odprtokodne in jih najdete tukaj: Koda GitHub

Za različne aplikacije za razvrščanje slik lahko preprosto spremenimo nabor slik za usposabljanje.

4. korak: Usposabljanje modela

Usposabljanje modela
Usposabljanje modela
Usposabljanje modela
Usposabljanje modela
Usposabljanje modela
Usposabljanje modela

Glede na velikost pomnilnika, ki jo zahteva vsak model, so vnaprej usposobljeni modeli razvrščeni v večje in manjše modele. Manjši modeli porabijo manj kot 15 MB in so zato bolj primerni za mobilne aplikacije.

Med večjimi modeli je imel Inception-v3 najdaljši čas treninga približno 140 minut, AlexNet pa najkrajši čas treninga približno 18 minut. Med manjšimi mobilno usmerjenimi modeli je imel MobileNet-v2 najdaljši čas treninga približno 73 minut, medtem ko je imel ShuffleNet najkrajši čas usposabljanja približno 38 minut.

5. korak: Preizkus modela

Testiranje modela
Testiranje modela
Testiranje modela
Testiranje modela
Testiranje modela
Testiranje modela

Med večjimi modeli je imel Inception-v3 najvišjo natančnost testiranja, približno 72,1%, medtem ko je imel AlexNet najnižjo natančnost testiranja, približno 48,5%. Med manjšimi mobilno usmerjenimi modeli je imel MobileNet-v2 najvišjo natančnost testiranja 62,5%, medtem ko je imel ShuffleNet najnižjo natančnost testiranja 58,1%.

MobileNet-v2 je bil zelo uspešen pri razvrščanju slik rjavih lis, rjavkastih listov in zdravih listov, hkrati pa je naredil več napačnih razvrstitev za Rice Hispa z natančnostjo le 46,15%.

Inception-v3 je pokazal podobne rezultate razvrščanja kot MobileNet-v2.

6. korak: Dodatni testi

Dodatni testi
Dodatni testi
Dodatni testi
Dodatni testi

Zgornja slika prikazuje, kako model MobileNet-v2 napačno razvrsti sliko travnatega lista na belem ozadju kot Rice Hispa.

Preizkusili smo tudi natančnost MobileNet-v2 na obrezanih slikah riža Hispa, pri čemer je bilo belo ozadje zmanjšano tako, da list zavzame največjo površino slike. Za obrezane slike Rice Hispa smo opazili natančnost približno 80,81%, to je za obrezane slike Rice Hispa opazili znatno povečanje natančnosti razvrščanja pri neobrezanih preskusnih vzorcih. Zato predlagamo, da morajo realne implementacije odkrivanja bolezni riža z uporabo konvolucijskih nevronskih omrežij obrezati preskusne slike, da se odstrani hrup v ozadju, da se izboljša natančnost.