Kazalo:
- 1. korak: Nastavite vedro za shranjevanje v oblaku Google
- 2. korak: Oblikujte svoje podatke in ustvarite zbirko podatkov CSV
- 3. korak: naložite svoje spektrograme v vedro
- 4. korak: naložite zbirko podatkov zbirke podatkov
- 5. korak: Ustvarite nabor podatkov
- 6. korak: Ustvarite svoj model AutoML
- 7. korak: Preizkusite svoj model
- 8. korak: Namestite svoj model v ThinkBioT
Video: Del 2. Model ThinkBioT z Google AutoML: 8 korakov
2025 Avtor: John Day | [email protected]. Nazadnje spremenjeno: 2025-01-13 06:58
ThinkBioT je zasnovan kot "Plug and Play" z modeli TensorFlow Lite, ki so združljivi z Edge TPU.
V tej dokumentaciji bomo obravnavali ustvarjanje spektrogramov, oblikovanje vaših podatkov in uporabo Google AutoML.
Koda v tej vadnici bo napisana v bashu, zato bo združljiva z več platformami.
Odvisnosti
- Pred začetkom pa boste morali namestiti zvočni program ukazne vrstice Sox, združljiv z napravami Windows, Mac in Linux.
- Če uporabljate napravo Windows, je najlažji način za zagon bash skriptov prek Gita, zato priporočam in naložite in namestite to kot uporabno na več načinov,
- Za urejanje kode uporabite svoj najljubši urejevalnik ali namestite NotePad ++ za Windows ali Atom za druge operacijske sisteme.
** Če imate obstoječ model TensorFlow ali bi radi poskusili prenesti učenje z obstoječim modelom, si oglejte dokumentacijo Google Coral.
1. korak: Nastavite vedro za shranjevanje v oblaku Google
1. Prijavite se v svoj gmail račun (ali ga ustvarite, če nimate Google računa)
2. Pojdite na stran za izbiro projekta in za vas ustvarite nov projekt z datotekami modela in spektrograma. Za nadaljnji napredek pri obračunavanju boste morali omogočiti.
3. Obiščite https://cloud.google.com/storage/ in pritisnite gumb za ustvarjanje vedra na vrhu strani.
4. Vnesite želeno ime vedra in ustvarite vedro, ki sprejema privzete nastavitve.
2. korak: Oblikujte svoje podatke in ustvarite zbirko podatkov CSV
Oblikoval sem koristen skript za ustvarjanje datoteke zbirke podatkov.csv, ki je potrebna za ustvarjanje vašega modela. Datoteka nabora podatkov povezuje slike v vedru z njihovimi oznakami v naboru podatkov.
1. Prenesite skladišče ThinkBioT z GitHub in
2. Kopirajte datoteko tbt_spect_example.sh iz imenika Tools v novo mapo na namizju.
3. Dodajte zvočne datoteke, ki jih želite uporabiti v svojem modelu, in jih vstavite v mape z oznako (tj. Po čem želite, da jih razvrstite. Na primer, če želite identificirati pse ali mačke, lahko imate mapo pes z zvoki lajanja ALI mapo z imenom mačka z zvoki mačke itd.
4. Odprite tbt_spect_example.sh z beležnico ++ in "yourbucknamename" v 54. vrstici zamenjajte z imenom svojega Google Storage Bucket. Če se na primer vaše vedro imenuje myModelBucket, se vrstica spremeni v
bucket = "gs: // myModelBucket/spectro-data/"
5. Zaženite kodo tako, da v svoj terminal Bash vnesete naslednje, koda se bo zagnala in ustvarila datoteko csv z nalepkami in imenik, imenovan spektro-podatki, na namizju z nastalimi spektrogrami.
sh tbt_spect_example.sh
3. korak: naložite svoje spektrograme v vedro
Obstaja nekaj načinov nalaganja v Google Storage, najlažje je, da naložite neposredno mapo;
1. Na strani Google Storage kliknite ime svojega vedra.
2. Izberite gumb "ULOAD FOLDER" in izberite svoj imenik "spectro-data/", ustvarjen v zadnjem koraku.
ALI
2. Če imate veliko datotek, lahko ročno ustvarite imenik "spectro-data/" z izbiro "CREATE FOLDER", nato se pomaknite v mapo in izberite "UPLOAD FILES". To je lahko odlična možnost za velike nabore podatkov, saj lahko spektrograme naložite v odseke, tudi če z več računalniki povečate hitrost nalaganja.
ALI
2. Če ste napreden uporabnik, lahko naložite tudi prek Google Cloud Shell;
gsutil cp spectro-data/* gs: // your-bucket-name/spectro-data/
Zdaj bi morali imeti vedro polno lepih spektrogramov!
4. korak: naložite zbirko podatkov zbirke podatkov
Zdaj moramo naložiti datoteko model-labels.csv v vaš imenik "spectro-data/" v storitvi Google Storage, v bistvu je enako kot zadnji korak, namesto mnogih nalagate samo eno datoteko.
1. Kliknite ime svojega vedra na strani Google Storage.
2. Izberite gumb "NALOŽI FILE" in izberite datoteko model-labels.csv, ki ste jo ustvarili prej.
5. korak: Ustvarite nabor podatkov
1. Najprej boste morali poiskati API za AutoML VIsion, kar je lahko malo zapleteno! Najlažji način je, da v iskalni vrstici shrambe v storitvi Google Cloud poiščete »automl vision« (na sliki).
2. Ko kliknete povezavo API, boste morali omogočiti API.
3. Zdaj boste na nadzorni plošči AutoML Vision Dashboard (na sliki) kliknite o gumb za nov nabor podatkov in izberite Single label in možnost 'Select a CSV file'. Nato boste v vedro za shranjevanje vključili povezavo do datoteke model-labels.csv. Če ste sledili tej vadnici, bo to spodaj
gs: //yourBucketName/spectro-data/model-labelsBal.csv
4. Nato pritisnite nadaljevanje za ustvarjanje nabora podatkov. Ustvarjanje lahko traja nekaj časa.
6. korak: Ustvarite svoj model AutoML
Ko prejmete e -poštno sporočilo o tem, da je nabor podatkov ustvarjen, ste pripravljeni na ustvarjanje novega modela.
- Pritisnite gumb VLAK
- Izberite vrsto modela: Ocene zamika roba in modela: Edge TPU in ostale možnosti sprva pustite privzete, težko poskusite, nato pa kasneje.
- Zdaj bo vaš model treniral, trajalo bo nekaj časa in ko boste pripravljeni za prenos, boste prejeli e -poštno sporočilo.
Opomba: Če gumb za vlak ni na voljo, imate lahko težave z naborom podatkov. Če imate za vsak razred (oznako) manj kot 10, vam sistem ne bo omogočil usposabljanja modela, zato boste morda morali dodati dodatne slike. Če potrebujete pojasnilo, si oglejte Google AutoML Video.
7. korak: Preizkusite svoj model
Ko prejmete e -poštno sporočilo o dokončanju modela, kliknite povezavo, da se vrnete v API AutoML Vision.
1. Zdaj si boste lahko ogledali svoje rezultate in matriko zmede za vaš model.
2. Naslednji korak je, da preizkusite svoj model, pojdite na 'TEST & UPE' ali 'PREDICNO', nenavadno se zdi, da obstajata 2 uporabniška grafična vmesnika, oba sem na sliki, vendar imata obe možnosti enako funkcionalnost.
3. Zdaj lahko naložite preskusni spektrogram. Če želite narediti en sam spektrogram, lahko uporabite program tbt_make_one_spect.sh iz ThinkBioT Github. Preprosto ga spustite v mapo z wavom, ki ga želite pretvoriti v spektrogram, odprite okno (ali terminal) Git Bash in uporabite spodnjo kodo, pri čemer zamenjate ime datoteke.
sh tbt_make_one_spect.sh yourWavName.wav
4. Zdaj preprosto naložite spektrogram in preverite rezultat!
8. korak: Namestite svoj model v ThinkBioT
Za uporabo novega svetlečega modela preprosto spustite model in datoteko txt v mapo CModel;
pi> ThinkBioT> ClassProcess> CModel
Zdaj ste pripravljeni za uporabo ThinkBioT:)
** Opomba ** Če uporabljate svoj model zunaj okvira ThinkBioT, boste morali urediti dokument z oznako, tako da dodate številke na začetek vsake vrstice, saj najnovejša funkcija tolmačev tflite, vgrajena v funkcijo "readlabels", predvideva njihovo prisotnost. V okvir ThinkBioT klasify_spect.py sem napisal funkcijo po meri kot delo, ki ga lahko uporabite v svoji kodi:)
def ReadLabelFile (file_path):
števec = 0 z odprtim (file_path, 'r', encoding = 'utf-8') kot f: vrstice = f.readlines () ret = {} za vrstico v vrsticah: ret [int (counter)] = line.strip () števec = števec + 1 vrnitev ret