Kazalo:
- 1. korak: Razširite dinamični razpon vaše slike ali slik
- Utemeljitev:
- 2. korak: Obdelajte slike ali izvedite računalniški vid, strojno učenje ali podobno
- 3. korak: Ponovno stisnite dinamični razpon rezultata
- 4. korak: Morda boste želeli preizkusiti nekatere druge različice
- 5. korak: Gremo še naprej: Zdaj poskusite s slikovnimi kompoziti HDR
2025 Avtor: John Day | [email protected]. Nazadnje spremenjeno: 2025-01-13 06:58
(Zgornja slika prikazuje primerjavo obstoječe metode obdelave slik s kvantimetrično obdelavo slik. Upoštevajte izboljšani rezultat. Zgoraj desno slika prikazuje čudne artefakte, ki izhajajo iz napačne domneve, da slike merijo nekaj, na primer svetlobo. Spodnja desna slika prikazuje boljši rezultat, če naredite isto stvar kvantimetrično.)
V tem navodilu se boste naučili, kako z zelo preprostim konceptom: kvantimetrično zaznavanje slike, močno izboljšati delovanje obstoječih sistemov za slikanje ali zaznavanje vida
Kvantimetrična obdelava slike se močno izboljša pri katerem koli od naslednjih:
- Obstoječa obdelava slik, kot je zameglitev slike;
- Strojno učenje, računalniški vid in prepoznavanje vzorcev;
- Nosljivi prepoznavalnik obrazov (glej https://wearcam.org/vmp.pdf), vid na osnovi AI in HI itd.
Osnovna ideja je kvantimetrično predobdelavo in naknadno obdelavo slik, kot sledi:
- Razširite dinamični razpon slike ali slik;
- Obdelujte sliko ali slike kot običajno;
- Stisnite dinamični razpon slike ali slik (tj. Razveljavi korak 1).
V prejšnjih Instructables sem poučeval nekatere vidike zaznavanja HDR (High Dynamic Range) in kvantimetričnega zaznavanja, npr. linearnost, superpozicija itd.
Zdaj pa uporabimo to znanje.
Vzemite kateri koli obstoječi postopek, ki ga želite uporabiti. Primer, ki ga bom prikazal, je zameglitev slike, lahko pa ga uporabite tudi za skoraj vse drugo.
1. korak: Razširite dinamični razpon vaše slike ali slik
(Slike prilagojene iz "Inteligentne obdelave slik", John Wiley in Sons Interscience Series, Steve Mann, november 2001)
Prvi korak je razširitev dinamičnega razpona vhodne slike.
V idealnem primeru bi morali najprej določiti odzivno funkcijo fotoaparata, f in nato na sliko uporabiti obraten odziv, f inverzen.
Tipične kamere so kompresivne v dinamičnem razponu, zato običajno želimo uporabiti ekspanzivno funkcijo.
Če ne poznate odzivne funkcije, začnite tako, da poskusite nekaj preprostega, na primer nalaganje slike v slikovno matriko, oddajanje spremenljivk v podatkovni tip, na primer (float) ali (double), in dvig vrednosti vsake slikovne pike na eksponent., kot je na primer kvadratura vrednosti vsake slikovne pike.
Utemeljitev:
Zakaj to počnemo?
Odgovor je, da večina kamer stisne svoj dinamični razpon. Razlog za to je, da večina prikaznih medijev širi dinamični razpon. To je povsem po naključju: količina svetlobe, ki jo oddaja televizijski zaslon s katodno cevjo, je približno enaka napetosti, dvignjeni na eksponent 2,22, tako da je pri vhodni video napetosti približno na polovici količina oddane svetlobe veliko manj kot polovica.
Fotografski mediji so tudi dinamični razpon. Na primer, fotografska "nevtralna" siva kartica oddaja 18% vpadne svetlobe (ne 50% vpadne svetlobe). Šteje se, da je toliko svetlobe (18%) sredi odgovora. Kot lahko vidite, če pogledamo grafikon izhoda kot funkcijo vhoda, se predstavitveni mediji obnašajo, kot da so idealni linearni prikazi, ki vsebujejo razširjevalnik dinamičnega obsega pred idealnim linearnim odzivom.
Na zgornji sliki zgoraj je prikazan zaslon s pikčasto črto in je enakovreden razširjevalniku pred idealnim linearnim prikazom.
Ker so zasloni sami po sebi ekspanzivni, je treba kamere oblikovati tako, da so kompresivne, da bodo slike videti dobro na obstoječih zaslonih.
V starih časih, ko je bilo na tisoče zaslonov televizijskih sprejemnikov in samo ena ali dve oddajni postaji (npr. Samo ena ali dve televizijski kameri), je bilo lažje popraviti v kamero stiskalno nelinearnost kot pa priklic vseh televizorjev in v vsak televizijski sprejemnik vstavite enega.
Po naključju je to pomagalo tudi pri zmanjševanju hrupa. V zvoku to imenujemo "Dolby" ("primerjanje") in zanj podeljujemo patent. V videu se je to zgodilo povsem po naključju. Stockham je predlagal, da pred obdelavo vzamemo logaritem slik in nato vzamemo antilog. Kar se ni zavedal, je, da večina kamer in zaslonov to počne že po naključju. Namesto tega sem predlagal, da naredimo ravno nasprotno od tistega, kar je predlagal Stockham. (Glejte "Inteligentna obdelava slik", John Wiley in Sons Interscience Series, stran 109-111.)
Na spodnji sliki vidite predlagano protihomomorfno (kvantimetrično) obdelavo slik, kjer smo dodali korak širitve in stiskanja dinamičnega območja.
2. korak: Obdelajte slike ali izvedite računalniški vid, strojno učenje ali podobno
Drugi korak po razširitvi dinamičnega obsega je obdelava slik.
V mojem primeru sem preprosto izvedel dekonvolucijo slike s funkcijo zameglitve, tj. Zameglitev slike, kot je splošno znano v stanju tehnike.
Obstajata dve široki kategoriji kvantimetričnega zaznavanja slike:
- Pomagati ljudem videti;
- Pomočni stroji vidijo.
Če poskušamo ljudem pomagati videti (to je primer, ki ga prikazujem tukaj), še nismo končali: obdelani rezultat moramo vzeti nazaj v slikovni prostor.
Če pomagamo strojem videti (npr. Prepoznavanje obrazov), smo zdaj končali (ni treba nadaljevati s 3. korakom).
3. korak: Ponovno stisnite dinamični razpon rezultata
Ko delamo v razširjenem dinamičnem razponu, naj bi bili v "svetlobnem prostoru" (kvantimetrični slikovni prostor).
Na koncu 2. koraka smo v svetlobnem prostoru in vrniti se moramo v slikovni prostor.
Torej ta korak 3 govori o vrnitvi v prostor slik.
Za izvedbo 3. koraka preprosto stisnite dinamični razpon izhoda 2. koraka.
Če poznate odzivno funkcijo fotoaparata, jo preprosto uporabite, da dobite rezultat, f (p (q)).
Če ne poznate odzivne funkcije fotoaparata, preprosto ugibajte.
Če ste v prvem koraku kvadratke slikovnih pik, je zdaj čas, da vzamete kvadratni koren vsake slikovne pike, da se vrnete k svojim ugibanjem o slikovnem prostoru.
4. korak: Morda boste želeli preizkusiti nekatere druge različice
Odstranjevanje zamegljenosti je le eden od mnogih možnih primerov. Razmislite na primer o združevanju več izpostavljenosti.
Posnemite dve sliki, na primer dve zgoraj. Enega so vzeli podnevi, drugega pa ponoči.
Združite jih, da naredite sliko, podobno mraku.
Če jih le povprečite skupaj, je videti kot smeti. Poskusite to sami!
Če pa najprej razširite dinamični razpon vsake slike, jih nato dodate in nato stisnete dinamični obseg vsote, bo videti super.
Primerjajte obdelavo slik (dodajanje slik) s kvantimetrično obdelavo slik (razširitev, dodajanje in nato stiskanje).
Mojo kodo in več vzorčnih materialov lahko prenesete od tukaj:
5. korak: Gremo še naprej: Zdaj poskusite s slikovnimi kompoziti HDR
(Zgornja slika: varilna čelada HDR uporablja kvantimetrično obdelavo slik za prekrivanje razširjene resničnosti. Glej Slashgear 2012, 12. september.)
V povzetku:
posnemite sliko in uporabite naslednje korake:
- razširite dinamični razpon slike;
- obdelati sliko;
- stisnite dinamični razpon rezultata.
In če želite še boljši rezultat, poskusite naslednje:
zajemite številne različno izpostavljene slike;
- razširiti dinamični razpon v svetlobni prostor, kot je navedeno v mojem prejšnjem navodilu za HDR;
- nastalo kvantimetrično sliko, q, obdelajte v svetlobnem prostoru;
- stisnite dinamični razpon s preslikavo tonov.
Lepo se imejte in kliknite »Uspelo mi je« ter objavite svoje rezultate, z veseljem bom komentiral ali ponudil konstruktivno pomoč.