TechSpot bo kmalu praznoval svojo 25. obletnico. TechSpot pomeni tehnično analizo in nasvet, ki mu lahko zaupate.

V prihodnost: Stable Diffusion je model globokega učenja, ki lahko besede spremeni v srhljive, izrazito umetne slike. Omrežje za strojno učenje običajno deluje v oblaku in ga je mogoče namestiti tudi na močan osebni računalnik za delo brez povezave. Z nadaljnjimi optimizacijami je mogoče model učinkovito izvajati tudi na pametnih telefonih Android.

Qualcomm je lahko prilagodil zmogljivosti ustvarjanja slik Stable Diffusion enemu pametnemu telefonu Android, ki ga poganja naprava Snapdragon 8 Gen 2 SoC. To je izjemen rezultat, ki je po mnenju podjetja s sedežem v San Diegu šele začetek za aplikacije AI, ki se upravljajo na robnih računalniških napravah. Ni potrebna internetna povezava, zagotavlja Qualcomm.

Kot je pojasnjeno na blogu podjetja Qualcomm, je Stable Diffusion velik temeljni model, ki uporablja nevronsko mrežo, usposobljeno za ogromno količino podatkov v velikem obsegu. Umetna inteligenca za ustvarjanje besedila v sliko vsebuje milijardo parametrov in je bila večinoma „zaprta” v oblaku (ali na tradicionalnem računalniku x86, opremljenem z novejšim GPE).

Qualcomm AI Research je uporabil „optimizacije umetne inteligence s celotnim skladom” za prvo uvedbo Stable Diffusion na pametnem telefonu Android, vsaj s takšno zmogljivostjo, kot jo opisuje podjetje. Umetna inteligenca s polnim skladom pomeni, da je moral Qualcomm prilagoditi aplikacijo, model nevronske mreže, algoritme, programsko opremo in celo strojno opremo, čeprav so bili za opravljanje dela očitno potrebni nekateri kompromisi.

Najprej in predvsem je moral Qualcomm skrčiti format podatkov s plavajočo vejico z enojno natančnostjo (ali FP32), ki ga uporablja Stable Diffusion, na podatkovni tip INT8 z nižjo natančnostjo. Z uporabo na novo ustvarjenega kompleta orodij za učinkovitost AI Model Efficiency Toolkit (AIMET) kvantizacije po usposabljanju je podjetju uspelo močno povečati zmogljivost, hkrati pa prihraniti energijo in ohraniti natančnost modela pri tej nižji natančnosti brez potrebe po dragem ponovnem usposabljanju.

Rezultat te optimizacije celotnega sklada je bila zmožnost zagona Stable Diffusion na telefonu, ki ustvari sliko 512 x 512 slikovnih pik v manj kot 15 sekundah za 20 korakov sklepanja. To je najhitrejši sklep na pametnem telefonu in „primerljiv z zakasnitvijo v oblaku,” je izjavil Qualcomm, medtem ko uporabniški vnos za besedilni poziv ostaja „popolnoma neomejen.”

Zagon Stable Diffusion na telefonu je šele začetek, je dejal Qualcomm, saj zmožnost izvajanja velikih modelov AI na robnih napravah zagotavlja številne prednosti, kot so zanesljivost, zakasnitev, zasebnost, učinkovitost in stroški. Poleg tega je mogoče optimizacije celotnega sklada za strojne pospeševalnike, ki temeljijo na AI, enostavno uporabiti za druge platforme, kot so prenosniki, slušalke XR in „skoraj vse druge naprave, ki jih poganja Qualcomm Technologies.”

Preberi več