Recraft AI je dizajnový nástroj poháňaný proprietárnymi difúznymi modelmi. Ich nový model Red Panda prekonáva všetky existujúce modely s prevodom textu na obrázok vrátane Midjourney, DALL-E 3, FLUX. Recraft spája jedinečný používateľský zážitok pre dizajnérov so špičkovými nástrojmi AI. Na podporu miliónov používateľov vyžadujú modely difúzie robustnú inferenčnú infraštruktúru – zlúčenie výkonného hardvéru s efektívnym softvérom. V tomto článku preskúmame, ako akceleračné nástroje AI TheStage pomohli inžinierom a výskumníkom AI spoločnosti Recraft dosiahnuť až dvojnásobný výkon na GPU Nvidia prostredníctvom intuitívneho rozhrania Python!
Difúzne modely ukázali v posledných rokoch mimoriadne výsledky pri vytváraní obsahu, vrátane obrázkov, hudby, videí a 3D sietí. Tieto modely využívajú inferenčné časové výpočtové náklady na iteratívne zlepšenie výsledkov generovania, pričom mierne aktualizujú výstup v každom kroku inferencie. Teraz môžeme vidieť analógiu v LLM, ktorá využíva uvažovanie prostredníctvom viacstupňovej inferencie na poskytnutie vysoko kvalitnej odpovede.
V TheStage AI vytvárame všeobecný matematický rámec pre ľubovoľné modely PyTorch, aby sme zvládli komplikovaný tok zrýchlenia modelu plne automaticky. Náš systém automaticky detekuje existujúce optimalizácie na vašom hardvéri (kvantizácia, sparifikácia) a vyberie pre každú vrstvu správny algoritmus na dosiahnutie najlepšej kvality s požadovanou veľkosťou modelu a obmedzeniami latencie alebo nájdenie najlepšieho zrýchlenia s obmedzenými obmedzeniami kvality. Je to ťažký matematický problém, ktorý dokážeme vyriešiť vysoko efektívnym spôsobom! Tento článok skúma, ako používame tieto nástroje prostredníctvom nášho partnerstva s Recraft AI.
Pri navrhovaní našich nástrojov sme sa rozhodli rešpektovať nasledujúce zásady:
Vzhľadom na tieto počiatočné podmienky sme sa zamerali na vytvorenie nástrojov s nasledujúcimi funkciami:
V každej iterácii procesu difúzie neurónová sieť odšumuje obraz v latentnom priestore variačného automatického kódovača. Novo získaný obraz je potom opäť zmiešaný so šumom, ale s postupne menšou hmotnosťou. Počas počiatočných iterácií model difúzie načrtáva hlavnú scénu, pričom využíva významnú hlučnosť na uskutočnenie podstatných vylepšení. V neskorších iteráciách spresňuje vysokofrekvenčné detaily. Toto pozorovanie nám umožňuje navrhnúť špecifické akceleračné potrubia strategickým prideľovaním kapacity siete medzi vrstvami od iterácie po iteráciu, pri zachovaní kvality. Takáto alokácia si však vyžaduje špecializované nástroje, ktoré kombinujú matematické poznatky so zvukovým inžinierstvom – práve tu môže TheStage AI výrazne pomôcť!
Modely urýchľovania difúzie možno považovať za urýchľujúce ľubovoľné DNN, ale musíme brať do úvahy špecifické výzvy. Napríklad statická kvantizácia, ktorá zvyčajne poskytuje významné zrýchlenie, predstavuje výzvu v modeloch difúzie, pretože distribúcia aktivácie sa mení z iterácie na iteráciu. Aby sme to vyriešili, musíme buď správne odhadnúť optimálne hodnoty pre všetky iterácie, alebo použiť rôzne nastavenia kvantizácie pre každú iteráciu.
Difúzne modely sú náročné na tréning a dosahovanie vysokého výkonu. Napriek tomu výsledky preukázané tímom Recraft prekonávajú všetky moderné modely prevodu textu na obrázok . Overenie degradácie takýchto modelov môže byť zložité, preto je nevyhnutné použiť techniky zrýchlenia, ktoré zachovávajú pôvodnú sémantiku funkcie. Kvantizačné algoritmy môžu byť dobrou voľbou, ak dokážu zvládnuť výzvu rôznych distribúcií aktivácie. Poďme sa pozrieť na naše automatické potrubia, ktoré popíšeme v nasledujúcich častiach.
Profil daného modelu so špecifickými údajmi umožňuje:
Potom, čo profiler zhromaždí všetky potrebné údaje, môžeme spustiť našu dosku ANNA a posunúť posúvač, aby sme vytvorili rôzne optimalizované verzie modelu. Naši používatelia si potom môžu vybrať najlepších kandidátov na základe kompromisu medzi kvalitou a odvodenými nákladmi. Naše nástroje zvládajú tieto subjektívne rozhodnutia o kvalite jednoduchým spôsobom.
Ako už bolo spomenuté, nepoužívame kompiláciu JIT, pretože zvyšuje čas studeného štartu nového uzla. Nepoužívame ani bežné kompilátory. Namiesto toho zostavujeme vlastnú komplexnú zrýchlenú konfiguráciu, ktorá môže kombinovať rôzne algoritmy. Aby sme to dosiahli, vyvinuli sme vlastný interný protokol na definovanie vrstiev akcelerovaných DNN hardvérovo agnostickým spôsobom. Jednou z kľúčových výhod akceleračného rámca TheStage AI je to, že jeden kontrolný bod možno zostaviť pre širokú škálu hardvéru, čím sa rieši medziplatformová kompatibilita softvéru AI. Táto funkcia bude obzvlášť dôležitá pre nasadenie okrajových zariadení pri vývoji aplikácií.
Cieľmi kompilátorov DNN sú:
Inferenčné servery a kanály automatického škálovania zohrávajú dôležitú úlohu pri nákladovo efektívnom a efektívnom spracovaní prichádzajúcich požiadaviek. Môže tiež zahŕňať špecifické zoskupovanie požiadaviek a zhromažďovanie štatistík na nastavenie prediktívneho škálovania pre automatické škálovače. V našich budúcich článkoch budeme podrobnejšie diskutovať o efektívnych inferenčných serveroch!
Aplikovaním všetkých pipeline môžeme dosiahnuť výkon, ktorý je lepší ako Pytorch kompilátor ( torch.compile
) a samozrejme výrazne lepší ako float16 dychtivé vykonávanie PyTorch. Navyše, keďže kompilátor PyTorch používa kompilačný prístup JIT pri každej inicializácii modelu, vyžaduje si rekompiláciu pre veľké množstvo vstupných veľkostí, vďaka čomu je studený štart dostatočne dlhý pre praktické aplikácie, kde je latencia veľmi dôležitá.
Tu sú kľúčové obchodné výhody výsledného zrýchlenia pre produkt Recraft:
Nástroje na optimalizáciu umelej inteligencie TheStage nám umožňujú zrýchliť naše modely prevodu textu na obrázok bez zníženia kvality, čím vytvárajú lepšiu používateľskú skúsenosť pre našich zákazníkov.
CEO Recraft, Anna Veronika Dorogush
Tieto výsledky poskytujú vynikajúce overenie našich nástrojov a výskumu produktov pre veľké pracovné zaťaženie. Tím TheStage AI pokračuje v práci na poskytovaní ešte vyššieho výkonu. Aby sme to dosiahli, spolupracujeme s vynikajúcimi partnermi! Sme hlboko vďační:
V prípade akýchkoľvek otázok nás neváhajte kontaktovať! Môžeme vám pomôcť znížiť náklady na odvodenú infraštruktúru!
Náš e-mail: hello@thestage.ai
Hlavná stránka TheStage AI: thestage.ai
Platforma na optimalizáciu inferencie AI TheStage: app.thestage.ai