Технологија

Неурална мрежа је научена да “анимира” портрете на основу само једне статичне слике.

Руски специјалисти из Центра за вештачке уметностиОбавештајна служба Самсунг АИ Центар-Москва у сарадњи са инжењерима из Сколковског института за науку и технологију развио је систем који је у стању да створи реалистичне анимиране слике лица људи на основу само неколико статичких оквира особе. Обично је у овом случају потребно користити велике базе података слика, али у примјеру који су представили програмери, систем је обучен да креира анимирану слику лица особе са само осам статичких оквира, ау неким случајевима је и довољно. Више детаља о развоју објављено је у чланку објављеном у онлине репозиторијуму АрКсив.орг.

По правилу, репродукујте фото-реалистичноПерсонализовани модул лица особе је прилично тежак због високе фотометријске, геометријске и кинематичке сложености репродукције људске главе. Ово се објашњава не само сложеношћу моделирања лица у цјелини (постоји велики број модела за ово моделирање), већ и сложеношћу моделирања одређених особина: усне шупљине, косе и тако даље. Други фактор компликација је наша предиспозиција да ухватимо и мање мане у готовом моделу људских глава. Ова ниска толеранција за грешке у моделирању објашњава тренутну преваленцију не-фотореалистичких аватара који се користе у дискусионим групама.

Према ауторима, систем се зовеФевсхот учење је у стању да створи врло реалистичне моделе говорећих глава људи, па чак и портретне слике. Алгоритми производе синтезу слике главе исте особе са линијама лица оријентира, преузете из другог видео фрагмента, или користе оријентире лица друге особе. Девелопери су користили обимну базу података за познате особе као извор материјала за обуку за систем. Да бисте добили најпрецизнију “главу за разговор”, систем треба да користи више од 32 слике.

Створити реалнију анимацијуСлика лица, програмери су користили претходне развоје у генеративно-конкурентном моделирању (ГАН, где неуронска мрежа размишља о детаљима слике, заправо постаје уметник), као и машински мета-приступ приступу, где је сваки елемент система обучен и дизајниран да реши одређени проблем.

Шема мета учења

Руковати статичним сликама глава људи иКоришћене су три неуронске мреже: Ембеддер (мрежа за имплементацију), Генератор (мрежа за генерисање) и Дискриминатор (мрежа дискриминатора). Први одваја слике главе (са приближним фацијалним оријентирима) у векторе уграђивања који садрже информације независне од држања, друга мрежа користи оријентације лица добијене мрежом и генерише нове податке на основу њих кроз скуп конволуционих слојева који обезбеђују стабилност промена у скали, померања, скретања, промена угла и друге дисторзије оригиналне слике лица. Мрежни дискриминатор се користи за процјену квалитета и аутентичности друге двије мреже. Као резултат, систем претвара оријентире лица лица у реалистичне персонализоване фотографије.

Програмери наглашавају да је њихов системје способан да иницијализује параметре и мреже генератора и мреже дискриминатора појединачно за сваку особу на слици, тако да се процес учења може заснивати на само неколико слика, што повећава његову брзину, упркос потреби да се изабере десетине милиона параметара.

</ п>

О новостима можете разговарати у нашем телеграму.