Андрей Гиздов и окото на изкуствения интелект
Андрей Гиздов е един от най-успешните и креативни български ИТ специалисти. Той е познат до момента със създаването на алгоритъм, който изчислява възрастта на черепи, открити при археологически разкопки. А последният му проект е повече от интересен: AI, който да използва много по-малко информация при обработка на снимки с почти същата ефективност на разпознаването. Ето какво разказа за идеята си и технологиите Андрей в рубриката ни "Човекът от бъдещето".
Г-н Гиздов, разработвате алгоритъм, който използва базите на човешкото зрение и ги прехвърля към начина, по който камерите да възприемат и анализират информация. Разкажете – какво представлява идеята и как стигнахте до нея?
AI програмите са добри в разпознаването на обекти от снимки. Живи примери за това са алгоритмите използвани от автопилота на Тесла, както и сумати други медицински програми - за разпознаване на ракови клетки например. По подразбиране, изпълнението на такива задачи до скоро изискваше биологична интелигентност от някакъв вид – било то на човек, маймуна или друг организъм. Точно заради това, програмите, които изпълняват тези задачи, се наричат изкуствен интелект (AI). Но въпреки, че тези програми изпълняват „интелигентна“ функция, се оказва че всъщност я изпълняват в по-различна форма от хората.
Какво имам предвид?
Снимката от ляво е това, което една компютърна AI програма използва за да засече и класифицира обект. Обаче, въпреки че може и да не сте го осъзнавали до сега, човешките очи не виждат това. Много лесно може да се убедите сами като се опитате да четете с периферното си зрение – не се получава. Периферното ви зрение вижда, но не вижда фини детайли. Всъщност, истината е че имате няколко такива региона в зрението си – всеки виждащ по-малко и по-малко детайли с отдалечаването от центъра на зрението ви. Ако се опитаме да представим как това изглежда в една снимка, бихме получили тази от дясно.
Виждате ясно, че човешкото око намалява информацията, която възприема около краищата на видимото поле, за разлика от камерата.
Моят проект създава интелигентен алгоритъм за разпознаване на обекти, но не използващ типичните снимки от камера – с висока резолюция навсякъде (ляво). Вместо това, моята програма използва снимки с по-малко информация, наподобяващите тези, произведени от човешкото око (дясно).
Източникът на идеята е институцията, в която работя вече повече от година – Weizmann Artificial Intelligence Center. Имам огромното удоволствие да работя в лаборатория, занимаваща се с изследване на зрението в машините, ръководена от професор Шимон Улман.
За какво може да се използва този алгоритъм и как намерихте подкрепа и финансиране за идеята?
Преди да отговоря на този въпрос, е нужно кратко въведение.
Дори със сравнително слабото си зрение, хората използват около 50% от мозъка си за обработване на това, което виждат. Това е изключително голяма пропорция! Сега, представете си ако виждахме „висока резолюция“ навсякъде – като една камера.
За да обработят такова количество информация, главите ни щяха да са много по-големи и гладни за енергия. Това, от еволюционна гледна точка, е не много хубаво. Не се тича ефективно от хищници с огромна глава, а за снабдяване с енергия да не говорим.
Това е основен отговор на въпроса защо очите ни възприемат по-малко информация около периферията – консервация на енергия.
При програмите е нещо подобно: колкото повече информация трябва да обработят, за да вземат решение (като какво има на снимката), толкова по-бавни и енергийно-интензивни са.
В някои задачи обаче, е нужна скорост. Например, системите за ракетна отбрана трябва да разпознават вражеските ракети изключително бързо, за да могат да ги свалят без щети.
В днешно време стават все по разпространени и системи срещу кражби. Програма анализира случващото се на камера и сигнализира при подозрително поведение. Тези програми също трябва да реагират много бързо, за да могат ефективно да сигнализират за бързите движения на потенциален крадец.
Точно тук идват ползите от програма като тази, която правя.
С намаляването на информацията около периферията на снимката, се ускорява обработката й и разбирането какво има на нея. Разбира се, с по-малкото информация идва и компромис в точността. Но в какъв размер е този компромис и заслужава ли си по-късото време за изпълнение? Точно това изследвах.
Направих 2 AI програми – едната класифицира нормални снимки с пълно количество информация (ляво), а другата, както човешкия мозък, класифицира снимки с висока резолюция само в средата (дясно). Вторият тип снимки съдържат 20 ПЪТИ по-малко информация от първия – което се превръща в поне 20 ПЪТИ по-бърза класификация от компютъра! Програмите са тествани на стандартен набор от снимки за сферата – ImageNet. В него се съдържат над 1000 различни вида обекти.
Можете ли да предположите каква беше разликата в точността на програмите, за такава огромна разлика информация?
Само 9%! Програмата, използваща снимките с пълна информация (ляво), ги класифицира правилно 75% от времето, докато програмата работеща със същия тип снимки – но съдържащ 20 пъти по-малко информация (дясно) – ги класифицира правилно 66% от времето и то със много по-малко забавяне (поне 20 пъти).
Вече започваме да разбираме защо човешкото око работи така – допълнителната информация не допринася значително за това да разбереш какво виждаш! Еволюцията е открила сама това, което и изкуственият интелект пресъздава като заключение.
Фактът, че AI програмите могат да достигат не по-малко впечатляващи резултати с МНОГО по-малко информация показва, че в бъдещето може „икономичните“ AI модели да стават все по-чести. Все пак, обработката на по-малко информация за изпълнение на същата задача, е значително предимство от гледна точка на скорост, енергия и памет – особено за някои задачи, както вече споменахме.
Колко време ще отнеме разработката и къде са трудностите по това „замъгляване“ на информацията, но запазването на достоверността й?
Основната част от разработката на проекта е готова – доказахме, че с по-малко информация може да се достигнат сравними резултати от страна на точност. Следва да публикуваме резултата. Това от своя страна може да вдъхнови нови AI програми, използващи принципа на човешкото зрение за анализирането на снимки по-бързо и икономично. Като цяло бъдещото развитие на идеята е отворено и с многобройни възможности.
Относно другият въпрос, има няколко трудности по „замъгляването“ на информацията.
Както при човешкото зрение, не винаги интересното в снимката е в средата й. Много често то се намира в периферията, която именно виждаме с по-ниска резолюция.
За целта хората можем да въртим очите си, но това не е случаят с една статична камера. Ако се стигне до прилагането на този алгоритъм, трябва да се измисли решение за това как камерата да променя позицията на фокуса си спрямо това, което е „интересно“ на снимката – което само по себе си е отделен проект и то от хардуерен вид.
Доколко всъщност в съвременните технологии има „разхищение“ на производствени мощности и недостатъчно икономични адаптации, като Вашата?
Бих казал изключително много. Дори най-елементарното изключване на лампа, докато не се използва, е често пренебрегвано. По-сложни задачи, като оптимизация на програми, се практикуват от много малко хора. Реално за повечето бизнеси няма особено значение дали програмата им изпълнява дадена задача за една секунда или една десета от секундата. Ниската цена на енергията, характерна за нашето време, също допринася за честото пренебрегване на изчислителните оптимизации.
Да, има задачи, в които скоростта и консумираната енергия са от голямо значение, но в ежедневието на повечето бизнеси не са много и съответно липсва оптимизацията.
Гиздов и ръководителят му
Нещо в по-широк мащаб. Запознати сте, предполагам, със сложния дебат за изкуствения интелект въобще. Елън Мъск, а и не само, изразиха известни притеснения, които са недалеч дори от световете на Матрицата; предполага се, че в някакъв момент от бъдещето, би станало особено опасно, ако един много развит AI остане без контрол. Каква е позицията Ви в този дебат?
Мислил съм на тази тема. Всички чуваме за впечатляващите резултати, постигани от AI в различни сфери и е нормално да се задават такива въпроси.
За момента AI системите в по-честата си форма са тясно специализирани за конкретни задачи. Тоест, могат да станат много добри в решаване на определен тип проблеми, но трудно генерализират – което е една от основните функции на интелекта. Много сме далеч все още от момента, в който машините ще станат по-умни от нас. Дори не знаем дали комплексността на човешкия мозък може да се представи с типичния за AI и компютрите подход – включен/изключен неврон. Също така сме много далеч от това да знаем как работи човешкият мозък изобщо, че да го пресъздадем.
Не бих се тревожил за това.
Част от сравнителния успех в световен план за справяне с коронавирус се дължи именно на технологиите - трудно и твърде апокалиптично може да си представим свят, посрещащ COVID-19 без дигиталната инфраструктура, на която все пак може да разчитаме. Каква е прогнозата ви, поне от гледната точка на математик, за това, което предстои по отношение на вируса?
Според мен технологията и помогна, и навреди – но това е генерална тенденция, която виждам не само спрямо COVID-19.
Помогна от гледна точка на комуникация, разработване на ваксини и координация на противоепидемичните мерки вземани глобално.
Навреди на много хора психически заради прекомерната информираност. Човешкият мозък не е направен да слуша за крещящите заглавия на света ежечасово всеки ден от седмицата. Лесният достъп до информация – и то в по-голямата си част негативна, защото това се чете – не помага на психичното здраве, особено ако си затворен и е едно от единствените ти занимания, както беше случаят с масовия lockdown.
Относно бъдещия свят и COVID, според мен и за съжаление, вирусът няма да изчезне. Има много мутации в момента и не се знае до кога разработените ваксини ще са ефективни срещу тях – особено имайки предвид че тези мутации се множат.
Това, че вирусът няма да изчезне се дължи и отчасти на това, че голяма пропорция от населението е силно скептична към ваксините. Дали има причина за това е друг въпрос – според мен има, имайки предвид скоростната им разработка.
Мисля, че да има някакво количество COVID боледуващи, стига да не ескалира драстично, ще се приеме за нормално в не толкова далечното бъдеще. Надявам и се рестрикциите върху пътуванията да намалеят до няколко години.
Разкажете повече за вас – как се озовахте в Англия и кое ви помогна най-много в собствената ви реализация?
Заминаването ми възникна като резултат от конкурс в България, в който участвах – организиран от Българската асоциация по четене. Конкурсът беше за стипендии за обучение в чужбина – Англия и Америка по-специфично. Аз взех стипендия за Англия.
Заминаването ми помогна много на реализацията. Не толкова от страна на възможности, колкото от страна на дисциплина. Училището, в което отидох в Англия, беше пансионно, което означава че там живях, учих и се храних… Винаги се ставаше и лягаше по едно и също време и структурата на деня беше ясно предначертана. Много се държеше на точността и на това да си на правилното място в правилното време.
Повечето ученици в България си представят нещо такова само в кошмарите, но истината е, че е много полезно. Ставаш много по-отговорен и организиран, което е нужно за един млад човек, без значение какво иска да прави. Заминаването ми в Англия ме разви изключително много личностно.
От професионална гледна точка, възможностите в България имаха огромна тежест. В 11-ти клас участвах в една лятна програма наречена „Лятна изследователска школа“ (ЛИШ). Там беше първият ми по-сериозен досег с дългосрочна проекта работа. Менторът ми от програмата професор Станислав Харизанов ми помогна много да се запаля към по-нататъшните ми начинания в света на технологията. България, освен тази уникална програма, има и много състезания за технологични проекти, в които също участвах.
В последно време, тъй като съм вече завършил, основното, което ми помага в развитието, е постоянството. Трябваше ми доста от него, за да се сдобия с работата си във Weizmann Artificial Intelligence Center, но това е история за друг път.
Кои са нещата, за които вие самият мислите, че технологиите може да помогнат, но все още не са в употреба?
Има страшно много нереализиран потенциал в технологиите.
Например, нещо което ми хрумва веднага, е персонализираната диета. Един от основните фактори, допринасящи към развитието на диабет и наднормено тегло, е продължителната консумация на храна, която рязко и значително повишава нивата на глюкоза в кръвта – която повечето хора биха нарекли „висока на захар“.
Проблемът е, че за всеки човек храните, които правят това рязко покачване на глюкозата, са различни. За някои, например, сладоледът може да покачи нивата на глюкоза в кръвта по-бавно отколкото ориз – нещо, което повечето хора едва ли биха предположили. Тази вариация се влияе от гени, както и от състоянието на човешкия микробиом (бактериите в стомаха ни).
От това следва и че различните хора трябва да избягват различни храни, за да минимизират риска си от заболявания, свързани с метаболитната система – като диабет и наднормено тегло.
Това е основната идея на проект, разработван в института Weizmann, където и аз работя: на базата на състоянието на микробиома на определен човек, медицинската му предистория и гените му, да се „предскаже“ най-оптимална диета от гледна точка на стабилна кръвна захар. Разбира се, за различните хора тази диета ще варира – както видяхме в примера със сладоледа и ориза.
Имплементацията на този проект използва AI и за момента демонстрира обещаващи резултати. Лабораторията, работеща по това, е ръководена от професор Ерал Сегел – който познавам лично.
Ако може някой ден персонализираната диета да стане достъпна до средностатистическия човек извън научните изследвания, хората ще имат много по-ниска заболеваемост и затлъстяване.
Това е една посока, в която виждам огромен потенциал на технологиите, но има и безкрайно много други.
България, за разлика от други сфери, има висок престиж и много успехи на съвсем млади хора като Вас, свързани с технологиите. Как самият Вие си обяснявате този напредък тук?
Доста съм си мислил на тази тема. Едно потенциално обяснение е достъпността. Например, лаборатории по химия, биология и физика изискват скъпа апаратура, за да бъдат конкурентни. Дори за първи стъпки в дисциплините е нужен микроскоп, телескоп, инкубатор и какво ли още не.
Технологичният свят, от друга страна, не изисква особено много – любопитство и компютър e единственото, което ти трябва за да започнеш да експериментираш на основно ниво. А това повечето млади хора в България го имат. За съжаление това не е случаят с оборудването, нужно за лаборатории в други дисциплини – много малко места в България имат достатъчно финансиране.
С всичко това идва и резултат. Повече хора, имащи възможност да развиват компютърни проекти, предвижда и повече успехи в сравнение с други дисциплини.
Нещо подобно беше и със светът на AI до скоро – не беше нужно особено скъпо оборудване за постигане на ефективни резултати. Това обаче ще се променя все повече и повече – водещите AI програми за решаване на проблеми в различни сфери вече струват милиони в изчислително време. Това ще е основен източник на монополът в AI, който ще се засилва в бъдещето. Но и това е тема за друг път.
Интервю на Райко Байчев