Facebook voisi käyttää hyvää PR: tä sen jälkeen, kun viimeisimmät uutiset, jotka paljastivat sosiaalisen median yrityksen, mahdollisti miljoonien asiakkaiden tietojen varastamisen. Oikeuden korjaamiseksi aluksella Facebook on luonut avoimen lähdekoodin tietojoukon, jonka uskotaan vähentävän tekoälyn harhaa.
Facebook pyrkii korjaamaan AI-ennakkoluulot
Kasvojentunnistuksen ongelma on ollut tekoälyn puolueellisuus. Vaikka tekoäly yrittää tunnistaa ihmisiä heidän ainutlaatuisten kasvonsa piirteiden kautta, se ei historiallisesti toimi hyvin ei-miesten, ei-valkoisten yksilöiden kanssa.
Facebook on pyrkinyt korjaamaan tekoälyn ennakkoluulot avoimen lähdekoodinsa kanssa se kutsuu ”rentoiksi keskusteluiksi”. Se sisältää 45186 videota yli 3000 ihmisestä, joilla on käsikirjoittamaton keskustelu. Osallistujat ovat eri sukupuolia, ikäryhmiä ja ihon sävyjä.

Näyttelijöille maksettiin videoita, jotka sisälsivät heidän omat kuvauksensa iästä ja sukupuolesta, jotta tekoälyn perusteet poistettaisiin mahdollisimman paljon. Sitten Facebook-tiimi merkitsi ne ihon sävyllä Fitzpatrick-asteikon perusteella, joka tutkii kuutta ihon sävyä.
Valaistus havaittiin myös näyttävän erilaisia ihon sävyjä heikossa valaistuksessa. Ääni- ja visuaalista tekoälyä voidaan testata Casual Conversations -tietojoukolla. Tarkoituksena ei ole kehittää algoritmeja, vaan arvioida eri kasvojen algoritmien suorituskykyä.
Kaksi kasvojen tunnistamista varten tällä hetkellä käytetystä aineistosta – UB-A ja Adience – koostuivat pääosin valkoihoisista ihmisistä. UB-A käytti 79,6 prosenttia valkoisia ihmisiä, kun taas Adience käytti 86,2 prosenttia.

Muut kuin ihon sävy, IBM: n, Microsoftin ja Face ++: n luokittelijat menestyivät paremmin miespuolisten kasvojen kuin naisäänten kanssa MIT-tutkimuksessa. Valkoisilla urospuolisilla kasvoilla ei ollut melkein virheitä, kun taas tummempien naispuolisten kasvojen virhetaso oli lähes 35 prosenttia.
Casual Conversations pyrkii auttamaan arvioimaan tällä hetkellä käytettyä algoritmia. “Uutta Casual Conversations -tietojoukkoamme tulisi käyttää täydentävänä työkaluna tietokonenäön ja äänimallien oikeudenmukaisuuden mittaamiseen tarkkuustestien lisäksi tietojoukossa edustetuille yhteisöille”, kertoi projektissa työskentelevä Facebook-tiimi.
Rennot keskustelut
Facebook käytti rentoja keskusteluja testatakseen viisi algoritmia, jotka olivat voittaneet Deepfake Detection Challengen vuonna 2020. Tämä oli kehitetty tunnistettavien lääkäreiden tunnistamiseksi.

Huolimatta arvostetuista algoritmeista, he kamppailivat tummempien ihon sävyjen kanssa. Haasteen kolmannen sijan voittaja pärjäsi parhaiten Casual-keskusteluilla.
Facebook on jo julkaissut tietojoukon avoimen lähdekoodin yhteisölle. Tehdessään näin se totesi, että se tunnistaa sukupuolet “mies”, “nainen” ja “muu”, selittäen, että se ei voi tunnistaa niitä, jotka tunnistavat ei-binäärisiksi.
“Seuraavan vuoden aikana tutkimme mahdollisuuksia laajentaa tätä tietojoukkoa entistä kattavammaksi esityksiin, jotka sisältävät laajemman sukupuolen identiteetin, iän, maantieteellisen sijainnin, toiminnan ja muut ominaisuudet”, sanoi Facebook keinot tekoälyn ennakkoluulojen poistamiseksi.
Lue lisää Microsoftin pyrkimyksistä säännellä kasvojentunnistusta perusteiden poistamiseksi.