Родова пристрасност во гласовните асистенти: Зошто виртуелните асистенти како Alexa, Siri и Google Assistant најчесто имаат женски глас и какво е нивното општествено влијание? – Користење на вештачката интелигенција (AI) за унапредување на родовата еднаквост

Тамара Стојанова

1.Вовед

Гласовните асистенти како Alexa, Siri, Cortana и Google Assistant се сè поприсутни во нашето модерно секојдневие, олеснувајќи ја секојдневната комуникација и извршувањето на најразлични задачи. Ваквите виртуелни асистенти се дизајнирани за да бидат корисни, достапни и пријателски настроени, што е она кое ги прави популарни кај огромен број на корисници ширум светот. Речиси три милијарди луѓе моментално користат софтвер со автоматизиран говор за да им помогне при поставување на аларм за будење наутро, за наоѓање на препорака за ресторан во близина, за да ја проверат временската прогноза за време на викендот и слично, а оваа бројка на корисници се очекува експоненцијално да расте во текот на следните години. Сепак, една интересна карактеристика која привлекува внимание и поради која овие асистенти се соочуваат со критики е дека тие најчесто користат женски гласови, што е универзален тренд кај повеќето вакви технологии.

Оваа појава отвора важни прашања за улогата на родот во дизајнот на технологијата и нејзиното влијание врз општеството. Дали изборот на женски гласови е случаен или тој носи подлабоки импликации за начинот на кој ги перцепираме родовите улоги? Како овие одлуки влијаат врз нашите ставови и очекувања во однос на родовата еднаквост? Темата за родовата пристрасност кај гласовните асистенти не само што го поставува прашањето за технолошкиот дизајн, туку и за неговата улога во обликувањето на културните и социјалните вредности.

2.Важноста на родовата разновидност кај гласовите добиени со вештачка интелигенција

Користењето на гласови со изразен родов идентитет кај вештачките асистенти како Alexa, Siri и Google Assistant предизвикува значајни дебати околу зајакнувањето на општествените стереотипи и етичките предизвици во дизајнирањето на инклузивни гласовни технологии. Истражувањето на Бајрон Ривс и Клифорд Нас ^[1]од 1990-тите

3 февруари, 2025

покажало дека луѓето комуницираат со компјутерите и гласовните асистенти како со другите луѓе, често под влијание на длабоко вкоренети родови предрасуди. Женските гласови се претежно избрани за овие асистенти, што ги зацврстува традиционалните улоги на жените како негувателки, услужни и подредени фигури. Овој тренд предизвикува загриженост за потенцијалното ширење на штетни стереотипи, особено кога овие уреди се користат во домови и работни места, каде што влијаат врз перцепциите за родовите улоги.

Слика 1 – Табела со одговори на гласовните асистенти на прашањето „Кој е твојот пол?“

Последиците од овие дизајнерски избори „одат“ подалеку од естетиката, бидејќи тие обликуваат ставови на корисниците и општествените норми. Истражувањата покажуваат дека гласовите со изразен родов идентитет несвесно влијаат врз тоа како корисниците ја перципираат авторитетноста, компетентноста и емпатијата. Женските гласови често се поврзуваат со задачи кои се сметаат за секундарни или поддржувачки, додека машките гласови се поврзуваат со техничка експертиза или

4 февруари, 2025

авторитет. Овие предрасуди не само што ги рефлектираат постоечките нееднаквости, туку доведуваат и до ризик да се засилат истите преку широката употреба на овие технологии. Решавањето на овој проблем бара посветен напор за воведување на разновидност на гласовните опции кај вештачките асистенти, обезбедувајќи поддршка за различни родови, акценти и култури, истовремено справувајќи се со етичките аспекти како што се согласноста и инклузивноста.

3.Митови

Историјата на дигиталните асистенти и причините зошто тие најчесто имаат женски гласови е исполнета со митови и недоразбирања. Иако можеби би се надевале дека низ историјата постои логично објаснување за оваа појава, реалноста открива дека овие избори се базираат на погрешни претпоставки и историски стереотипи.

Мит: Женските гласови се полесни за слушање во бучна средина

Еден од најраспространетите митови датира од 1940-тите години, кога се тврдело дека повисоките женски гласови се полесни за разбирање во авиони. Оваа претпоставка датира уште од Втората светска војна, за време на која навигациските системи биле воведени во кабините на пилотите. Тогаш, се верувало дека женските гласови би биле поразбирливи кога доаѓаат во судар со звуците од моторите. Но, истражување од 1998 година го демантира ова тврдење, покажувајќи дека женските гласови всушност се помалку разбирливи во такви бучни услови, иако разликата била мала и статистички значајна само при екстремно високи нивоа на бучава.

Мит: Женските гласови се полесни за слушање во секојдневна комуникација

Друг мит е дека женските гласови, поради нивната повисока фреквенција, се попријатни и полесни за разбирање во секојдневни ситуации без позадинска бучава. Но, ова исто така се покажало како неточно, токму поради тоа што женските гласови обично се со повисоки фреквенции, а луѓето со текот на времето ја губат способноста да слушаат звуци со повисока фреквенција. Според Калифорнискиот

5 февруари, 2025

центар за слух ^[2], луѓето кои имаат проблеми со слухот на високи фреквенции имаат потешкотии да разберат комуникација која паѓа во опсегот од 2.000 до 8.000 херци – опсег кој често го опфаќа женскиот глас.

4.Истражувања

Според Зирау, кој е еден од авторите на студија од 2021 година ^[3]за гласовните асистенти, полот и висината, „Гласот е многу комплексен – тој е повеќедимензионален“. Се чини дека факторите како возраста, полот на слушателот, демографијата и нивното разбирање за задачата на гласовниот асистент играат улога во тоа како реагираме на глас од различен пол. Тимот на Зирау развил гласовен интерфејс и побарал од испитаниците да резервираат лет или да направат финансиска анкета со помош на асистенти со гласови со различни тонови. Со помош на истите, тие откриле дека слушателите донесуваат моментални одлуки за полот на виртуелниот асистент кога ќе го слушнат секој глас – и дека само слушањето на гласот, што го поврзуваат со одреден пол, ги натерало да направат стереотипни, родови претпоставки за компјутеризираниот асистент за кој станува збор.

Корисниците обично припишувале стереотипи како „нежни“ и „емпатични“ на женските гласови, додека за машките гласови велат дека звучат „доминантно“. Згора на тоа, учесниците постојано доделувале пол и на родово неутрален глас, дури и кога им била дадена опција да кажат дека се неодлучни. Зирау заклучува дека луѓето имаат многу дуалистичка перцепција за полот.

Некои истражувачи велат дека можеме да донесеме одлука за полот на говорникот за само пет секунди. Едно истражување од 2020 година ^[4], на пример, покажало дека иако мнозинството мажи и жени се изјасниле дека сакаат да слушнат женски глас на нивниот паметен звучник, локалните акценти одиграле значајна улога во одредувањето на кредибилитетот на говорникот без оглед на полот. И други истражувања покажуваат дека довербата на луѓето во различни родови гласови

варира во различните општествени контексти.

6 февруари, 2025

Но, зошто е толку привлечно да се класифицира компјутеризиран глас како машки или женски? Крис Мејхорн, шеф на одделот за психологија на Државниот универзитет во Северна Каролина, вели дека за тоа се виновни општествените норми, на кои луѓето уште веднаш се осврнуваат кога слушаат глас. Мејхорн е

коавтор на една неодамнешна студија која го испитувала влијанието на перцепираниот пол врз перцепциите на учесниците за гласовните асистенти. Генерално, учесниците повеќе му верувале на женскиот глас за совети за лекови и ги перципирале женските гласови како „подобронамерни“ од машките – вообичаена социјална пристрасност понекогаш наречена позната како ефектот на „жените се прекрасни“.

Мејхорн вели луѓето не претпоставуваат дека компјутерите или гласовните асистенти се вистински луѓе со пол, туку се работи за несвесно применување на своите културни предрасуди, третирајќи ги компјутерите како општествени суштества и гледајќи ги низ „родовата леќа“. Маркетингот и корисничките интерфејси на технолошките компании довеле до истиот ефект, бидејќи на повеќето популарни гласовни асистенти им се дадени женски имиња и гласови. Иако многу технолошки компании оттогаш ги отстраниле маркерите како „женско“ и „машко“ од своите опции, најпопуларните гласовни асистенти првично биле идентификувани како жени во нивните оперативни системи, па дури биле и програмирани да одговорат на родово вознемирување со флертувачки коментари. „За нашите цели – градење на корисен, поддржувачки, доверлив асистент – женскиот глас беше подобар избор“, вели портпаролката на Мајкрософт во 2017 година. Другите компании се нешто потаинствени за нивните причини за избор на женски шифрирани гласови за да вршат работи како што се закажување и испраќање потсетници. „На крајот, она што луѓето го бараат е она што го зголемува ангажманот“, вели Зирау.

7 февруари, 2025

5.Причини

Луѓето претпочитаат женски гласови

Како што може да се забележи и во минатата секција, истражувањата покажуваат дека луѓето генерално повеќе ги преферираат женските гласови, што може да се должи на биолошки и психолошки фактори. Некои теории сугерираат дека оваа наклонетост започнува уште во утробата, каде што звуците на мајчиниот глас ги смируваат фетусите. Дополнително, жените имаат тенденција да ги артикулираат самогласките појасно, што ги прави полесни за разбирање, особено во професионални средини. Оваа претпоставка, иако дискутабилна, историски се користела како оправдување за изборот на женски гласови во различни технологии.

Компаниите често се водат од резултатите на пазарните истражувања при изборот на гласовите за своите асистенти. Тие го покажуваат истото, односно дека луѓето во одредени култури, како САД, претпочитаат женски гласови за дигитални асистенти. Овие преференции влијаат врз одлуките на компаниите да користат женски гласови како стандардна опција.

Недостаток на податоци за машки гласови

Една од главните причини зошто дигиталните асистенти најчесто имаат женски гласови се вели дека е историскиот недостаток на податоци за машки гласови. Во 1880-тите години, телефонските оператори биле исклучиво жени, што оставило огромна база на податоци за женски гласови. Ова значи дека компаниите денес имаат многу повеќе податоци за тренирање системи со женски гласови, што го прави процесот побрз и поекономичен. Создавањето машки глас би барало собирање нови податоци и развивање нови системи, процес кој многу компании го сметаат за скап и непотребен. Меѓутоа, многу луѓе сметаат дека ова не би требало да се смета како непотребно, затоа што се работи за засилување на некоректни стереотипи.

8 февруари, 2025

Кога вработените во Google го спремале Google Assistant, тие истиот го именувале неутрално затоа што идејата била да се вклучи верзија со машки и верзија со женски глас. Меѓутоа, работите не оделе по план затоа што користените системите биле тренирани со податоци од женски гласови и не можело да се обезбеди ист квалитет за машките гласови. Поставувањето маркери во аудио-записите за препознавање звуци било помалку прецизно кај машките гласови, што го отежнувало процесот.

Технички ограничувања при синтетизирање гласови

Кога првпат биле развивани вештачките асистенти, технологијата за претворање на текст во звук не била толку напредна како денес. Имено, женските гласови, поради нивната повисока фреквенција и природен тон, биле полесни за синтетизирање. Оваа техничка предност исто така се смета за една од причините

за нивна доминација во раните фази на развојот на дигиталните асистенти. Историски и културни фактори

Историската употреба на женски гласови во уреди како навигациски системи (од Втората светска војна) и телефонски оператори ја поставила основата за перцепцијата дека женските гласови се „поприфатливи“ за даватели на услуги. Дури и денес, културните стереотипи играат улога – пример е случајот со BMW во Германија во 1990-тите години, кога мажите одбиле да прифаќаат инструкции од женски навигациски систем.

Овие причини покажуваат дека изборот на женски гласови кај дигиталните асистенти не е случаен, туку е резултат на комбинација од технички ограничувања, културни стереотипи и економска исплатливост.

9 февруари, 2025

6.Начини за справување со родовата пристрасност при автоматизација на гласот

Справувањето со родовата пристрасност во автоматизирањето на гласовите бара интегриран пристап кој вклучува технолошки, индустриски и општествени промени. Еден од клучните чекори е инвестирањето во напредна технологија за машинско учење, што овозможува создавање поприродни и разновидни гласови, како машки, така и женски. Пример за ова е алгоритмот WaveNet ^[5]развиен од Google DeepMind, кој значително ја подобри способноста на системите кои претвораат текст во звук околу создавањето на гласови со висок квалитет. Дополнително, потребно е воспоставување унифицирани индустриски стандарди кои ќе го регулираат начинот на кој се претставува родот во вештачката интелигенција. Овие стандарди треба да бидат развиени со учество на различни групи, вклучувајќи лица со различен родов идентитет и културна позадина, со цел да се дефинираат карактеристиките на родово неутрални гласови.

Транспарентноста при собирањето податоци е исто така клучна за намалување на пристрасноста. Компаниите треба да ги споделуваат информациите за демографијата на нивните тимови, корисничките преференции и истражувањата за родово неутрални гласови. Ова би овозможило подобро разбирање на врската меѓу технологијата и родовите стереотипи. Дополнително, зголемувањето на инклузивноста во индустријата за вештачка интелигенција е од суштинско значење. Со вакви промени, ќе можеме да изградиме поинклузивна технологија која ги отсликува различностите во општеството и ги намалува родовите стереотипи.

10 февруари, 2025

7.Заклучок

Гласовните асистенти се одраз на нашето општество и неговите предрасуди, но нудат можност за промена. Со примена на напредна технологија, инклузивен дизајн и отворени дискусии за родовата репрезентација, можеме да создадеме технологија која ги почитува различностите и ги намалува стереотипите. Иднината што ја градиме треба да биде простор каде што секој глас е важен и слушнат.

8.Референци

⧫ Byron Reeves, Clifford Nass – The Media Equation: How People Treat Computers, Television, and New Media like Real People and Places –

https://books.google.mk/books/about/The_Media_Equation.html?id=S iatQEACAAJ&source=kp_book_description&redir_esc=y

⧫ California Hearing Center – What is high frequency hearing loss and what can i do about it? – https://calhearing.com/what-is-high-frequency-hearing-loss-and-what-can i-do-about-it/

⧫ Naim Zierau and 5 others – Female by Default? – Exploring the Effect of Voice Assistant Gender and Pitch on Trait and Trust Attribution –

https://dl.acm.org/doi/10.1145/3411763.3451623

⧫ Article by Mark Jacob – Medill Study Finds Preference for Female Voices and Local Accents – https://localnewsinitiative.northwestern.edu/posts/2020/03/30/voice accent-study/

⧫ Google Deepmind – WaveNet –

https://deepmind.google/research/breakthroughs/wavenet

11 февруари, 2025