Автор Александар Јованчов
1.Вовед
Живееме во една дигиталната ера на комуникација. Информациите се шират со огромна брзина и се достапни насекаде во секаков формат со само еден клик. Социјалните мрежи, порталите и мобилните апликации овозможуваат секој поединец да биде запознаен со најразлични вести но исто така и да биде и продуцент на вести. Но оваа отвореност и брзина носат со себе и сериозни закани – едната од најзначајните е појавата и ширењето на лажни вести.
Лажните вести не се нов феномен, но благодарение на технолошките алатки, денес тие можат да достигнат до милиони луѓе за многу кратко време. Штетните последици од дезинформации се евидентни: од нарушување на човековиот мир, преку ширење паника при здравствени кризи, до поттикнување на говор на омраза.
Па така новинарите денес се соочуваат со двоен предизвик: како да пренесат точни информации, и истовремено да ги детектираат и отфрлат дезинформациите. Токму тука вештачката интелигенција (ВИ) и машинското учење (МУ) добиваат значајна улога. Овие технологии овозможуваат анализа на текстуална содржина, откривање на шаблони кои биле препознаени како дезинформации претходно, како и предупредување за потенцијално лажни вести.
2. Што се лажни вести и зошто се проблем?
Лажните вести претставуваат намерно или ненамерно ширење на неточни, манипулативни или измамнички информации, кои често имаат за цел да влијаат на јавното мислење, политички избори, финансиски пазари или социјалната стабилност. Тие грешки во известување честопати се креирани за да заведат, манипулираат или да предизвикаат одредена реакција кај публиката.
Со појавата на социјалните медиуми и дигиталните платформи, лажните вести добија глобален простор за ширење. Алгоритмите што ја движат содржината на Facebook, YouTube, TikTok и други мрежи често преферираат содржини што предизвикуваат емоционална реакција. Токму таквите содржини – загрижувачки или шокантни се карактеристика на лажните вести.
Неколку клучни причини зошто лажните вести се сериозен општествен проблем:
- Политички манипулации: Во многу изборни процеси лажните вести се користат за манипулација, дискредитација на политички противници и ширење на одередена агенда.
- Економски штети: Лажни информации за компании или берзи можат да предизвикаат масовни продажби, загуби или недоверба кај инвеститорите.
- Здравствени ризици: За време на пандемии ширењето на лажни информации за вакцини, мерки за заштита доведува до недоверба во институциите и загрозување на јавното здравје.
- Социјална поларизација: Лажните вести често се користат за поттикнување на конфликти меѓу групи, раси, религии.
- Намалување на довербата во медиумите: Со континуираното ширење на лажни вести, публиката почнува да ја губи довербата дури и во проверените, професионални медиуми. Тоа води кон неспособност да се разликува вистина од лага.
Затоа може да се каже дека иднината на новинарството не зависи само од човечката професионалност, туку и од способноста на медиумите и технологијата да се справат со овој феномен. Поради тоа, сè повеќе се зборува за улогата на машинското учење во препознавање и блокирање на лажни вести и во новинарските редакции, и во технолошките компании, но и на ниво на владини и меѓународни институции.
3. Основи на машинско учење и вештачка интелигенција
Вештачката интелигенција (ВИ) претставува гранка на компјутерските науки која има за цел да развие системи способни да извршуваат задачи кои обично бараат човечка интелигенција – како што се препознавање говор, анализа на јазик, донесување одлуки, па дури и креативно пишување. Една од најмоќните алатки во рамки на ВИ е машинското учење (МУ) една од најзначајните за обработка и анализа на податоци.
3.1 Што е машинско учење?
Машинското учење е техника преку која компјутерите учат да извршуваат задачи без да бидат програмирани за секој чекор. Наместо да следат строги правила, алгоритмите за машинско учење анализираат огромни количини на податоци, учат од нивните шаблони и вршат предвидувања или класификации. На пример, за да „научи“ што е лажна вест, системот анализира илјадници примери на вистински и лажни вести и потоа „заклучува“ кои зборови, фрази или извори се клучеви за дезинформација.
Новинарите и другите медиумски работници ја користат за едноставни, но и за сложени задачи – од истражувања, анализи на податоци и пишување текстови, па сѐ до комуникација со публиката и дистрибуција на новинарската содржина.
3.2 Типови на машинско учење
Во контекст на детекција на лажни вести, најрелевантни се следниве типови на машинско учење:
- Супервизирано учење (Supervised Learning):
Алгоритмите се тренираат на означени податоци – на пример, вестите се веќе класифицирани како „лажни“ или „вистинити“. Со тоа, моделот учи да препознава сличности и разлики, и да врши класификација на нови вести. Алгоритми како Naive Bayes, SVM и Decision Trees се вообичаени. - Несупервизирано учење (Unsupervised Learning):
Кога не постојат однапред дефинирани ознаки, алгоритмите се обидуваат сами да откријат групи, шаблони или аномалии во податоците. Ова може да помогне при откривање на нови форми на дезинформации. - Длабоко учење (Deep Learning):
Поткатегорија на МУ која користи невронски мрежи инспирирани од човечкиот мозок. Оваа техника користи слоевити невронски мрежи и е посебно моќна при анализа на текстови, слики или видео содржини. На пример, системите базирани на длабоко учење можат да „разберат“ контекст на вест, што е клучно при откривање на суптилна манипулација.
3.3 Улогата на обработка на природен јазик (NLP)
Обработката на природен јазик (анг. Natural Language Processing – NLP) е клучна компонента во борбата против лажните вести. Таа овозможува компјутерите да „разбираат“ и анализираат човечки јазик. Комбинирањето на NLP со машинско учење овозможува автоматско:
- Разбирање на темата на веста
- Идентификација на манипулативни термини
- Проверка на факти
- Препознавање на извори и автори
3.4 Зошто е ова важно за новинарството?
Новинарството денес не може да се потпре само на човечка анализа – бројот на информации е преголем. Машинското учење и NLP нудат алатки кои им помагаат на новинарите да:
- Идентификуваат сомнителни вести пред да бидат ширени
- Автоматски проверуваат факти и извори
- Означуваат потенцијално лажни информации за понатамошна проверка
4. Примена на МУ за детекција на лажни вести
Примената на машинско учење во детекцијата на лажни вести е релативно нова, но брзо развивачка област која комбинира анализа на текст, обработка на природен јазик (NLP), класификација на информации и автоматско учење од податоци. Главната цел е препознавање на дезинформации преку автоматизирани системи кои можат да го детектираат шаблонот на лажни вести пред тие да предизвикаат реална штета.
4.1 Клучни чекори во процесот на детекција
Примената на машинско учење за идентификација на лажни вести обично вклучува неколку фази:
- Прибирање на податоци:
Се користат јавно достапни датасети (на пр. LIAR dataset, FakeNewsNet, BuzzFeed News dataset) кои содржат вистинити и лажни вести за да се обучат моделите. - Предобработка на текстот:
Податоците се преработуваат и трансформираат. - Екстракција на карактеристики (feature extraction):
Се издвојуваат клучни информации од текстот – фреквенција на зборови, употребени изрази, линкови, извори, итн. - Обука на моделот:
Моделите се тренираат со претходно означени податоци. Некои од најчесто користени алгоритми се:- Naive Bayes
- Logistic Regression
- Random Forest
- Support Vector Machines (SVM)
- Long Short-Term Memory (LSTM)
- Transformers (BERT, RoBERTa)
- Тестирање и валидација:
Моделите се тестираат на податоци кои не биле користени за обука, за да се процени нивната точност, прецизност и способност за предвидување. - Детекција и сигнализација:
Новите вести се анализираат од системот и ако се идентификуваат како сомнителни, тие се означуваат за понатамошна проверка или автоматски се класифицираат како лажни.
4.2 Типични индикатори на лажни вести
Алгоритмите за машинско учење се тренирани да препознаваат специфични индикатори, вклучувајќи:
- Употреба на сензационални наслови
- Претерана употреба на големи букви и извичници
- Недостаток на извор или автор
4.3 Успешност на моделите
За да се одреди колку е добар еден модел во откривање на лажни вести, се користат неколку метрики:
- Точност: Колкав процент од вестите се правилно класифицирани.
- Прецизност: Колку од вестите означени како „лажни“ навистина се лажни.
- Повратни информации: Колку од сите лажни вести се успешно детектирани.
На пример, едно истражување покажало дека комбинација од TF-IDF и логистичка регресија може да постигне точност од над 85% во откривање на лажни вести на англиски јазик.
4.4 Предности во автоматизацијата
- Брзина: Машинското учење овозможува анализа на илјадници вести за неколку секунди.
- Објективност: Намалување на човечка пристрасност при процена на вестите.
- Скалабилност: Системите можат да се користат на глобално ниво.
- Континуирано учење: Моделите може да се дообучуваат со нови примери и да стануваат попрецизни со тек на време.
5. Конкретни примери и алатки
Во последните неколку години, голем број алатки и иницијативи базирани на вештачка интелигенција се развиени за да се помогне во идентификување и справување со лажните вести. Овие системи се користат од медиуми, истражувачки институти, невладини организации и технолошки компании со цел да се подобри преносот на информации. Подолу се наведени некои од најзначајните системи кои се користат на глобално ниво.
5.1 ClaimBuster
ClaimBuster е еден од првите системи што користи машинско учење за откривање на фактички тврдења во говори, дебати и статии. Овој алат го идентификува тврдењето, го споредува со база на проверени факти и дава предлог дали се потребни дополнителни проверки. ClaimBuster е користен од неколку познати американски новинарски куќи како дел од нивниот процес на проверка на факти во жив.
5.2 Fake News Detection на Google Jigsaw
Google преку својот проект Jigsaw разви алатка која анализира сомнителни вести преку NLP и рангира нивна веројатност на лажност. Комбинира обработка на јазик, извор на информацијата и линкови со познати проверувачи на факти како PolitiFact и Snopes. Овој пристап покажува како големите технолошки компании вклучуваат вештачка интелигенција во борбата против дезинформации.
5.3 Full Fact (Велика Британија)
Full Fact е независна фондација за проверка на факти која користи алатки базирани на машинско учење за анализа на политички говори, медиумски објави и социјални медиуми. Тие имаат систем за автоматско следење на тврдења што се појавуваат во јавноста и известување дали тие се веќе проверени.
5.4 MediaWise и First Draft
Овие организации не само што развиваат технолошки решенија, туку и обучуваат новинари, млади и наставници за тоа како да користат вештачка интелигенција за справување со дезинформации. Тие користат алатки базирани на NLP за откривање и следење на дезинформации.
5.5 Facebook и Twitter системи
И Facebook и Twitter користат машинско учење за да ги анализираат објавите на корисниците и да го ограничат ширењето на дезинформации. Тие ги означуваат спорните објави, ги поврзуваат со проверени извори и ја намалуваат можноста за ширење.
5.6 CrossCheck
CrossCheck е проект соработка помеѓу редакции и технолошки партнери, каде што новинари од различни медиуми во реално време верификуваат вести. Оваа иницијатива се покажа како особено ефикасна во периоди на избори или општествени кризи, кога дезинформациите се најраспространети.
5.7 Microsoft
Microsoft вградува NewsGuard екстензија во својот прелистувач Edge – оваа алатка му дава на корисникот информација за точност и транспарентност за веб-страницата што ја посетува.
5.8 Улога на ваквите алатки во новинарството
Новинарите денес имаат пристап до алатки кои автоматски можат да ги идентификуваат потенцијално лажните содржини, да им укажат дали е потребна дополнителна проверка и да помогнат во брзо откривање на манипулации, особено во периоди на избори, кризи или пандемии.
Овие системи не го заменуваат човечкиот новинар или уредник, туку функционираат како интелигентен помошник кој ја зголемува прецизноста, го скратува времето потребно за проверка и овозможува поширок опфат на информации.
6.Заклучок
Можеме да заклучиме дека во оваа технолошка ера и ера на дезинформации , вештачката интелигенција претставува алатка со огромен потенцијал но и со голема одговорност. Машинското учење, кога е развиено и правилно имплементирано, може да стане голем сојузник на новинарството во откривањето и спречувањето на лажните вести. Новинарите остануваат централна фигура во медиумската етика додека ВИ треба да биде продолжение на нивните напори, а не замена за нивната професионалност.
Библиографија:
UNESCO (2021). Thinking about AI and Journalism
Automated Fact Checking: Task formulations, methods and future directions. Proceedings of the 27th International Conference on Computational Linguistics
