My Copula AI е хостирана услуга за прашања и одговори во стилот на ChatGPT на вашите документи.
Data-Centric AI (and, Retrieval-Augmented Generation)
Data-Centric AI е термин измислен од Andrew Ng, за да ги стави во центарот на внимание апликациите за вештачка интелигенција каде што користените податоци систематски се избрани. Не ја сметаме формалната дефиниција на терминот кохерентна, но општата идеја важи за системот на Copula AI.
Кога Copula AI ќе добие одговор на вашето прашање од збир на документи, таа користи процедура во два чекора. Во првиот чекор, чекорот за пронаоѓање, ги наоѓа околу 7-те страници во документите кои се најрелевантни за вашето прашање. За да се постигне ова, се користи алгоритам за машинско учење наречен пребарување на векторска сличност со вградување.
Во вториот чекор, наречен чекор на генерирање, 7-те страници заедно со вашето прашање се испраќаат до LLM (како GPT-4). Од LLM се бара да генерира одговор на прашањето користејќи ја содржината на ~7 страници. Copula AI ви го претставува последователниот одговор на LLM. Шемата подолу4 го прикажува текот на операциите, наречена пронаоѓање-зголемена генерација во академската литература.
Бидејќи вештачката интелигенција е ограничена на информации во рамките на избраните ~7 страници, таа не халуцинира и не сочинува неоснован одговор. Исто така, ~7 избраните страници се достапни на корисникот за да послужат како ревизија. Значи, ние сме сосема податоци-центрични; центрирани на вашите документи.