– Obecnie przetwarzanie tekstu wykorzystuje się głównie do zrozumienia setek dokumentów. Google wykorzystuje je, żeby indeksować strony. Przedsiębiorstwa coraz bardziej zwracają uwagę na to, że same mają miliony dokumentów, które muszą przetwarzać. Kiedy państwo staje się coraz bardziej cyfrowe, a tych danych i dokumentów jest coraz więcej. Jest ich już na tyle dużo, że człowiek nie jest w stanie sam tego przerabiać. Potrzebujemy do tego maszyn i technologii przetwarzania tekstu – mówi agencji Newseria Innowacje Przemysław Chojecki, prezes start-upu ULAM.
Sztuczna inteligencja i uczenie maszynowe sprawiają, że coraz częściej proste, powtarzalne czynności mogą wykonywać komputery i maszyny. Dzięki temu zwykły pracownik może się poświęcić znacznie bardziej twórczej pracy. Dzięki uczeniu maszynowemu technologia jest w stanie przewidzieć, jakie słowo powinno być użyte w danym miejscu tekstu. Może też wstawić odpowiednie liczby do szablonu.
– W większości usprawnienia są związane z tym, że człowiek nie musi wykonywać tych żmudnych, powtarzalnych rzeczy, tylko może się skupić na rzeczach bardziej kreatywnych, na tych wyjątkach od reguł, które maszyna gdzieś sygnalizuje, a większość tych, które się powtarzają, są już robione automatycznie. To może być albo pełna automatyzacja, a czasami przyspieszenie o 5–10 proc. – mówi Przemysław Chojecki.
Przetwarzanie tekstu daje jednak znacznie większe możliwości, z których korzystają największe organizacje, w tym m.in. agencje prasowe. Associated Press zautomatyzowała proces publikacji raportów kwartalnych największych spółek. Proste depesze są gotowe w ciągu kilku minut od udostępnienia danych. Co więcej, takie teksty są nie do odróżnienia od tych napisanych przez dziennikarzy. Strony internetowe dużych amerykańskich gazet wykorzystują technologie do relacjonowania ligowych rozgrywek sportowych czy informowania w mediach społecznościowych o klęskach naturalnych. Także w Skandynawii co roku pojawiają się tysiące zautomatyzowanych opisów rozgrywek sportowych.
Z kolei w projekcie Reporters and Data and Robots reporterzy zbierają wszystkie potrzebne informacje, jednak ich praca kończy się na researchu. Sztuczna inteligencja wykorzystuje dane do wyprodukowania kilku, kilkunastu tekstów, te zaś mogą np. zasilić lokalne wydania gazet.
– Te technologie związane z przetwarzaniem tekstu w większości mogą być wykorzystywane do jeszcze większej obróbki tekstu, żeby człowiek nie musiał robić rzeczy, które są niekreatywne, w szczególności te wszystkie prace młodszych stażystów, które polegają na tym, żeby przekleić coś z jednej strony na drugą, zrobić arkusz w Excelu i przesłać gdzieś dalej. Takie prace można zautomatyzować. Z kolei te osoby będą mogły się skupić na rzeczach bardziej kreatywnych – zaznacza prezes ULAM.
Automatyzacja w przygotowywaniu tekstów dziennikarskich niesie jednak ze sobą potencjalne ryzyko. Na początku tego roku OpenAI ogłosiła, że stworzyła na tyle sprawne oprogramowanie do generowania tekstów, że nie ogłosi w pełni wszystkich wyników. Opracowany system tworzył kompletne materiały, jednak nie do końca prawdziwe – np. wymyślając wypowiedzi czy opisując odkrycie jednorożców potrafiących mówić po angielsku. W przyszłości oprogramowanie mogłoby jednak umożliwić powstawanie na masową skalę fake newsów.
– Teraz jest moment na dyskusje właśnie o etyce, o tym, do czego to tak naprawdę doprowadzi. To jest moment, w którym rzeczywiście powstają przełomowe rzeczy – ocenia Przemysław Chojecki.
Komentarze