Lingwistyka komputerowa coraz popularniejsza

opi bip

Ostatnie lata to bardzo szybki rozwój technologii cyfrowych, które służą do przetwarzania języka naturalnego. Mają ona zastosowanie w wielu dziedzinach życia.

Choć nie zdajemy sobie z tego sprawy, to jesteśmy otoczeni technologiami z zakresu lingwistyki komputerowej. Wśród nich wyróżnić możemy aplikacje pomagające nam zmienić mowę na pismo, wyszukiwarki internetowe, asystentów głosowych, chatboty. Zastosowanie lingwistyki komputerowej widoczne jest także w przypadku narzędzi opracowujących streszczenia, odpowiadających na pytania, automatycznie generujących tekst, rozpoznających emocje czy też służących do klasyfikacji określonych treści. Spektrum wykorzystania lingwistyki komputerowej jest bardzo szerokie i dane systemy są powszechnie stosowane na całym świecie.

Intensywny rozwój narzędzi do automatycznego przetwarzania języka naturalnego to bez wątpienia w ostatnich latach jeden z zauważalnych trendów w branży IT. Prace nad tymi systemami prowadzone są przez wiele ośrodków z całego świata. Takie produkty jak inteligentni asystenci głosowi czy chatboty są coraz bardziej popularne. W naszym instytucie prowadzimy coraz więcej prac związanych z lingwistyką komputerową i nie są to tylko projekty badawcze. Opracowujemy i wdrażamy nowe narzędzia, które efektywnie wspierają działalność człowieka. Nasz Annobot potrafi rozróżnić emocje na podstawie tekstu, JSA odnajduje plagiaty w pracach dyplomowych, a nowy system, który planujemy przygotować dla UOKiK będzie wyszukiwał niedozwolone zapisy w umowach. Zakres naszych prac jest bardzo szeroki i duży nacisk kładziemy na funkcjonalność naszych produktów 

dr inż. Jarosław Protasiewicz, dyrektor Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego (OPI PIB)

W poprzednich latach eksperci OPI PIB opracowali i wdrożyli narzędzia oparte na lingwistyce komputerowej, które wykorzystują proces odpowiedniej klasyfikacji tekstów. Tak właśnie powstał system Inventorum do wykrywania innowacji w sieci internetowej i następnie udostępniania ich przedsiębiorcom, którzy mogą być nimi zainteresowani. Na podobnym mechanizmie oparte jest także narzędzie do klasyfikacji wielojęzycznych artykułów naukowych, które skutecznie ułatwia pracę badaczom z różnych dziedzin.

Ciekawy projekt zrealizowaliśmy także wykorzystując mechanizm ekstrakcji danych z nieuporządkowanych tekstów. Opracowaliśmy system analizy raportów z akcji realizowanych przez Państwową Straż Pożarną. Dzięki niemu z dużej ilości nieuporządkowanych danych tekstowych, w szybki i łatwy sposób otrzymujemy informacje m.in. o miejscu wypadku, rodzaju zdarzenia, powstałych zniszczeniach czy też lokalizacji i stanie technicznym hydrantu przeciwpożarowego. Ciekawe prace realizują także inni eksperci z OPI PIB. Czerpią oni inspirację z naturalnie występujących systemów biologicznych. Przekształcają tekst pisany w sygnały odpowiadające mechanizmom zachodzącym w mózgu człowieka, tworzą tzw. sieci impulsowe. One następnie są wykorzystywane do opracowania systemów rozpoznawania i klasyfikacji odpowiednich tekstów

dr inż. Marcin Mirończuk z Laboratorium Inteligentnych Systemów Informatycznych w OPI PIB


źródło: OPI PIB

Adam Daniluk