27 czerwiec 2019

Ze sztuczną inteligencją szybko nie porozmawiamy w języku polskim. Brakuje wystarczającej liczby danych, w tym tysięcy godzin nagrań mowy

Przetwarzanie języka naturalnego umożliwia maszynom czytanie i rozumienie języków ludzkich. Obecnie NLP pozwala np. na rozpoznawanie i przewidywanie chorób w oparciu o elektroniczne dane medyczne i mowę pacjenta. Największe firmy analizują e-maile za pomocą NLP i zatrzymują spam. Siri i Alexa to przykłady inteligentnych interfejsów sterowanych głosem, które wykorzystują NLP do reagowania na komunikaty głosowe. Pojawiają się też pierwsze przykłady sztucznej inteligencji mówiącej po polsku, jednak na razie jedynie w prostych i ograniczonych komunikatach. Główną barierą jest niewystarczająca baza danych.
REKLAMA

– Szacowałbym poziom zaawansowania rozwoju technologii dla języka polskiego gdzieś w połowie krajów europejskich. Nie jest to już złym wynikiem, jeszcze 10 lat temu byliśmy na jednym z ostatnich miejsc, jeśli chodzi o dostępność słowników, zbiorów tekstów, rozwiązań dla języka polskiego. Wykorzystanie technologii dla języka polskiego w rozwiązaniach czołowych komercyjnych firm jest bardzo niskie, ponieważ one bazują wyłącznie na swoich językach, nie postrzegają języka polskiego jako wyróżniającego się w masie innych języków niż angielski – ocenia w rozmowie z agencją Newseria Innowacje dr hab. inż. Maciej Piasecki z Katedry Inteligencji Obliczeniowej na Politechnice Wrocławskiej.

Przetwarzanie języka naturalnego (NLP) reprezentuje automatyczną obsługę naturalnego języka ludzkiego, takiego jak mowa lub tekst. Prawdziwa wartość tej technologii wynika jednak z możliwości zastosowania. NLP umożliwia np. rozpoznawanie i przewidywanie chorób w oparciu o elektroniczne dane medyczne i mowę pacjenta – od chorób układu krążenia do depresji czy schizofrenii. Amazon Comprehend Medical wykorzystuje z kolei NLP do wyodrębniania stanów chorobowych, leków i wyników leczenia z raportów z badań klinicznych. IBM opracował asystenta kognitywnego, który działa jak spersonalizowana wyszukiwarka, uczy się wszystkiego o użytkowniku, a następnie przypomina potrzebne informacje. LegalMation, obsługiwana przez technologię IBM Watson NLP, opracowała zaś platformę do automatyzacji rutynowych zadań sądowych, pomaga zaoszczędzić czas i obniżyć koszty.

Chociaż możliwości NLP są praktycznie nieograniczone, to wciąż brakuje jeszcze rozwiązań bazujących na języku polskim. Sytuacja jednak powoli się zmienia.

– Coraz więcej polskich start-upów, małych i średnich firm zidentyfikowało niszę, jaką są systemy, które są stworzone dla języka polskiego czy obsługują język polski w bardziej świadomy sposób. Liczba rozwiązań rośnie. Rośnie też liczba projektów, które wspólnie realizujemy, m.in. dzięki finansowaniu unijnemu – zaznacza Maciej Piasecki.

Jak wskazuje ekspert, problemem dla szerszego wprowadzenia rozwiązań bazujących na języku polskim, jest stosunkowo niewielka baza danych. Choć nasz język stwarza ogromne możliwości, zwłaszcza w kontekście innych języków o rozbudowanej morfologii, to większość rozwiązań dostępnych w Polsce bazuje na przetworzonym języku angielskim.

– Niewiele jest firm, które gromadzą takie liczby danych jak czołowe firmy na świecie. Paradoksalnie te firmy, które działają na polskim rynku, mają trochę trudniej, ponieważ polskie prawo jest dość restrykcyjne, jeśli chodzi o wykorzystanie danych. Natomiast wielkie firmy światowe trochę nie przejmują się polskimi ograniczeniami i trudno z tym cokolwiek zrobić. Zbierają dane, które chcą, i nie sposób tego zablokować – twierdzi ekspert.

Podobny problem mają też inne kraje regionu. Liczba rozwiązań wykorzystujących rodzimy język jest jeszcze niewielka, pojawiają się dopiero pierwsze rozwiązania, najczęściej opracowane przez rodzime start-upy. Tym samym ich zasięg jest dość mały.

– Jest duży problem w zbudowaniu zasobów, na których można trenować. Potrzebujemy tysięcy godzin nagrań mowy opisanych za pomocą tzw. transkrypcji czy opisanych tekstem ilustrującym, przy czym obecnie całkowity zasób takich nagrań mowy dla polszczyzny dostępnych publicznie to sto kilkadziesiąt godzin. Dopóki nie ma dostatecznie dużego zbioru danych, dopóty jakość będzie trochę niższa – ocenia dr hab. inż. Maciej Piasecki.

Według analityków MarketsandMarkets rynek przetwarzania języka naturalnego (NLP) osiągnie do 2021 r. wartość ponad 16 mld dol.

źródło: newseria.pl
PRZECZYTAJ JESZCZE
REKLAMA

Kalendarz Wydarzeń / Koncertów / Imprez w Gdańsku

kiedy
2019-11-18 19:00
miejsce
Filharmonia Bałtycka, Gdańsk, ul....
wstęp biletowany
kiedy
2019-11-18 20:00
miejsce
Pub Torpeda, Gdańsk, ul. Zofii...
wstęp biletowany
kiedy
2019-11-20 20:00
miejsce
ERGO ARENA, Gdańsk, Plac Dwóch...
wstęp biletowany
kiedy
2019-11-21 21:00
miejsce
Klubogaleria Bunkier, Gdańsk,...
wstęp biletowany




Szanowny Czytelniku!

Przypominamy podstawowe informacje z zakresu przetwarzania danych dostarczanych przez Ciebie podczas korzystania z naszych serwisów.
Zamykając ten komunikat (kliknięcie w przycisk "Przejdź Dalej" lub "X"), zgadzasz się na wskazane poniżej działania.


Stosowanie plików cookies i innych technologii

Wraz z naszymi partnerami stosujemy pliki cookies (ciasteczka) i inne pokrewne technologie, które mają na celu:
- Zapewnienie bezpieczeństwa podczas korzystania z naszych stron
- Ulepszenie świadczonych przez nas usług poprzez wykorzystanie danych w celach analitycznych i statystycznych
- Poznanie Twoich preferencji na podstawie sposobu korzystania z naszych serwisów
- Wyświetlanie spersonalizowanych reklam, które odpowiadają Twoim zainteresowaniom

Zakres wykorzystywania plików cookies możesz określić w ustawieniach Twojej przeglądarki. Bez wprowadzenia zmian ustawień, informacje w plikach cookies mogą być zapisywane w pamięci Twojego urządzenia.


Administratorzy danych

Administratorem tych danych jesteśmy my, czyli Twoje-Miasto Sp. z o.o., ul. Legionów 57A 86-300 Grudziądz jak również nasi Zaufani Partnerzy z którymi współpracujemy. Najczęściej ta współpraca ma na celu dostosowywanie reklam, które widzisz na naszych stronach do Twoich potrzeb i zainteresowań oraz wykonywanie różnych badań mających na celu polepszanie usług internetowych i dostosowywanie ich do potrzeb użytkowników. Szczegółowe informacje dotyczące administratorów znajdują się w Polityce Prywatności.


Jak wykorzystujemy Twoje dane

W ramach świadczonych przez nas usług staramy się wyświetlać reklamy odpowiadające Twoim zainteresowaniom, które dotyczą naszych produktów oraz produktów klientów korzystających z naszych usług reklamowych (marketing bezpośredni). W tym celu wykorzystujemy informacje zapisywane w plikach cookies, które otrzymujemy podczas korzystania z naszych stron. Nasze działania podejmowane są zgodnie z obowiązującym prawem w ramach tzw. uzasadnionego interesu administratora danych, ponieważ chcemy, by wszystkie nasze usługi, w tym wyświetlane reklamy, były najlepiej dopasowane do potrzeb użytkownika.


Wykorzystywanie Twoich danych przez naszych partnerów

Podobne działania w celach marketingowych podejmują nasi Zaufani Partnerzy, którym udostępniamy powierzchnię reklamową na naszych stronach. Wśród Zaufanych Partnerów znajdują się dostawcy technologii reklamowej, sieci reklamowe, domy mediowe, agencje interaktywne oraz reklamodawcy.
Nasi partnerzy gromadzą i wykorzystują informacje określające Twój sposób korzystania z naszych serwisów. Dzięki temu wyświetlają reklamy najbardziej dopasowane do uzyskanych informacji oraz udostępniają je innym podmiotom wyświetlającym lub zlecającym reklamę w Internecie.
W związku z reformą prawa ochrony danych osobowych nasi partnerzy potrzebują Twojej zgody na działania, których dokonują na naszych stronach. W przypadku jej udzielenia nasi partnerzy będą mogli, w ramach uzasadnionego interesu, wykorzystać Twoje informacje także dla celów analitycznych służących ocenie skuteczności podejmowanych działań marketingowych.
Pamiętaj, że ewentualna zgoda jest Twoją dobrowolną decyzją, natomiast brak jej udzielenia może wpłynąć na Twój komfort korzystania z naszych serwisów. Reklamy nieodpowiadające zainteresowaniom użytkownika są nie tylko nieatrakcyjne, ale i drażniące dla odbiorcy.

Zgodę możesz udzielić poprzez zamknięcie tego komunikatu (kliknięcie w przycisk "Przejdź do serwisu" lub "X"). Udzieloną zgodę możesz w każdej chwili wycofać, co jednak nie będzie równoznaczne z tym, że korzystanie z tych informacji do czasu wycofania zgody było niezgodne z prawem.


Jakie masz prawa?

Masz pełne prawo do zgłoszenia podmiotowi wykorzystującemu Twoje dane osobowe żądania dostępu do tych informacji, ich poprawiania, usunięcia lub ograniczenia przetwarzania. Pamiętaj jednak, że nie w każdym przypadku możliwe jest zrealizowanie Twoich praw w odniesieniu do informacji zapisanych w plikach cookies.

Więcej szczegółów znajdziesz w naszej Polityce Prywatności.