15.01.24, 15:45
Pierwszy audiobook czytany przez AI w Audiotece. Będą kolejne jeszcze w tym roku
„Gaming na giełdzie” to pierwszy wyprodukowany przez Audiotekę audiobook przeczytany przez sztuczną inteligencję. Producenci Audioteki wybrali książkę autorstwa Pawła Sugalskiego, ponieważ zawiera wiele danych i technicznych pojęć, których czytanie stanowi obecnie wyzwanie dla AI. Produkcja została udostępniona dla użytkowników Audioteka Klub.
Od roku w studiu nagraniowym Audioteki trwały testy weryfikujące, w jaki sposób algorytmy mogą usprawnić proces produkcji audiobooków, jednak twórcy zaznaczają, że AI będzie wykorzystywana jedynie w tych obszarach, w których jej specyficzne funkcje mogą podnieść jakość doświadczenia odbiorców, ułatwiając przyswojenie treści. „Idea wygenerowania audiobooka przy użyciu AI wzięła się z chęci eksploracji nowych rozwiązań i dostosowania się do zachodzących zmian. Chcieliśmy przekonać się, jak w praktyce przebiega praca z algorytmem sztucznej inteligencji i jakie wyzwania stawia” - mówi Arkadiusz Seidler, CEO Audioteki.
Co ciekawe, realizacja projektu "Gaming na giełdzie" zajęła dwukrotnie więcej czasu niż tradycyjne nagranie. Wynikało to z konieczności bardziej szczegółowego opracowania i przygotowania tekstu, niż przy standardowej produkcji. W celu dostosowania akapitu do wymagań AI, najpierw generuje się go w wersji testowej. Jest to podstawą do zidentyfikowania błędów interpretacyjnych i intonacyjnych. Następnie, stosując znaki specjalne, interpunkcyjne oraz rozróżniając wielkość liter, wprowadza się korekty do tekstu i ponownie go generuje. Proces ten powtarza się aż do uzyskania oczekiwanego efektu, zatem jeśli dany tekst jest poprawny, łączy się go z wygenerowanymi wcześniej fragmentami, a jeśli zawiera błędy, należy generować fragment aż do otrzymania idealnego rezultatu.
„Mimo że AI skutecznie rozpoznaje język i poprawnie akcentuje większość słów, to miewa trudności z czytaniem liczebników i krótkich wyrazów, które często interpretuje jako skróty. W związku z tym, zadaniem realizatora jest opracowanie tekstu w taki sposób, aby był on prawidłowo interpretowany przez AI – proces ten można porównać do programowania. I tak na przykład specjalnej transkrypcji wymagał zwrot “gry online” - dopiero zapis “-GRy on'lajn” pozwalał sztucznej inteligencji na odpowiednie przeczytanie tego określenia” - mówi Bartosz Sroczyński, Kierownik studia nagrań i postprodukcji w Audiotece.
W aplikacji Audioteki “Gaming na giełdzie” jest dostępny bezpłatnie dla użytkowników Audioteka Klub lub do kupienia na stronie internetowym dla pozostałych odbiorców.
Spółka zapowiada, że zamierza kontynuować prace nad wykorzystaniem AI w procesie tworzenia audiobooków. Audioteka deklaruje, że prace testowe w zakresie sztucznej inteligencji wypadły pozytywnie, więc jeszcze w tym roku zamierza stworzyć z użyciem AI kolejne produkcje. Firma podkreśla jednak, że działa ze szczególną dbałością o ochronę własności intelektualnej w przestrzeni cyfrowej. Nadal priorytetem Audioteki jest nagrywanie treści we współpracy z najlepszymi polskimi lektorami i aktorami, jednak w przypadku audiobooków, których treść i fabuła mogą być wsparte przez sztuczną inteligencję, zamierza wykorzystywać technologię AI.
Komentarze