Współpraca ICM – SBI Tokyo

W okresie Covid-19, ICM w partnerstwie badawczym z SBI Tokyo organizował warsztaty z Taxila, których celem było umożliwienie środowisku naukowemu wykorzystania mocy Big Data i superkomputerów – wraz z przetwarzaniem języka naturalnego (NLP) i Text Mining – do walki z pandemią.

Podczas spotkań prezentowany był framework COVID-19-Taxila, który codziennie zbierał, gromadził oraz porządkował informacje o COVID-19 z różnych źródeł, m.in. z PUBMED, Arxiv, ClinicalTrials.gov czy z otwartych zbiorów danych badawczych COVID-19. Poprzez konkretne przypadki użycia i praktyczne podejście, naukowcy z SBI prezentowali uczestnikom warsztatów w jaki sposób poruszać się po Taxila oraz jak używać konkretnych modułów analitycznych do szybkiego uzyskiwania praktycznych informacji.

Nieodpłatne warsztaty z Text Mining odbywały się w dwudziestoosobowych grupach i poświęcone były tematom medycznym:  “Taxila: Empowering the fight against COVID-19 through text” oraz “Taxila global scientific literature text-mining intelligence for oncology research”(dwie edycje). W wydarzeniach wzięli udział pracownicy naukowi, lekarze i badacze z uniwersytetów i uczelni medycznych w Gdańsku, Krakowie, Lublinie, Białymstoku, Katowicach i Warszawie, Narodowego Instytutu Onkologii (Warszawa, Gliwice), Instytutu Matki i Dziecka, Międzynarodowego Instytutu Biologii Molekularnej i Komórkowej, Agencji Badań Medycznych oraz kilku innych jednostek badawczych. Uczestnicy spotkań otrzymali certyfikaty uczestnictwa.

ICM udostępniał narzędzie Taxila na podstawie umowy o współpracy naukowej z SBI  (The Systems Biology Institute) oraz w oparciu o zasoby licencyjne gromadzone przez Wirtualną Bibliotekę Nauki dostępne dla polskich instytucji objętych licencją. W ramach warsztatów dotyczących onkologii, integracja Taxila z WBN pozwalała na analizę 25 tys. pełnych artykułów naukowych, głównie z czasopism Springer i Elsevier. Za merytoryczną obsługę projektu oraz organizację spotkań z SBI odpowiadał po stronie ICM Jan Miśkiewicz z zespołu wsparcia użytkowników HPC.


Taxila to kompleksowa platforma analityczna stworzona przez SBI Tokyo, łącząca w sobie najnowocześniejsze rozwiązania przetwarzania języka naturalnego i rozumienie języka naturalnego (NLP/NLU), co pozwala na automatyczne analizowanie tekstu z setek tysięcy artykułów naukowych. W szczególności, operując na ogromnym zbiorze publikacji, Taxila pozwala na generację hipotez naukowych łączących różne obszary wiedzy zawartej w tekście za pomocą narzędzi takich jak: analiza tagów, wyszukiwanie korelacji pomiędzy pojęciami czy wizualizacja grafowa.