„Big data w humanistyce i naukach społecznych”, pod red. Anety Firlej-Buzon, SBP Warszawa 2020.
Książka jest 197. tomem z serii „Nauka-Dydaktyka-Praktyka,” wydawanej przez Wydawnictwo Naukowe i Edukacyjne Stowarzyszenia Bibliotekarzy Polskich. Seria jest wydawana od 1994 roku, w jej ramach poruszane są główne dążenia, trendy, pomysły i wyzwania, z którymi mierzy się bibliotekarstwo zarówno w Polsce, jak i na świecie. Autorzy zebranych w tomie artykułów nie tylko prezentują praktyczne wykorzystanie narzędzi i mechanizmów big data, ale również próbują szukać odpowiedzi i zapraszają do refleksji nad rolą humanistyki i nauk społecznych we współczesnym, szybko zmieniającym się świecie. Sam termin big data, zaczerpnięty z ekspansywnego obecnie świata nauk ścisłych, opisuje proces szybkiego napływania, przechowywania, dystrybucji, zarządzania i analizowania dużych ilości skomplikowanych i zmiennych danych. Tego rodzaju procesy kontrolują i warunkują obecnie wiele obszarów naszej aktywności, choć nie zawsze jesteśmy tego w pełni świadomi.
Autorzy kierują naszą uwagę na proces danetyzacji, czyli przekładania kulturotwórczej aktywności człowieka na dane, by móc je agregować i algorytmizować, a w efekcie lepiej rozumieć rzeczywistość. Z jednej strony badacze-humaniści mają nadzieję, że zastosowanie text mining (eksploracja tekstu) i data mining (etap procesu pozyskiwania wiedzy z bazy danych) pozwoli im odkryć nowe prawa, trendy, wzorce i in. Z drugiej strony liczą, że dzięki wynikom prowadzonych przez nich badań, łatwiej wejdą w wartki nurt wirtualnej i ogólnoświatowej wymiany informacji. Nieodzownym kluczem do tego rodzaju sukcesu jest umiejętne wykorzystywanie odpowiedniego oprogramowania. Dlatego w wielu artykułach omawia się możliwości, jakie niesie wykorzystywanie nierelacyjnych (NoSQL) i relacyjnych (SQL) baz danych, platform, aplikacji, protokołów wymiany danych, interfejsów, nowych systemów organizacji informacji i wielu innych. W jakich obszarach wiedzy humanistycznej znajdują one szersze i realne zastosowanie? Między innymi w rozległej przestrzeni złożonych interakcji człowiek – artefakt, czyli również w polu nauk bibliotekoznawczych i bibliograficznych. Badacze próbują przetwarzać bibliografię metodami big data, czy wykorzystywać je w badaniach korpusowych. Pytanie, czy ze względu na dość ograniczony, choćby ilościowo, zakres ich badań można je zaliczyć do big data?
W artykułach zebranych w tomie zwraca się uwagę na ograniczenia w wejściu w sferę wirtualnego obiegu informacji, wynikające z dość rozbudowanego formatu MARC, nieprzystosowanego do funkcjonowania w sieci semantycznej (którą tworzy np. standard www). Szkoda, że w żadnym z artykułów nie wspomina się o BIBFRAME, następcy ponad już pięćdziesięcioletniego (sic!) formatu. Wykorzystujący założenia danych powiązanych (linked data) BIBFRAME ma umożliwić rekordom bibliotecznym, by były czytane i indeksowane przez główne wyszukiwarki internetowe.
Nauki humanistyczne, społeczne i wiele innych ścierają się lub wchodzą w mezalians z paradygmatami badawczymi i technologiami wywodzącymi się z obszaru nauk ścisłych. Są do tego niejako zmuszone, by nie zostać zmarginalizowanymi, a w efekcie nieprzydatnymi i zapomnianymi. Po lekturze zbioru nasuwa się pytanie nie tylko o zmianę sposobu prowadzenia badań i publikowania ich wyników, ale także o rolę bibliotekarzy i bibliotek naukowych. Niewątpliwie zmienia się charakter współczesnych bibliotek naukowych. Zmniejszająca się liczba czytelników wymusza odchodzenie biblioteki od typu zasobowego (opartego na gromadzeniu zbiorów) na rzecz dostępowego (opartego na dostępie sieciowym). Powoli bibliotekarze stają się doradcami danych badawczych (data stewards), którzy wspierają naukowca w procesie tworzenia i deponowania danych. Czyżby naszą główną rolą w przyszłości był nadzór nad digitalizacją, danetyzacją, algorytmizacją i agregacją danych, by w zgrabnej paczce żądanego formatu cyfrowego przesłać je w chmurze czytelnikowi? Tak, ale tylko, jeśli korzysta on z odpowiednich programów bibliograficznych.
Joanna Gajowiecka-Misztal
Ten utwór jest dostępny na licencji Creative Commons Uznanie autorstwa Użycie niekomercyjne 4.0 Międzynarodowe