Otwarte dane badawcze

Dane badawcze

Czym są dane badawcze?

Najpopularniejsza definicja danych badawczych, sformułowana w 1999 r. na potrzeby rządu amerykańskiego, brzmi: „Dane badawcze są definiowane jako zarejestrowane materiały o charakterze faktograficznym, powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych.”

Natomiast w dokumencie NCN pt.:  „Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym” czytamy: „(…) pod pojęciem „dane” NCN rozumie zarówno dane zebrane i dotąd nieprzetworzone, jak i dane wytworzone i poddane analizie, inne niż publikacje naukowe. Definicja ta obejmuje wszystkie możliwe formaty, zarówno cyfrowe, jak i niecyfrowe (np. próbki, wypełnione kwestionariusze, nagrania dźwiękowe, itd.).”

Rodzaje danych badawczych:

  • surowe – zebrane, ale nie przeanalizowane,
  • obserwacyjne – przechwytywane w czasie rzeczywistym (np. odczyty czujników, dane telemetryczne, wyniki anonimowych ankiet, badania fokusowe), często unikalne, ponieważ nie można ich „odzyskać”;
  • eksperymentalne – uzyskane ze sprzętu laboratoryjnego w kontrolowanych warunkach, powtarzalne, ale często bardzo kosztowne (np. sekwencje genów, spektroskopia, odczyty pola magnetycznego),
  • dane symulacji – zebrane podczas testów badających rzeczywiste lub teoretyczne systemy (np. modele klimatyczne, ekonomiczne, systemy inżynieryjne),
  • dane pochodne / skompilowane – wyniki analiz danych, albo dane agregowane z różnych źródeł. Powtarzalne, ale ich pozyskanie może być bardzo kosztowne (bazy danych, teksty, modele 3D, dane bibliometryczne),
  • dane referencyjne – poprawione lub organiczne zbiory danych, zwykle recenzowane, publikowane i selekcjonowane (dane GUS, struktury chemiczne, bazy danych z sekwencjami genów).
Plan zarządzania danymi badawczymi

Plan zarządzania danymi można uznać za część planu badań, która opisuje co będzie działo się z danymi w trakcie projektu badawczego i po jego zakończeniu. Ma charakter „żywego” dokumentu, który może zmieniać się w trakcie trwania projektu.
Najczęściej udostępnia się tzw. datasety ­– zbiory danych stanowiące pewną całość, dane powiązane z jedną publikacją, jednym projektem, eksperymentem.
Zarządzanie danymi obejmuje wszystkie aspekty przetwarzania, organizowania, dokumentowania i ulepszania danych badawczych, a także ich przechowywania, zapewniania ich trwałości i udostępniania.

We wszystkich planach zarządzania danymi badawczymi można znaleźć pewne wspólne elementy:

  • zagadnienia związane z wytworzeniem / pozyskaniem danych,
  • formaty plików i ich nazewnictwo, przechowywanie danych,
  • opis sposobu dostępu do danych i informacje o ich ponownym wykorzystaniu,
  • aspekty prawne i etyczne,
  • kwestie finansowe, infrastrukturalne i kompetencyjne (za ile, gdzie, kto i za to odpowiada?).

Checklista (lista kontrolna)
Na liście znajdują się zagadnienia wspólne dla wszystkich planów zarządzania danymi badawczymi.
Szczegółowość opisu i jego zakres zależą od prowadzonych badań i od wymagań grantodawcy, jednak zastanowienie się nad odpowiedziami na te pytania, ułatwi szybsze przygotowanie planu zarządzania danymi badawczymi.

(Na podstawie DCC -DMP checklist).

Dane podstawowe, opis projektu Informacje podstawowe opisujące plan:

  • Tytuł projektu
  • Nazwisko i imię kierownika projektu / autora planu
  • Dane kontaktowe
  • Numer projektu / grantu / ID
  • Podsumowanie projektu opisujące cel zbierania danych
  • Opis instytucjonalnej polityki zarządzania danymi badawczymi
Gromadzenie danych Do rozważenia:

  • Jakie dane będą zbierane podczas badań?
  • Jak będą gromadzone?
  • Czy istnieją już dane, które można ponownie wykorzystać?
  • Jakich standardów lub metodologii trzeba użyć, aby wytworzyć dane?
  • Czy wybrane formaty i oprogramowania umożliwiają udostępnianie i długotrwałe przechowywanie danych?
  • Strukturyzacja oraz nazewnictwo folderów i plików, w których przechowywane będą dane.
  • Jakie procesy będą zastosowane, aby zapewnić odpowiednią jakość danych?
Dokumentacja
i metadane
Do rozważenia:

  • Jakie informacje są niezbędne, aby dane mogły być odczytane i zinterpretowane w przyszłości?
  • Ile czasu i wysiłku będzie potrzeba na stworzenie dokumentacji pomocniczej, czy jest odpowiedni ich zasób (czasu i wysiłku).
  • Jaka dokumentacja i metadane będą opisywać dane?
  • W jaki sposób powstanie ta dokumentacja i metadane?
  • Które standardy metadanych będą użyte i dlaczego te?
Zagadnienia etyczne i prawne Należy rozważyć wszystkie zagadnienia prawne i etyczne wiążące się z pozyskiwaniem danych w projekcie.
Ważne są zwłaszcza ograniczenia udostępniania danych:

  • Czy są wymagane zgody na udostępnianie i przechowywanie danych?
  • Jak będzie chroniona tożsamość uczestników badań? (np. czy będzie zastosowana anonimizacja?)
  • Czy udostępnianie danych zostanie obłożone embargiem lub ograniczone (np. z powodu publikacji lub ubiegania się o patent)?
  • Jaka będzie zastosowana licencja na wykorzystywanie danych?
Przechowywanie danych
i tworzenie kopii zapasowych
Do rozważenia:

  • Gdzie będą przechowywane dane, jaki ma to wpływ na tworzenie kopii zapasowych, dostęp do danych i ich bezpieczeństwo?
  • Czy jest miejsce na przechowywanie danych, czy potrzebne są fundusze na pokrycie kosztów przechowywania danych?
  • Kto będzie odpowiedzialny za tworzenie backupów i odzyskiwanie danych?
  • Jakie są zagrożenia dla bezpieczeństwa danych i jak nimi zarządzać?
  • W jaki sposób będzie zapewniony bezpieczny dostęp do danych dla wszystkich współpracowników?
Selekcja danych i ich ochrona Należy określić, które dane będą długotrwale przechowywane i chronione.

  • Należy wybrać najlepszy sposób przechowywania danych (wybór repozytorium).
  • Które dane należy zachować, a które zniszczyć z powodów wynikających z umów i regulacji prawnych?
  • Jakie jest możliwe do przewidzenia inne zastosowanie badawcze dla zgromadzonych danych?
  • Które dane powinny zostać zachowane i potencjalnie udostępnione?
  • Jaki jest plan długoterminowego przechowywania bazy danych?
  • Jaki jest koszt przygotowania, przechowywania i udostępniania danych?
Udostępnianie danych Które dane będą udostępniane i w jaki sposób? Wybór metody zależy od wielu czynników, takich jak: typ, rozmiar, złożoność i wrażliwość danych.
Do rozważenia:

  • W jaki sposób będą cytowane dane?
  • Z kim będą współdzielone dane i na jakich warunkach?
  • Kiedy będzie otwarty dostęp do danych?
  • Czy wymagane są jakieś ograniczenia dotyczące udostępniania danych?
  • Jakie działania będą podejmowane, aby pokonać lub zminimalizować ograniczenia w dostępie?
  • Jak potencjalni użytkownicy dowiedzą się o danych?
Obowiązki
i zasoby danych
Należy przypisać role i obowiązki dla wszystkich działań związanych z zarządzaniem danymi.
Do rozważenia, co jest potrzebne, aby zrealizować plan zarządzania danymi. Koszty zazwyczaj można wpisać do wniosku grantowego, ale muszą być jasno określone i uzasadnione.

  • Kto jest odpowiedzialny za zrealizowanie Planu ZDB, oraz za jego sprawdzenie i poprawienie?
  • Jak zostaną rozdzielone obowiązki między partnerami w projekcie badawczym?
  • Jakie zasoby są potrzebne, aby zrealizować plan?
  • Czy wymagana jest dodatkowa wiedza specjalistyczna lub sprzęt?

Narzędzia wspomagające DMP

DMPtool (US) – narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców.

DMPonline (UK) – narzędzie bardzo podobne do DMPtool zawierające jednak bazę instytucji finansującej naukę z Wielkiej Brytanii.

DCC Data Management Plan Content Checklist – lista kontrolna zawartości planu zarządzania danymi, pozwala szybko określić, jakich informacji może brakować w przygotowywanym DMP.

The Data Curation Center – serwis brytyjskiej instytucji specjalizującej się w zarządzaniu danymi badawczymi. Udostępnia między innymi: gotowe plany zarządzania danymi, przewodniki, wytyczne, informacje na temat metadanych.

Licencjonowanie danych

Dane badawcze, podobnie jak inne aspekty działalności naukowej, podlegają przepisom prawa. Niektóre dane gromadzone w ramach projektu badawczego podlegają przepisom prawa własności intelektualnej. Dane medyczne podlegają natomiast przepisom prawa do prywatności i przepisom prawa o tajemnicy lekarskiej.

Przygotowując plan danych badawczych należy nie tylko umieścić informację o przepisach prawa, którym podlegają dane, ale również uwzględnić zasady, na jakich będzie można z nich korzystać. Dozwolone jest stworzenie własnych „zasad” korzystania z danych. Ale łatwiej jest skorzystać z opracowanych już licencji.

Otwarte licencje 

Przykłady planów zarządzania danymi

Przykładowy “Plan zarządzania danymi medycznymi” – model do grantów zagranicznych (2019)

Plan Zarządzania Danymi, Małgorzata Jefimow, Uniwersytet Mikołaja Kopernika w Toruniu (biologia)

Plan Zarządzania Danymi, Justyna Boniecka, Uniwersytet Mikołaja Kopernika w Toruniu (biologia)

Plan Zarządzania Danymi, Daniel Gackowski, Uniwersytet Mikołaja Kopernika w Toruniu (medycyna)

Plan Zarządzania Danymi, Katarzyna Skorupska, Uniwersytet Mikołaja Kopernika w Toruniu (chemia)

Zasada FAIR

Zasady FAIR to wytyczne dla właściwej pracy z danymi. Dane muszą być dostępne dla użytkowników i dla oprogramowania komputerowego przeszukującego bazy danych bez udziału człowieka.

F – Findable, możliwe do odnalezienia

  • Dataset (zbiór danych) jest opisany metadanymi, które umożliwiają odnalezienie zbioru przez maszyny i ludzi. Wskazane jest korzystanie ze standardowych schematów stosowanych w wybranej dziedzinie. W przypadku ich braku, wskazane jest stosowanie schematów ogólnych.
  • Do zbioru przypisany jest unikalny identyfikator (np. DOI, digital object Identifier lub Handle – spotykany w repozytoriach publikacji), który pozwala dotrzeć do niego nawet, gdy zmieni się internetowy adres tego zbioru; ten identyfikator jest jednocześnie elementem metadanych.
  • Metadane są indeksowane w ogólnodostępnych bazach danych umożliwiających ich przeszukiwanie.
  • Opis danych – zasadne jest stosowanie przyjętych w danej dziedzinie konwencji nazewniczych, a także dziedzinowych słowników; praktykowana jest dbałość o słowa kluczowe.
  • Dane w zbiorze mogą przyrastać. Należy zadbać o jasny sposób identyfikacji wersji. Nie należy usuwać poprzednich wersji danych ze względu na ich ewentualne wcześniejsze cytowania.
  • Dane powinny być odnajdywalne w wyszukiwarkach danych badawczych (np. Google Dataset Search).

Accessible – dostępne

  • Jeśli dostęp do danych musi być ograniczony, należy to zaznaczyć w opisie zbioru. Przeszkodą mogą być przepisy prawa, zobowiązania wynikające z umów albo sposoby wykorzystania danych w trakcie projektu i po jego zakończeniu.
  • Minimum: dostęp do metadanych jest możliwy przez DOI. Maximum: dostęp do datasetu odbywa się poprzez metadane i DOI bez dodatkowych narzędzi czy oprogramowania.
  • Metadane są zawsze dostępne, nawet jeśli zbiór danych został już usunięty lub przeniesiony.
  • Ważne jest miejsce udostępnienia. Zalecane są repozytoria danych badawczych pozwalające udostępniać dane w sposób otwarty.  Registry of Research data Repositories – witryna zawiera spis serwisów, które pozwalają przechowywać dane badawcze. Należy sprawdzić jakie są wymagania prawne i techniczne repozytoriów (formaty plików, ich maksymalna wielkość), aby dane faktycznie mogły zostać umieszczone w repozytorium wskazanym w Planie. Np. max wielkość danych akceptowanych przez Zenodo wynosi 50GB.
  • Dokumentacja oprogramowania potrzebnego do skorzystania z udostępnianego zbioru powinna być również dostępna. Łatwiej jest, jeśli wykorzystano do niej wolne i otwarte oprogramowanie.

Interoperable – interoperacyjne, powiązane z innymi danymi

  • Interoperacyjność danych oznacza możliwość ich wymiany i wykorzystania przez inne maszyny / osoby. Dane i metadane powinny być w formacie zapewniającym łatwy odczyt i przetwarzanie.
  • Dane zawierają odnośniki do innych powiązanych z nimi zbiorów. Dane nieinteroperacyjne wymagają stosowania translatora, mapowania, konwersji formatów.
  • Aby zapewnić pełną dostępność danych i metadanych dla maszyn, dla zbiorów danych należy stosować API, a dla metadanych protokół OAI-PMH.

Reusable – możliwe do ponownego użycia

  • Rozbudowane metadane dokładnie opisują zbiór danych i ułatwiają użytkownikom określenie ich przydatności do własnych badań.

Otwarte dane badawcze

Dane, do których każdy ma prawo dostępu. Można je wykorzystywać, przetwarzać, powielać i rozpowszechniać w sposób nieodpłatny. Publikacja naukowa jest rzeczywiście otwarta, jeśli towarzyszące jej dane badawcze (surowe lub/i oczyszczone), są także dostępne bez ograniczeń.

Otwieranie danych badawczych to jedna z praktyk otwartej nauki. Udostępnianie danych przyspiesza dokonanie kolejnych odkryć naukowych i wpływa na rozwój gospodarczy. Dostęp do wyników badań to kluczowa kwestia dla jakości i przejrzystości procesu badawczego. Dane uzyskane w badaniach finansowanych ze środków publicznych muszą być powszechnie dostępne. Nazywa się je nową walutą naukową (Paul Ayris).

Po co udostępniać dane?

  • Otwarte dane można wykorzystywać do prowadzenia nowych badań, a także łączyć je ze sobą, tworząc nowe zestawienia.
  • Udostępnienie danych umożliwia ich ponowną analizę i zachęca do nowych interpretacji.
  • Udostępnienie danych ułatwia sprawdzenie, czy opublikowane już prace naukowe opierają się na rzetelnych wynikach.
  • Udostępnianie danych badawczych ułatwia popularyzację wyników badań naukowych, a tym samym sprzyja promocji samych badaczy.

Jak znaleźć dane badawcze?

  • Należy zidentyfikować odpowiednie repozytorium, archiwum danych badawczych i w nim poszukać.
  • Należy poszukać kolekcji danych badawczych w naukowych portalach społecznościowych.
  • Można przejrzeć data journals, czyli czasopisma publikujące zestawy danych badawczych.
  • Można skorzystać ze specjalistycznych baz danych.

Repozytoria danych badawczych

Ogólne

e-Science – platforma dla repozytorium danych badawczych i innych usług wspomagających badania, takich jak np. e-laboratorium czy e-notatnik badawczy. Stworzona dla wszystkich przez Politechnikę Wrocławską.

Figshare – repozytorium otwartego dostępu, w którym naukowcy mogą zachować i dzielić się wynikami badań, w tym danymi, zestawami danych, obrazami i filmami.

Joint Research Centre Data Catalogue – Joint Research Centre (Wspólne Centrum Badawcze) to wewnętrzny dział naukowy Komisji Europejskiej, której celem jest zapewnienie wsparcia naukowego i technicznego dla koncepcji, rozwoju, wdrażania i monitorowania polityki Unii Europejskiej.

Mendeley Data – otwarte repozytorium danych badawczych, w którym naukowcy mogą przechowywać i udostępniać swoje dane badawcze.

Portal Otwartych Danych Unii Europejskiej – uniwersalny punkt dostępu do danych publikowanych przez instytucje, agencje i inne organy Unii Europejskiej. Portal jest głównym elementem unijnej strategii otwartych danych.

RepOD – wielodziedzinowe ogólnopolskie repozytorium danych badawczych prowadzone przez ICM UW.

Zenodo – międzynarodowe repozytorium danych badawczych przeznaczone dla tzw. małych danych.

Re3data  – międzynarodowa baza indeksująca repozytoria danych badawczych dotyczących wszystkich dziedzin wiedzy prowadzona przez German Research Fundation.

Repozytoria danych badawczych NIH – baza specjalistycznych repozytoriów danych badawczych, spośród których wiele udostępnia tzw. duże dane zebrane w ramach konkretnych projektów.

Dziedzina nauk humanistycznych

Archaeology Data Service (ADS) – to oficjalnie uznawane cyfrowe repozytorium danych o dziedzictwie, które wspiera badania, uczenie się i nauczanie dzięki łatwo dostępnym, wysokiej jakości i niezawodnym zasobom cyfrowym. ADS promuje również dobre praktyki w zakresie korzystania z danych cyfrowych, udziela porad technicznych społeczności zajmującej się dziedzictwem i wspiera wdrażanie technologii cyfrowych.

LARIN-ERIC – CLARIN (Common Language Resources & Technology Infrastructure) – to ogólnoeuropejska infrastruktura naukowa. W jej ramach udostępniane są narzędzia badawcze, dzięki którym możliwa jest praca z bardzo dużymi zbiorami tekstów. CLARIN zapewnia szereg usług, takich jak dostęp do danych językowych i narzędzi do analizy danych, a także oferuje możliwość deponowania danych badawczych.

Clarin-PL – ogólnopolskie repozytorium lingwistyczne będące częścią infrastruktury CLARIN. Konsorcjum CLARIN-PL tworzą polskie uniwersytety i instytuty badawcze, w których powstają repozytoria tekstów pisanych i mówionych w języku polskim oraz tekstów równoległych w innych językach.

DARIAH – cyfrowe, długoterminowe archiwum danych z zakresu nauk humanistycznych, społecznych, kulturowych i sztuki. Każdy obiekt opisany i przechowywany w repozytorium DARIAH ma unikalny i trwały identyfikator (DOI). Repozytorium DARIAH-DE jest przeznaczone nie tylko dla projektów badawczych związanych z DARIAH-DE, ale także dla indywidualnych badaczy oraz projektów badawczych, które chcą trwale zachować swoje dane badawcze i udostępnić je stronom trzecim. Głównym celem jest prosty i zorientowany na użytkownika dostęp do długoterminowego przechowywania danych badawczych. Obecnie konsorcjum DARIAH obejmuje 19 członków z całej Europy w, tym z Polski.

Data and Service Center for the Humanities(DaSCH) – instytucja Szwajcarskiej Akademii Humanistyczno-Społecznej (SAHSS) finansowana przez Państwowy Sekretariat ds. Edukacji, Badań Naukowych i Innowacji (SERI). Podstawowymi celami DaSCH są: ochrona danych badawczych w naukach humanistycznych i ich długoterminowa selekcja, zapewnienie stałego dostępu do danych badawczych w celu udostępnienia ich do dalszych badań, świadczenie usług dla naukowców, aby pomóc im w planie zarządzania danymi.

Narodowy Korpus Języka Polskiego  – wspólną inicjatywa Instytutu Podstaw Informatyki PAN, Instytutu Języka Polskiego PAN, Wydawnictwa Naukowego PWN oraz Zakładu Językoznawstwa Komputerowego i Korpusowego Uniwersytetu Łódzkiego, zrealizowana jako projekt badawczy rozwojowy Ministerstwa Nauki i Szkolnictwa Wyższego. Zawiera korpus referencyjny polszczyzny wielkości ponad półtora miliarda słów. Wyszukiwarki korpusowe pozwalają przeszukiwać zasoby NKJP zaawansowanymi narzędziami uwzględniającymi odmianę polskich wyrazów, a nawet analizującymi budowę polskich zdań. Lista źródeł korpusu zawiera klasykę literatury polskiej, prasę codzienną i specjalistyczną, nagrania rozmów, teksty ulotne i internetowe.

Prometheus – cyfrowe archiwum obrazów dla sztuki i nauk o kulturze. Repozytorium umożliwia wygodne wyszukiwanie obrazów na wspólnym interfejsie użytkownika w różnych archiwach obrazów, zmiennych bazach danych z instytutów, ośrodków badawczych i muzeów.

The World Atlas of Language Structures – baza gromadzi dane z zakresu właściwości strukturalnych (fonologicznych, gramatycznych, leksykalnych) języków zebranych z materiałów opisowych (takich jak gramatyki referencyjne) przez zespół 55 autorów.

Dziedzina nauk inżynieryjno-technicznych

Azon (Atlas Zasobów Otwartych Nauki) – projekt Centrum Wiedzy i Nauki Technicznej (CWiNT) Politechniki Wrocławskiej gromadzi, przetwarza i udostępnia zasoby nauki i dane badawcze z zakresu nauk technicznych, inżynieryjnych, medycznych, farmaceutycznych, szpitalnictwa, lecznictwa uzdrowiskowego tego regionu.

Global Change Master Directory – zawiera ponad 35 tys. zestawów danych i opisów usług z zakresu nauk o Ziemi i o środowisku. Misją projektu jest pomoc naukowcom, decydentom politycznym i społeczeństwu w odkrywaniu i uzyskiwaniu dostępu do danych, powiązanych usług i informacji pomocniczych (w tym opisów instrumentów i platform) istotnych dla globalnych zmian i badań w dziedzinie nauk o Ziemi.

NASA Prognostics Data Repository – repozytorium danych prognostycznych wykorzystywanych przy opracowywaniu algorytmów prognostycznych oraz szeregów czasowych. Dane są przekazywane z uniwersytetów, agencji lub firm w ramach trwającego procesu.

IMPACT – repozytorium danych badawczych z zakresu cybernetyki i cyberbezpieczeństwa.

Dziedzina nauk medycznych i nauk o zdrowiu

Azon (Atlas Zasobów Otwartych Nauki) – projekt Centrum Wiedzy i Nauki Technicznej (CWiNT) Politechniki Wrocławskiej gromadzi, przetwarza i udostępnia zasoby nauki i dane badawcze z zakresu nauk technicznych, inżynieryjnych, medycznych, farmaceutycznych, szpitalnictwa, lecznictwa uzdrowiskowego tego regionu.

BRENDA – zbiór danych na temat enzymów dostępny dla społeczności naukowej na całym świecie. Enzymy są klasyfikowane zgodnie z wytycznymi Komitetu Nazewnictwa Międzynarodowej Unii Biochemii i Biologii Molekularnej. Baza zawiera około 5 tys. różnych enzymów i obejmuje informacje biochemiczne i molekularne dotyczące między innymi klasyfikacji, nazewnictwa, reakcji, swoistości, parametrów funkcjonalnych, występowania, struktury enzymu.

WHO – zestawy danych w oparciu o globalne priorytety zdrowotne. Organizacja zapewnia łatwe wyszukiwanie i zapewnia wgląd w tematy wraz ze zbiorami danych.

Dziedzina nauk rolniczych

Copernicus – europejski system monitorowania Ziemi. Copernicus składa się ze złożonego zestawu systemów, które zbierają dane z wielu źródeł: satelitów obserwacji Ziemi i czujników in situ, takich jak stacje naziemne, czujniki powietrzne i morskie. Usługi obejmują sześć obszarów tematycznych: monitoring lądowy, monitoring morski, monitoring atmosfery, zmiany klimatu, zarządzanie kryzysowe i bezpieczeństwo.

Data INRAE – repozytorium udostępnia dane badawcze dotyczące żywności, żywienia, rolnictwa i środowiska. Obejmuje dane eksperymentalne, symulacyjne i obserwacyjne, dane omiczne, ankiety i dane tekstowe. W repozytorium są przechowywane tylko dane wytworzone przez INRAE lub we współpracy z nim, ale każdy może uzyskać dostęp do metadanych i otwartych danych.

ForestPlots.net – repozytorium danych dla wykazów działek leśnych w Ameryce Południowej, Afryce i Azji. Baza danych zawiera informacje geograficzne dotyczące działki, położenie, informacje taksonomiczne i pomiary średnicy drzew na każdej działce.

Global Change Master Directory – zawiera ponad 35 tys. zestawów danych i opisów usług z zakresu nauk o Ziemi i o środowisku. Misją projektu jest pomoc naukowcom, decydentom politycznym i społeczeństwu w odkrywaniu i uzyskiwaniu dostępu do danych, powiązanych usług i informacji pomocniczych (w tym opisów instrumentów i platform) istotnych dla globalnych zmian i badań w dziedzinie nauk o Ziemi.

Dziedzina nauk społecznych

Archiwum Danych Społecznych – stworzony dla nauk społecznych przez UW oraz PAN.

DARIAH – cyfrowe, długoterminowe archiwum danych z zakresu nauk humanistycznych, społecznych, kulturowych i sztuki.

Dziedzina nauk ścisłych i przyrodniczych

Azon (Atlas Zasobów Otwartych Nauki) – projekt Centrum Wiedzy i Nauki Technicznej (CWiNT) Politechniki Wrocławskiej gromadzi, przetwarza i udostępnia zasoby nauki i dane badawcze z zakresu nauk technicznych, inżynieryjnych, medycznych, farmaceutycznych, szpitalnictwa, lecznictwa uzdrowiskowego tego regionu.

Copernicus – europejski system monitorowania Ziemi. Copernicus składa się ze złożonego zestawu systemów, które zbierają dane z wielu źródeł: satelitów obserwacji Ziemi i czujników in situ, takich jak stacje naziemne, czujniki powietrzne i morskie. Usługi obejmują sześć obszarów tematycznych: monitoring lądowy, monitoring morski, monitoring atmosfery, zmiany klimatu, zarządzanie kryzysowe i bezpieczeństwo.

Global Change Master Directory  – zawiera ponad 35 tys. zestawów danych i opisów usług z zakresu nauk o Ziemi i o środowisku. Misją projektu jest pomoc naukowcom, decydentom politycznym i społeczeństwu w odkrywaniu i uzyskiwaniu dostępu do danych, powiązanych usług i informacji pomocniczych (w tym opisów instrumentów i platform) istotnych dla globalnych zmian i badań w dziedzinie nauk o Ziemi.

IMPACT – repozytorium danych badawczych z zakresu cybernetyki i cyberbezpieczeństwa.

NASA Prognostics Data Repository – repozytorium danych prognostycznych wykorzystywanych przy opracowywaniu algorytmów prognostycznych oraz szeregów czasowych. Dane są przekazywane z uniwersytetów, agencji lub firm w ramach trwającego procesu.

World Data Centre for Space Weather – repozytorium archiwizuje i udostępnia dane zebrane z programów obserwacyjnych Międzynarodowego Roku Geofizycznego 1957–1958 prowadzonych przez Międzynarodową Radę Nauki.

Repozytoria rekomendowane przez czasopismo NATURE

Dziedzina nauk teologicznych

Edition Topoi Collections – repozytorium starożytnych cywilizacji, kultur i religii. Udostępnia dane badawcze, takie jak modele 3D, zdjęcia w wysokiej rozdzielczości, dane i bazy danych. Treść i jej metadane podlegają wzajemnej weryfikacji i są udostępniane na zasadzie otwartego dostępu.

Database of Religious History – gromadzi dane z zakresu historii religii.

DARIAH – cyfrowe, długoterminowe archiwum danych z zakresu nauk humanistycznych, społecznych, kulturowych i sztuki.

World Religion Database – cyfrowa baza danych źródeł prawnych, sądowych i normatywnych, określających status mniejszości religijnych od V do XV wieku.

Dziedzina sztuki

Prometheus – cyfrowe archiwum obrazów dla sztuki i nauk o kulturze. Repozytorium umożliwia wygodne wyszukiwanie obrazów na wspólnym interfejsie użytkownika w różnych archiwach obrazów, zmiennych bazach danych z instytutów, ośrodków badawczych i muzeów.

arthistoricum.net – kolekcja historii sztuki skoncentrowana na średniowiecznej i wczesnoeuropejskiej historii sztuki, w tym na sztuce inspirowanej Europą w USA, Kanadzie i Australii, kontynuowanej chronologicznie od epoki wczesnochrześcijańskiej do 1945 r.

DARIAH – cyfrowe, długoterminowe archiwum danych z zakresu nauk humanistycznych, społecznych, kulturowych i sztuki.

Linki

Akty urzędowe

Deklaracja sorbońska dotycząca praw do danych badawczych

Pismo Dyrektora NCN w sprawie zarządzania danymi naukowymi w projektach
Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym

H2020 Guidelines to the Rules on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020

Cost of not having FAIR research data

Artykuły, książki

The risks of not sharing data are greater than the costs, Paul Ayris

Otwarte dane badawcze w warsztacie pracy naukowca, Małgorzata Rożniakowska-Kłosińska

Selekcja i przygotowanie danych badawczych do udostępnienia

Jak korzystać z zasobów w repozytoriach danych

Szkolenia

Zarządzanie danymi badawczymi Platforma Otwartej Nauki, Marta Hoffman-Sommer

PORADNIK – Plan zarządzania danymi badawczymi, Poradnik Wydawnictwa KUL

Zarządzanie danymi badawczymi, Bożena Bednarek-Michalska

Data Management Plan (DMP) w bibliotece naukowej. Nowe zadania i narzędzia, Edyta Rogowska, Tomasz Nowocień

Warsztaty z zarządzania danymi badawczymi, Lublin, Natalia Gruenpeter

Otwarte dane badawcze w humanistyce, Natalia Gruenpeter, Michał Starczewski

Udostępnianie danych badawczych – zagadnienia prawne, Nikodem Rycko

Strony

Research Data Management Working Group, LIBER

Poradniki

Poradniki przygotowane przez Science Europe:

  1. Praktyczny przewodnik  dotyczący ujednoliconych europejskich praktyk dot. zarządzaniem danymi naukowymi,
  2. Wytyczne na temat zarządzania danymi badawczymi dla poszczególnych dyscyplin.

Skorzystaj także z naszego poradnika:

Dane badawcze

Ikony: Freepik (www.freepik.com) z www.flaticon.com, Retina Display Icons (www.iconfinder.com/iconsets/TWG_Retina_Icons) od The Working Group (blog.twg.ca).