Was ist eine Labordatenbank? Und wie wähle ich sie aus.

Der Begriff Labordatenbank ist eine einfache Beschreibung für ein Softwaresystem zur Bearbeitung und Speicherung der im Labor anfallenden Daten. Dabei ist der Begriff technisch nicht ganz treffend, denn eine Datenbank ist im eigentlichen Sinne nur für die effiziente Datenspeicherung zuständig. Die Bearbeitung ist nicht die Aufgabe der Datenbank. 

Datenbank oder Softwaresystem? 

Eine moderne Softwareanwendung wird heute in drei Schichten unterteilt: 

Labordatenbank Schichten

Mit dem Begriff Labordatenbank wird meist die Gesamtheit der drei Ebenen gemeint. Die reine Datenbank ist dabei in der Persistenz-Schicht zu finden. Diese Schicht kümmert sich um das optimierte und schnelle Laden und Speichern von Daten, sowie dem optimalen und strukturierten Ablegen auf dem Speichermedium. 
Die Schichten der Business Logik und der Präsentation werden typischerweise im LIMS System (s. Was ist ein LIMS?) umgesetzt. 

Kriterien für die Auswahl einer Labordatenbank

Das ein Laborsystem als Labordatenbank bezeichnet wird, zeigt die hohe Relevanz der Datenbank in der LaborsoftwareWelche Kriterien sind für die Auswahl einer Labordatenbank zu prüfen? Die Auswahl erfolgt natürlich immer zusammen mit der Auswahl des zugehörigen LIMS Systems, so dass eine Entscheidung für eine spezielle Labordatenbank-Technik sich immer auch auf die Auswahl des LIMS auswirkt. 

Für die Auswahl lohnt es folgende Kriterien zu bedenken: 

Skalierbarkeit

Eine Labordatenbank sollte von Anfang an so ausgelegt werden, dass eine Skalierung möglich ist. Skalierung bedeutet, dass über die vielen Jahre der Verwendung die Ansprüche wachsen und diese müssen von der Datenbank bedient werden. Es sind mit der Zeit immer mehr Daten zu erfassen. Alle diese Daten sollen schnell und effizient geladen werden, auch die zurückliegenden. Und das, ohne dass Auslagerungen oder Komprimierungen vorgenommen werden müssen, weil das den Arbeitsprozess im Labor nur unnötig verkompliziert. Mit der Zeit werden auch immer mehr Benutzer Zugriff bekommen und schnell viele Auswertungen durchführen wollen, um den Nutzen aus den Daten zu ziehen. Eine Labordatenbank muss es jederzeit ermöglichen durch Erhöhung von Leistungskapazität auf die steigenden Anforderungen zu reagieren. Deswegen ist die Skalierbarkeit von Anfang an ein wichtiges Kriterium, um auch nach vielen Jahren der Nutzung optimal mit der Labordatenbank zu arbeiten. 

Umfeld

Eine Labordatenbank muss nicht als Labor-interne Datenbank in Eigenverantwortung betrachtet werden. Es ist unbedingt notwendig, das Umfeld und die bestehenden Möglichkeiten abzuklären. Dazu gehören: die Netzwerkstruktur, die IT-Kapazitäten, die Infrastruktur. Kann zum Beispiel auf eine gute IT oder einen entsprechenden Dienstleister zurückgegriffen werden, lassen sich Standardaufgaben gut auslagern. So ermöglicht ein standardisiertes Sicherungsverfahren der Labordatenbank, dass die IT die Verantwortung für Backups übernimmt. Genauso sind kompatible Sicherheits- und Rechtefunktionen (z.B. Microsoft Active Directory) vorteilhaft, um die Absicherung gemeinsam mit der IT vorzunehmen. Ist die Labordatenbank sogar kompatibel mit anderen im Unternehmen genutzten Datenbanken (z.B. Microsoft SQL), kann die gesamte Administration der Datenbank in die Hände der IT übergeben werden. Daher ist es wichtig, das vorhandene Umfeld mit der Technik der Labordatenbank abzugleichen und so die bestmögliche Datenbank auszuwählen. 

Kompatibilität

Eine möglichst offene und standardisierte Labordatenbank ermöglicht eine einfache Anbindung von anderen Systemen. Über definierte Schnittstellen in der Datenbank (Views, Prozeduren) ist es dann möglich, dass andere Systeme Daten aus der Labordatenbank beziehen können und Daten auch als Eingabedaten an die Labordatenbank senden können. Durch diese Kompatibilität wird eine Automatisierung von Prozessen möglich, die die Realisierung eines Labor 4.0 (s. Was ist Labor 4.0) ermöglicht. 

Verschiedene Datenbank-Techniken

Für das Laden und Speichern von Daten haben sich über viele Jahre verschiedenen Techniken entwickelt, die ein immer effizienteren Umgang mit auch immer wachsenden Mengen an Daten erlauben. 

Dateien 

Die einfachste Form der Datenspeicherung sind einfache Daten-Dateien. Diese können menschenlesbar oder in binären Formaten sein. Sie zeichnen sich durch ein einfaches Handling aus, da sie ganz einfach in einem Verzeichnis auf dem Laborrechner bereitliegen und vom Laborsystem gelesen und geschrieben werden. Das Format der Dateien ist meist speziell von der nutzenden Anwendung vorgegeben und auf sie optimiert.
Ein Spezialfall bilden Exceldateien. Diese werden als Datenspeicher und zur Datenbearbeitung gleichzeitig verwendet. Dies bringt eine Menge Nachteile mit, die sie als Labordatenbank ungeeignet machen (s. Warum  Excel kein LIMS ersetzt.). 

Dateien als Labordatenbank sind nicht mehr Stand der Technik und bringen eine Vielzahl von Nachteilen mit sich. Ein zukunftsfähiges Laborsystem sollte nicht auf Datenbankdateien aufbauen. 

SQL Datenbanken / Relationale Datenbanken 

SQL Datenbanken bilden derzeit noch den Standard für die strukturierte Datenspeicherung. In SQL Datenbanken werden Daten nach festgelegten Schemas in Tabellen mit Zeilen und Spalten abgelegt. Tabellen haben untereinander Beziehungen, so dass Daten zueinander in Verbindung gebracht werden können (Probe=>Anlayse;  Produkt=>Prüfplan). Durch die lange Zeit der Entwicklung im Bereich der SQL Datenbanken, sind hochoptimierte Datenbankserver am Markt verfügbar, die große Mengen von Daten speichern und verwalten können (z.B. Microsoft SQL Server, Oracle, MySQL).
SQL Datenbanken sind durch ihre Verbreitung sehr kompatibel mit anderen Softwaresystemen. Eine Labordatenbank, die als SQL Datenbank umgesetzt ist, bietet gute Möglichkeiten zur Verknüpfung mit anderen Systemen. 

SQL Server erlauben eine hocheffiziente Datenspeicherung, die skalierbar und zukunftsfähig ist und durch ihre weite Verbreitung eine größtmögliche Kompatibilität erlauben. 

NoSQL 

Die neuste Entwicklung auf dem Gebiet der Datenbanken sind die NoSQL Datenbanken. Diese Datenbanken lösen sich von der Idee, Daten in festen Schemas abzulegen. Mit ihnen ist es möglich, Daten gewissermaßen unstrukturiert zu speichern. Es gibt bei den NoSQL Datenbanken verschiedenen Konzepte, die alle intern sehr unterschiedlich arbeiten und verschiedene Strategien bei der Speicherung verfolgen (Dokumentenbasiert, Graphenbasiert, Zeitreihenbasiert, …). 
Die aktuell verfügbaren NoSQL Datenbanken sind sehr leistungsfähig und schnell und sind auch sehr stark im Verarbeiten riesiger Datenmengen (BigData). Die NoSQL Datenbanken werden die SQL Datenbanken in vielen Bereichen ersetzen und somit einen großen Anteil gewinnen. Durch die neuen und unterschiedlichsten internen Strategien sind sie aber weitaus weniger kompatibel zu bestehenden Systemen und machen eine Integration so deutlich schwieriger. 

NoSQL Datenbanken sind die Zukunft im Bereich der leistungsfähigen, flexiblen Verarbeitung von großen Datenmengen. Als Labordatenbank liefern sie noch nicht das Maß an Kompatibilität mit den vorhandenen Strukturen, um das voll Potenzial von Prozess- und Systemintegrationen zu nutzen.

Fazit

Eine Labordatenbank speichert die Daten des Labors. Dies ist eine zentrale Aufgabe, denn die im Labor gewonnenen Daten bilden die Basis der Wertschöpfung des Labors. Und diese Daten verdienen es, in einer technologisch ausgereiften und leistungsfähigen Datenbank gespeichert zu werden. Die Datenbank arbeitet Hand in Hand mit dem LIMS, so dass eine Entscheidung für ein LIMS immer auch eine Entscheidung für eine zugehörige Datenbank bedingt.  

Die Labordatenbank bildet die Basis des LIMS Systems und entscheidet durch ihre Leistungsfähigkeit, Zuverlässigkeit und Kompatibilität über den langfristigen Erfolgs und die Zukunftsfähigkeit des Labors. 

Lesen Sie auch

WinLaisy - LIMS - Laborsoftware

Labor 4.0? Was steckt hinter dem neuen Schlagwort? Lesen Sie alles in unserem Blog-Beitrag über die Zukunft des Labors.

WinLaisy Dashboard Trend

Ein LIMS hilft Daten schnell und strukturiert zu erfassen, zu speichern und abzurufen. Mit den Dashboard Funktion in WinLaisy haben Sie das Wichtigste immer gleich im Blick.

EXCEL LIMS

Excel als LIMS? Labor 4.0 braucht das richtige Fundament. Lesen Sie, warum Excel im Labor ein LIMS nicht ersetzen kann.