Switch to standard view 
  Sybase logo
 
 
 



Customer Success Story

AOK Hessen setzt erstes analytisches Data Warehouse ein

Das Unternehmen
Mit rund 1,6 Millionen Versicherten ist die AOK Hessen die größte gesetzliche Krankenversicherung (GKV) in diesem Bundesland. Sie hat das Geschäftsjahr 2006 mit einem Überschuss von 92,9 Millionen Euro abgeschlossen. Darin sieht sie ein Ergebnis ihrer konsequenten Anstrengungen im Mitglieder- und Leistungsmanagement.

Übersicht
Die AOK Hessen baut ein analytisches Data Warehouse auf, in dem sie all ihre (pseudonymisierten) Leistungsdaten nach ausgefeilten statistischen und KI-Methoden analysieren kann. Die Nutzer können die extrem großen Datenmengen flexibel auswerten, um die Kundenstruktur besser zu verstehen, gezielt neue Leistungsangebote vorzubereiten und die Abrechnungen genauer zu überwachen.

Herausforderung
Die Fachbereiche selbst sollten den gesamten Echtdatenbestand flexibel auswerten, ohne die IT-Abteilung zu bemühen. Die klassische OLTP-Datenbank im Data Warehouse konnte die Datenmengen nicht bewältigen und nicht in vertretbarer Zeit Ergebnisse liefern.

Lösung
Das Data-Mining-Werkzeug RayQ und die analytische Datenbank Sybase IQ werden integriert. So entsteht das erste analytische Data Warehouse am Markt, mit dem Endbenutzer direkt KI-Auswertungen vornehmen können.

Ergebnisse
Gemeinsame Speicherung und Analyse aller Leistungsdaten
Flexible Auswertungen
Schnelle Ergebnisse
Fachbereiche können Abfragen selbst vornehmen und verfeinern
   
Warum Verbund aus RayQ und Sybase IQ?
Leistungsfähiges BI-Tool für intuitive Auswertungen
Für Analysen optimierte Datenbank mit hoher Datenkomprimierung und Performance

Sybase IQ
Die analytische Datenbank organisiert die Daten nicht in Zeilen, sondern in Spalten. Jedes Feld kann direkt als Abfrageschlüssel dienen; deshalb müssen keine traditionellen Indizes definiert werden. Bei Abfragen wird nicht die gesamte Zeile, sondern nur noch der ausgewählte Wert in der entsprechenden Spalte gelesen. So werden die zu verarbeitenden Datenmengen minimiert. Die Zahl der I/O-Operationen wird bis zu 90 Prozent reduziert, die Abfragegeschwindigkeit um das Zehn- bis Hundertfache gesteigert und die Datenmenge auf ein Fünftel bis ein Neuntel komprimiert.

Mustererkennung in 800 Millionen Datensätzen
Neue Produkte und Vertragskonzeptionen, maßgeschneiderte Präventions- und Behandlungsstrategien für bestimmte Patientengruppen - die gesetzlichen Krankenkassen müssen angesichts des Umbruchs im Gesundheitssektor ihr Leistungsangebot ständig anpassen und immer schneller auf neue Anforderungen reagieren. Hinzu kommen neue gesetzliche Vorgaben; so müssen sie etwa aktiv bei der Prüfung vertragsärztlicher Abrechnungen mitarbeiten, um die Kostenexplosion einzudämmen. Um diese Herausforderungen zu bewältigen, schafft die AOK Hessen die technischen Grundlagen für eine tiefe, detaillierte und flexible Analyse ihrer enormen Datenbestände. Dazu musste sie wiederum schwierige technische Herausforderungen lösen.

Wie sieht der typische Verlauf bestimmter Krankheiten aus? Welche Behandlungsmethoden sind besonders erfolgreich, zum Beispiel weil sie die stationäre Einweisung eines Patienten vermeiden? Gibt es bei den Abrechnungen Auffälligkeiten, etwa im Verhältnis von Diagnose und Verschreibungen? Auf solche Fragen kann eine Krankenkasse aus der Fülle ihrer Daten über die Behandlungen ihrer Patienten sowie den Abrechungen von Ärzten, Krankenhäusern, Apotheken und anderen Vertragspartnern aufschlussreiche Antworten finden.
Die AOK Hessen entschloss sich deshalb, ein zentrales Data Warehouse aufzubauen, in das die Daten mit Hilfe eines ETL-Prozesses aus den verschiedenen operativen Systemen geladen werden.

Die Bündelung der Daten war jedoch nur ein erster Schritt. Die AOK benötigte auch ein leistungsfähiges Werkzeug, das beliebige Korrelationen herstellen kann, das beispielsweise gezielte, hypothesengeleitete Auswertungen ebenso zulässt wie ungerichtete Datenanalysen ohne konkrete Vermutung, um verborgene Abhängigkeiten und Muster aufzuspüren. Sie fand es in dem Data-Mining-Werkzeug RayQ der Qyte GmbH.

Um tatsächlich interessante Erkenntnisse zu gewinnen, müssen allerdings alle vorhandenen Informationen gemeinsam betrachtet werden. Das bedeutet: Daten über Arzneimittel und ambulante Leistungen müssen mit anderen Leistungsdaten (wie Krankenhausaufenthalten) in einer einzigen Analyse verglichen werden. Damit fallen extrem große Datenmengen an.

Wie hoch die Anforderungen sind, wird nicht zuletzt bei der AOK-weiten Einführung der neuen IT-Lösung oscare deutlich, die sämtliche Geschäftsprozesse einer Gesetzlichen Krankenversicherung abbildet. Die von der AOK
Systems entwickelte Software basiert auf den Plattform-Komponenten der mySAP Business Suite und der SAP-Lösung für die Versicherungsbranche. „Das SAP BW (Business Warehouse) verwendet bei der Auswertung nur aggregierte Daten", berichtet Michael Schimmelpfennig, Service Manager in der Abteilung IT-Business bei der AOK Hessen. „Wir hingegen müssen die ungleich größere Menge der Quelldaten heranziehen, die wir beliebig mischen. Nur so können wir ohne Einschränkungen recherchieren, um Antworten auf alle Fragen zu finden, die uns interessieren."

Das Data Warehouse der AOK Hessen enthält mittlerweile rund 80 Tabellen mit mehr als 800 Millionen Sätzen (Schlüsseldaten und Inhalte). „Einige Tabellen umfassen 400 Millionen Sätze über 10 bis 15 Spalten", unterstreicht Schimmelpfennig. „Dabei kommen wir ohne weiteres auf Tabellengrößen von 200 GB. Diese Mengen konnte die klassische transaktionsorientierte Datenbank, die wir zunächst im Data Warehouse einsetzten, nicht verarbeiten."

Die Folge beschreibt Andreas Seibert, Leiter der Abteilung IT-Business so: „Unsere Fachbereiche mussten für jede Auswertung der IT-Abteilung einen formalen Auftrag erteilen, die dann irgendwann die Reports lieferte. Und oft benötigte die operative OLTP-Datenbank extrem lange Laufzeiten, bis Ergebnisse vorlagen. Wir wollten jedoch den fachlichen Nutzern die Möglichkeit geben, ihre Analysen selbst vornehmen und beliebig zu variieren. Dazu brauchten wir ein IT-System, das leicht verständlich, flexibel und vor allem sehr schnell ist."


RayQ und Sybase IQ werden schrittweise integriert
Die Lösung, die sowohl Flexibilität bei der Auswertung als auch Effizienz bei der Verarbeitung extrem großer Datenmengen brachte, fand die AOK in der Kombination von RayQ mit der analytischen Datenbank Sybase IQ als Speichermedium für das Data Warehouse. Als Hardware dient ein Server 8 Core mit 16 GB RAM.

Mit RayQ können die Nutzer vielfältige mathematisch-statistische Auswertungen vornehmen. Darüber hinaus können sie die Daten mit Hilfe neuronaler Algorithmen auf mehrdimensionale Zusammenhänge untersuchen, um verborgene Abhängigkeiten zu erkennen. Sie benötigen dazu keine SQL-Kenntnisse, sondern arbeiten intuitiv an einer grafischen Oberfläche, auf die sie die gewünschten Analysefunktionen per Drag&Drop aus verschiedenen Modulen herausziehen. So können sie ihre Auswertungen selbst frei designen.

Entscheidend: Diese Abfragen schicken sie dann direkt auf den Echtdaten-Bestand ab. Die Ergebnisse werden in zwei- und dreidimensionaler Darstellung ausgegeben und abgespeichert - wodurch sich das Datenvolumen nochmals deutlich erhöht.

Mit Sybase IQ ist es nun erstmals möglich, alle Abrechnungsdaten gemeinsam zu speichern und auszuwerten. „Schon das Laden der Daten ist um 20 Prozent schneller", so Schimmelpfennig. „Durch die Kompression wird der belegte Speicherplatz um 70 Prozent reduziert. Im Gegensatz zur OLTP-Datenbank haben wir nun keine Probleme mehr mit der Tabellengröße."

Unter Federführung der AOK wird die Integration von RayQ und Sybase IQ in einem mehrstufigen Prozess weiterentwickelt. Die Daten werden künftig nicht mehr in den Cash des Werkzeugs kopiert, sondern die Rechenoperationen werden direkt in Sybase IQ ausgeführt. Dort werden auch die Ergebnisse abgespeichert, so dass auch sie komprimiert und mit der gleichen hohen Performance wieder abgerufen und weiterverarbeitet werden können. 

„Damit wird RayQ die Leistungsfähigkeit von Sybase IQ voll nutzen und die komprimierten Daten unmittelbar auswerten", betont Jürgen Hirsch, Geschäftsführer der Qyte GmbH. „Erstmals gibt es am Markt nun ein analytisches Data Warehouse, mit dem eine große Zahl von Endbenutzern direkt arbeiten kann. Sie benötigenkeine Datenauszüge, Reports oder Aggregationen mehr, sondern können auf extrem großen Datenbeständen bei hoher Performance in Echtzeit statistische Auswertungen, Data Mining zur Mustererkennung und andere BI-Analysen vornehmen."


AOK-Fachbereiche erhalten neue Analyse-Optionen

Die Datenmengen, die den Analysen zugrunde liegen, verlangen von der Datenbank höchste Leistungsfähigkeit. Sie umfasst mehr als 100 Tabellen. Davon enthalten allein zwei jeweils 18 Milliarden Datensätze, Dank der vollständigen Datenbasis, der Flexibilität und der hohen Performance ihres Data Warehouses kann die AOK Hessen nunmehr ganz neue Arten von Analysen durchführen. Rund 60 Anwender aus den Fachbereichen greifen bisher darauf zu. Sie designen ihre Auswertungen selbst, und da sie auf dem Echtdaten-Bestand arbeiten, sehen sie sehr schnell die Ergebnisse. Abhängig davon können sie dann die Eingaben variieren und die Recherche beliebig verfeinern oder modifizieren. „Einzelne Auswertungen verarbeiten Datenmengen von 10 bis 20 GB - mit Antwortzeiten unter einer halben Minute", würdigt Schimmelpfennig die bisher erreichte Leistungsfähigkeit. „Nach der vollständigen Integration von RayQ und Sybase IQ werden wir nochmals neue Dimensionen erreichen."

Mit den neuen Analyse-Optionen kann die AOK zum einen ihre Kundenstruktur besser verstehen und maßgeschneiderte Angebote für bestimmte Gruppen von Mitgliedern entwickeln. Das betrifft alle Bereiche - ambulante, stationäre und integrierte Versorgung (Arztnetze, Hausarztmodell etc.), Pflege und Prävention. Durch Untersuchung der Leistungsdaten können die Fachbereiche zum Beispiel Risikogruppen für bestimmte Krankheiten identifizieren und erkennen, welche Behandlungsmethoden dort besonders erfolgreich sind.
Daraus können sie maßgeschneiderte Produkte entwickeln - individuelle Verträge, Kostenübernahmemodelle, Schulungen oder spezielle Angebote zu Prävention und Gesundheitsförderung. Sie können simulieren, ob ein bestimmtes Vertragskonzept Nutzen bringt. Damit können sie geplante Vertragsstrategien oder konkrete Leistungsangebote besser vorbereiten und später durch Soll-Ist-Vergleiche nachvollziehen, ob sie sich so entwickelt haben wie ursprünglich angenommen.

Zum anderen unterstützen die Analysen die gesetzlich vorgeschriebene Kontrolle der Abrechnungen von Ärzten, Apothekern, Krankenhäusern, Heilberufen und anderen Leistungserbringern. Die zuständigen AOK-Fachbereiche können Gruppen ermitteln, die überproportional hohe Kosten verursachen, oder auffällige Muster erkennen - etwa indem sie die Plausibilität von Art und Umfang der abgerechneten Leistung in Bezug auf die abgegebene Diagnose prüfen. So kam die AOK Hessen in jüngster Zeit 179 Fällen falscher Abrechnung auf die Spur und konnte 2,2 Millionen Euro zurückfordern.

Natürlich muss die AOK bei allen Untersuchungen die Anforderungen des Datenschutzes berücksichtigen. Deshalb werden die Daten im Data Warehouse pseudonymisiert. Die Schlüssel, die die einzelnen Versicherten identifizieren, werden auf Datenbank-Ebene verfremdet, so dass die Personen hinter den Daten nicht mehr erkennbar sind. Werden auffällige Muster entdeckt, kann bei begründetem Verdacht allein die berechtigte Abteilung auf die Klardaten zugreifen.

Ein Effekt des RayQ/Sybase-IQ-Verbunds ist heute schon erkennbar. Schimmelpfennig: „Die Fachbereiche, die das Tool nutzen, führen deutlich mehr Analysen durch als früher - weil sie im praktischen Einsatz immer wieder ganz neue Möglichkeiten entdecken."
 

Klicken Sie hier, um den Anwenderbericht in PDF-Format downzuloaden.



Back to Top
© Copyright 2010, Sybase Inc.