Vier Schichten, drei orthogonale Achsen, 132 dokumentierte ADRs — transparent geprüfbar
OCO ist nicht ein Konzept-Papier, sondern eine implementierte, validierte und freigegebene Distribution. Jede architektonische Entscheidung ist als ADR mit Begründung dokumentiert. Jede Schicht ist intern konsistent (HermiT-validiert, 0 inkonsistente Klassen). Jede Lizenz-Zuordnung ist REUSE-3.3-konform pro Pfad spezifiziert. Jeder Bridge-Mapping ist gegen Upstream-Version SHA-gepinnt. Hier ist, was Sie als Architekt wirklich brauchen, um die Architektur zu beurteilen.
Was Sie davon haben
- Drei orthogonale Klassifikations-Achsen (Schicht · Audience · Mechanistik), jede mit eigener Logik und eigenem Versions-Lebenszyklus — ein Konsument wählt seine Tiefe auf jeder Achse separat.
- 132 dokumentierte Architektur-Entscheidungen, davon sieben besonders prägend (kuratiert auf der Paper-Detail-Seite), inklusive negativer ADRs für verworfene Modellierungs-Alternativen — Sie sehen nicht nur was, sondern auch was bewusst nicht.
- Vollständige Validierung publiziert: alle 9 Norouzi-Quality-Requirements erfüllt, OOPS!-Pitfall-Audit clean, 52/52 SPARQL-Tests PASS, 1 120 SHACL-NodeShapes, HermiT-validiert mit 0 inkonsistenten Klassen.
- Architektur-Eigenschaft Open/Closed-Mix: der modulare Schnitt der drei Achsen ermöglicht eine pro-Modul-Lizenz-Differenzierung (CC-BY für L0, CC-BY-SA für material-agnostisches L1, proprietär für Supplier/Material-Detail/Compliance/L2/L3) — strukturell, nicht als All-or-Nothing-Workaround.
Das Problem, das die Architektur löst — 94 Ontologien, die einander nicht kennen
In der Materials Science gibt es heute Dutzende Ontologien, gebaut von Forschungsprojekten, die voneinander nicht wissen. Jedes neue Vorhaben fängt bei Null an und modelliert dieselben Laborprozesse neu, die in einem Nachbarprojekt längst existieren.
Die deutsche Plattform MaterialDigital allein bündelt über ein Dutzend Projekte — KnowNow, SmaDi, KupferDigital, GlasDigital, StahlDigital, DiProMag, iBain, Mieller-Ferrit — und jedes startet mit einer eigenen material-spezifischen Ontologie. Spray-Trockner, XRD-Diffraktometer, Poling-Stationen: in jedem Projekt erneut modelliert, in jedem Projekt anders.
Dabei ist nur ein kleiner Bruchteil dieses Wissens wirklich material-spezifisch. Der grösste Teil — Workflow-Provenienz, Equipment-Klassifikation, Messmethoden, Identifier-Schemata — ist material-agnostisch und über alle Domänen hinweg wiederverwendbar. Diese Wiederholung ist nicht nur unwirtschaftlich; sie verhindert Vergleichbarkeit zwischen Projekten — den eigentlichen Zweck der digitalen Materialforschung. Die drei-Achsen-Architektur unten ist die direkte Antwort auf dieses Problem.
Die drei orthogonalen Achsen
Die zentrale architektonische Aussage des Papers: OCO klassifiziert nicht über eine Achse, sondern über drei unabhängige. Jedes Modul sitzt auf jeder Achse auf der Stufe, die zu seinem Inhalt passt. Konsumenten wählen Subsets pro Achse.
| Achse | Werte | Beantwortet | Modular gewählt von |
|---|---|---|---|
| 1 — Schicht der Abstraktion | L0 · L1 · L2 · L3 | Wie tief soll die Konsumption gehen? Reine Bridge-Anbindung oder mit Reasoning-Axiomen? | jedem Konsumenten, per Distribution-Bundle |
| 2 — Audience | Material · Compliance (+ dual) | Material-Forschung oder EU-Regulatorik? | jedem Konsumenten, per Audience-Marker |
| 3 — Mechanistische Erklärungs-Tiefe | 7 Schichten (Symmetrie → Bindung) | Welche kausale Begründungs-Kette soll abfragbar sein? | Material-Audience-Konsumenten optional |
Die Orthogonalität ist nicht Slogan, sondern strukturell durchgezogen: ein Modul wie oco-symmetry sitzt auf Achse 1 in L2, auf Achse 2 in Material-Audience, auf Achse 3 in Schicht 1 — und jede dieser drei Zuordnungen ist unabhängig versionierbar. Eine Polymer-L2 würde Achse 1 ersetzen, ohne Achse 2 und 3 zu berühren. Ein Compliance-Konsument lädt Achse 2 ohne die anderen.
Das ist die Antwort auf die drei gleichzeitigen Herausforderungen, die eine produktive Materials-Ontologie heute lösen muss: horizontale Fragmentierung der MSE-Landschaft, vertikale EU-Regulatorik-Konvergenz, mechanistische Erklärungs-Tiefe. Ein Architektur-Primitiv (modulares Layering auf einer orthogonalen Achse) löst alle drei, ohne sie aufeinander zu kollabieren.
Die vier Schichten (Achse 1)
| Schicht | Inhalt | Reasoner-Profil | Lizenz-Standard |
|---|---|---|---|
| L0 — Bridge | Reine Anker zu existierenden Standards (PMDco, QUDT, EMMO, CIF, PROV-O u.a.) | RDFS | CC-BY 4.0 |
| L1 — Material-agnostisches Skelett | Sample, Equipment, Measurement, Identifier, Provenance, Investigation, Process; Tensor-Wurzeln, Role-Individuals, Cross-Axiome | RDFS | CC-BY-SA 4.0 (außer supplier/material/compliance) |
| L2 — Material-/Methoden-spezifisch | Material-Klassen (230 Raumgruppen, 32 Coupled-Effects, Kröger-Vink, Newnham, Phasen), Compliance-Detail (CSRD/LCA/CSDDD/CBAM/AI Act/…) | OWL 2 EL | proprietär |
| L3 — Kategorisches Reasoning | 325 logische Axiome (Route-Templates, Lifecycle-Constraints, Symmetrie-Effekt-Kopplung); 5 920 reifizierte Neumann-Constraints | OWL 2 DL | proprietär |
Schicht-Separation ist konsequent: jede Schicht hat eine eindeutig abgegrenzte Verantwortlichkeit, abwärts-importierbar aber nicht aufwärts-koppelnd. L0 weiß nichts über L1; L1 weiß nichts über L2. Eine Materials-Ontologie für Polymere kann L0+L1 wiederverwenden und nur L2 ersetzen — ohne die agnostische Laborbuch-Schicht neu zu modellieren.
OCO in Zahlen
Konsistenz-Validierung: HermiT meldet 0 unsatisfiable Classes. Pellet-Validierung als Cross-Check zusätzlich.
Expressivität: die volle Distribution sitzt in OWL 2 DL mit 0 internen Profil-Verletzungen (ROBOT validate-profile DL). Das L0+L1+L2-Bundle (ohne L3) reduziert sich auf OWL 2 EL — Konsumenten wählen ihr Reasoner-Profil per Distribution.
Lizenz-Architektur: REUSE 3.3 konform (FSFE-Standard). Alle 5 352 Repository-Dateien tragen SPDX-License-Identifier-Annotationen. Pro-Pfad-Mapping in REUSE.toml (ADR-103 v3).
Norouzi-Validierung: alle neun Quality-Requirements erfüllt
Die Norouzi-et-al.-Studie (2024) klassifiziert 94 MSE-Ontologien und definiert neun Quality-Requirements, gegen die OCO v0.94 vollständig validiert ist:
| REQ | Anforderung | OCO-Erfüllung |
|---|---|---|
| REQ1 | Modularität | 44 Module, 4 Schichten, 2 Audiences — explizit getrennt |
| REQ2 | Adaptierbarkeit | Cache-Pattern mit versionspinnten Manifesten, 40 Bridge-Sektionen unabhängig versionierbar |
| REQ3 | Interoperabilität | 11 substantielle L0-Targets, 829 Cross-Ontology-Mappings, ELN-Filetype-Bridge (14 Systeme) |
| REQ4 | Purpose (CQ-Verankerung) | 163 publizierte CQs in 10 Reasoning-Areas, 52 ausführbar mit Goldstandard-ABoxes |
| REQ5 | Equality (bilinguale Definitionen) | DE/EN als SHACL-Pflichtfelder — unter den 94 Norouzi-Ontologien die einzige mit hartem Schema-Constraint hierzu |
| REQ6 | Kompatibilität | OWL 2 DL kompatibel, ROBOT validate-profile clean, HermiT-konsistent |
| REQ7 | Funktionalität | Neumann-Engine + Phase-State-Coupling als operative Reasoning-Komponenten |
| REQ8 | Autoritativität | 132 ADRs mit Begründung; 7-Schichten-Mechanistik macht „warum?” abfragbar |
| REQ9 | Facettierung | Multi-Axis-Klassifikation für Material-Parameter (Rolle × Referenz × Material-Abstraktion) |
Zusätzlich: OOPS!-Pitfall-Scanner-Audit clean (0 kritische, 0 wichtige Pitfalls). 5 von 9 OCO-Engineering-Prinzipien (Modularität, Adaptierbarkeit, Interoperabilität, Authoritativität, Facetierung, plus die drei Modularitäts-Erweiterungen) gehen über den Norouzi-REQ-Kanon hinaus.
Sister-Project-Reuse — die L1-Wiederverwendbarkeits-Behauptung
Die Architektur ist so entworfen, dass eine Metallurgie-, Polymer-, Batterie- oder Pharma-Ontologie L0+L1 mit OCO teilen und nur L2 ersetzen kann. Die Equipment-, Sample-, Provenance-, Identifier-, Investigation-Klassen bleiben unverändert.
Der erste empirische Belege-Pass ist im Gang: ein zweites Keramik-Materialsystem (ferritische Hochleistungs-Keramik) wird parallel als Sister-Pilot entwickelt und validiert die L1-Wiederverwendbarkeit innerhalb der Keramik-Familie. Die ferritische Variante stresst zusätzlich das 7-Schichten-Skelett auf der magnetischen Seite (Bloch-/Néel-Wände, Superexchange, Jahn-Teller-Distortion).
Offene Einladung an die Schwester-Domänen: Metallurgie, Polymere, Batterien, Pharma — wir teilen L0+L1, ihr beitragt euer eigenes L2. Das ist die erste echte Cross-Domain-Validierung der Architektur — und der Grund, warum die Release v0.94 heißt, nicht v1.0.
Architektur-Argument: Open/Closed-Mix als Eigenschaft, nicht als Workaround
Ein nicht-offensichtlicher Vorteil strikter Schicht-Trennung: die Architektur ermöglicht ein gemischtes Open/Proprietär-Distributions-Modell, das flache Ontologien nicht anbieten können.
In der aktuellen Release: L0 unter CC-BY 4.0 (mirror der Bridge-Targets PMDco, EMMO, PROV-O, FaBiO; QUDT Apache-2.0). L1 ohne oco-supplier unter CC-BY-SA 4.0, mit Dual-Lizenz zu CC-BY auf Anfrage. oco-supplier, das gesamte L2 und L3, sowie alle Compliance-Module unter Projekt-Vertraulichkeit, in dieser Release proprietär.
Dieselben modularen Grenzen, die diesen Schnitt sauber machen, würden in einer zukünftigen Konfiguration auch per-Modul-Wahl ermöglichen: ein Schwesterprojekt unter anderen kommerziellen Constraints könnte einen anderen Subset öffnen oder schließen, ohne zu restrukturieren. Dieser Mix ist in monolithischen Ontologien (alles-oder-nichts-open) und in rein proprietären Industrie-Schemata (keine externe Adoption) strukturell unmöglich.
Externe Caches als Architektur-Pattern
Tiefe ohne TBox-Inflation: Referenz-Daten-Korpora werden als version-pinned lokale Caches angeschlossen, nicht in die OWL-Hierarchie embedded. Die OWL-TBox bleibt mit ~5 200 Klassen reasoner-trivial; Konsumenten können trotzdem gegen ~155 000 Materials-Project-DFT-Records, 1 934 IUCr-BVPs, 1 731 Wyckoff-Positionen, 497 Shannon-Radien und 91 Pauling-Werte queryen. Pro Cache: SHA-gepinnt in bridge/external_versions.yaml.
Architektonisch entscheidend, weil eine flache Alternative entweder die Referenz-Daten als TBox-Klassen embeddet (unbehandelbar für den Reasoner) oder sie ganz außerhalb des Knowledge-Graphs lässt (Provenance-Verlust). Das Cache-Pattern macht beide Probleme gleichzeitig handhabbar.
Beispiel-Competency-Questions
Sechs aus den 163 publizierten CQs, die für Ontologie-Architekten und -Reviewer besonders relevant sind.
Welche ADRs dokumentieren die Audience-Achse, und welche Modellierungs-Alternativen wurden verworfen?
plan/decisions/* · ADR-IndexWelche L3-Axiome heben die Distribution von OWL 2 EL auf OWL 2 DL?
oco-master_full.ttl · ROBOT validate-profile · executable SPARQLWelche SHACL-NodeShape prüft die Cross-Layer-Annotation zwischen Schicht 2 (Energie/DFT) und Schicht 6 (Defekt-Chemie)?
shapes/m72_cross_layer_shapes.ttl · ADR-134Welche Norouzi-REQs sind aktuell erfüllt, und mit welcher konkreten Architektur-Maßnahme?
audit/norouzi_req_coverage.md · REQ1-REQ9Welche Bridges sind seit der letzten Release nachgezogen, und welche Mapping-Anzahl haben sie?
bridge_mappings.yaml · bridge/external_versions.yamlWelche Modul-Profile gibt es als owl:imports-Wrapper, und welche Module bündeln sie?
Bezug zur OCO-Distribution
Die volle Lizenz-Architektur — REUSE 3.3 mit pro-Pfad-SPDX-Mapping über alle 5 352 Repository-Dateien — ist in der OCO-Distribution dokumentiert. CC-BY-4.0-Anteile (bridge/**) und CC-BY-SA-4.0-Anteile (L1-Skelette der Material-Audience-Module außer supplier/material/compliance) sind direkt downloadbar; die proprietären Anteile (Compliance komplett, Material-/Supplier-Detail, L2/L3, SHACL-Implementierung, L3-Axiome, Generator-Stack) auf Anfrage. ROBOT-Validierungs-Reports, Norouzi-REQ-Coverage-Audit und das vollständige ADR-Verzeichnis sind Bestandteil des proprietären Doku-Pakets. → Distribution & Lizenz-Architektur