Inlägg

Saker jag stjäl från UML

UMLs klassdiagram har ett par uttrycksmedel som jag saknar i de vanliga ER-notationerna. Det finns inget som hindrar att vi ”lånar” in dessa.

Jag brukar använda den vanligaste notationen för informationsmodeller, det vill säga JMIE (James Martin Information Engineering), kanske mest känd som ”Crow foot notation” (kråkfotsnotation). Främst för att den är vanligast i de sammanhang jag jobbar. Men i den notationen saknar jag ett par saker som finns i UML. Då brukar jag helt sonika låna in dessa.

Ett försvar för att låna från olika notationer

Jag kan tänka mig att en och annan nu sätter kaffet i vrångstrupen bara av tanken på att blanda notationer. Man tycker det är viktigt att vara korrekt, följa regler och att alla gör likadant.

Mitt försvar är att det finns en tid för regler och konsekvens, och det finns en tid för experimenterande och utveckling. Informationsmodellering har som kunskapsområde stått still, i min mening stelnat redan för flera decennier sedan.

Ska vi få till en utveckling av området behöver vi experimentera. Vi behöver vara nyfikna, inspireras från andra områden, kombinera idéer och prova oss fram. Standardisera kan vi vänta med tills vi kommit fram till något som känns någorlunda stabilt. Och dit har vi en bit kvar.

I det följande redovisar jag det jag saknar i vanliga ER-notationer men som finns i UML, och som jag därför fräckt och oblygt lånar in.

Supertyp och subtyp separerade från varandra

Om en entitet är en generalisering av två eller flera andra så ritar man i de vanliga ER-notationerna den generaliserade entiteten (supertypen) som en ram runt de specialiserade entiteterna (subtyperna).

I UML ritar man i stället subtyperna separerade från supertypen, och en relationslinje emellan dessa med en ofylld triangelspets i änden mot supertypen.

(Det finns dock även en del äldre ER-notationer som också separerar super- och subtyp på samma sätt som UML. Relationen kallas då
”is-a”-relation)

Båda ritsätten har sina styrkor och svagheter menar jag.

Fördelen med ritsättet med supertypen som ram är att det intuitivt ger en bättre förståelse för vad det handlar om. Relationen mellan sub- och supertypen är inte en relation mellan två separata företeelser, utan en relation mellan två begrepp, ett mera generellt och ett mera specifikt. En sådan relation har alltså en helt annan natur än de vanliga relationerna som övriga streck representerar. Därför är det bra med ett ritsätt som kraftigt avviker från övriga relationer.

Supertypen är ett mer generellt begrepp för samma företeelser som subtypen. En förekomst av subtypen är samtidigt en förekomst av supertypen. Det finns på så sätt en likhet med de Venndiagram som vi minns från skolans mängdlära. Ritsättet gör att risken minskar att en ovan betraktare av en informationsmodell ska tro att en motorfordonsförsäkring är något annat än en försäkring.

Med UMLs ritsätt är det däremot lätt för en ovan betraktare att tro att vi, precis som med andra typer av relationer, har två olika företeelser med olika förekomster. Där har vi svagheten att relationer med så helt väsensskilda naturer har så lika grafisk gestaltning.

Men det finns också en baksida med ritsättet i JMIE. Det finns tillfällen då det blir omöjligt att rita subtyperna inuti supertypen. Det är när varje subtyp behöver veckla ut sig till ett eget ämnesområde med många egna entiteter runtomkring som är unika för just det ämnesområdet. När det behovet uppkommer ritar jag som i UML, trots att jag i övrigt använder JMIE. Det vill säga sub- och supertyper för sig, förbundna med en linje med en ofylld triangelformad pilspets.  

Komposition

Det är vanligt att två entiteter har en särskilt existentiell koppling. Det vill säga att en förekomst av en entitet inte kan existera oberoende av en förekomst av en annan entitet. Ett exempel är en faktura med en eller flera fakturarader. Relationen mellan faktura och fakturarad innebär en mycket starkare koppling än vanliga relationer. En fakturarad har nämligen ingen självständig existens, den kan aldrig existera utan att tillhöra en faktura, den kan inte byta faktura, och om fakturan raderas så försvinner också fakturaraden. I en del äldre notationer kallas den beroende entiteten för beroendeobjekt. Jag tycker att en informationsmodell blir mycket tydligare om man tydligt kan uttrycka den starka relationen.

I de vanliga ER-notationerna finns det ingen möjlighet att uttrycka detta på annat sätt än med den vanliga min 1 – max 1-symbolen, trots att det är en koppling som är väsensskild från vanliga min 1 – max 1-kopplingar.

I UML kallas den relationen komposition och uttrycks med en romb och en pilspets enligt bild. Egentligen ska romben vara fylld men den symbolen finns inte som standard i Visio så vi får nöja oss med en ofylld.
Inom parentes sagt: Den ofyllda romben uttrycker i UML ett aggregat, vilket i praktiken är samma som en min 1 – max 1-koppling, och därför är tämligen meningslös. Jim Rumbough, en av grundarna till UML, liknade det själv vid placebo och Martin Fowler ägnar en hel uppsats till att avfärda konstruktionen. 

Så fort jag har en relation i ett ER-diagram som har denna täta koppling så markerar jag det med en romb. På så sätt tycker jag att modellen blir tydligare. Man ser då vad som har en självständig existens och vad som är en integrerad del av en annan företeelse. Dessutom brukar jag placera entiteterna med den beroende entiteten placerad under och med vänsterkanten indragen från huvudentiteten, som bilden till höger visar. På så sätt vill jag tydlig signalera det nära och underställda beroendet.

Vilka innovativa idéer har du?

Jag vill med detta inspirera till experimenterande. Att vi kan lösa modellerings- och gestaltningsproblem på ett nyskapande sätt när så behövs. Vi ska inte vara rädda för att göra fel och måste inte alltid ”play by the book”. Ett område kan bara gå framåt när någon med ett tydligt syfte bryter mot ingrodda regler och ”sanningar”. Den lilla risken vi får ta är att våra modeller därmed blir lite brokigare. Men det är ett lätt pris om det kan bidra till att avancera hela vårt område.

Nu är det din tur. Vad brukar du göra annorlunda?

/Peter Tallungs

Nästa artikel i ämnet informationsarkitektur publiceras torsdag 24 juni. Då handlar det om mönster för informationsmodeller.
Vill du prenumerera på denna artikelserie? Registrera din mailadress här.

Modellera livscykler med tillståndsdiagram

I varje verksamhet finns det företeelser som transformeras till olika tillstånd. Dessa tillstånd är en central aspekt av verksamhetslogiken och är därmed något vi behöver definiera och hålla reda på. En informationsmodells ER-diagram behöver därför ofta kompletteras med tillståndsdiagram (Statecharts) för att visa vilka tillstånd ett verksamhetsobjekt kan växla mellan, vilka händelser som orsakar tillståndsförändringen och vilka orsakerna kan vara.

Verksamhetsobjekt har livscykler

De flesta verksamhetsobjekt har någon form av livscykel. Det brukar hanteras som att de har ett attribut som heter status med några fördefinierade värden. Ofta bara en kod, ibland även ett namn och om man har tur en tydlig definition. Här följer några exempel:

En kund kanske börjar sitt liv som ett prospekt (en intressent man tänker bearbeta för att bli kund). Sedan blir den en aktuell kund. Och till sist blir den en tidigare kund. Sedan kanske den någon gång kan återgå till prospekt. Eller till aktuell kund?

Ett ärende kanske börjar sitt liv som ankommet, sedan blir det under bearbetning för att till sist bli avklarat. Kan det då återgå till under bearbetning?

En produkt kanske börjar som under utveckling, sedan i produktion, sedan inte längre i produktion men fortfarande supportad, för att till sist bli avvecklad. Kan den någon gång senare gå i produktion, eller måste den då passera under utveckling?

En del verksamhetsobjekt kan ha fler än en tillståndscykel. Då brukar den ena cykeln vara den mer grundläggande, en som vi kan kalla för livscykel, som i exemplen ovan. Och de andra cyklerna handlar om andra tillstånd man vill hålla reda på. Till exempel kan ett bankkonto för tillfället vara övertrasserat eller inte övertrasserat. Det är inte samma sak som den mera grundläggande livscykeln som anger om kontot är öppet eller stängt, även om det naturligtvis finns orsakssamband mellan dessa.

Händelser och tillståndsövergångar

En händelse är något som inträffar med ett verksamhetsobjekt. Det kan till exempel vara att en kund gör ett köp eller att ett konto övertrasseras. Vanligen vill man hålla reda på olika typer av händelser. En händelse kan leda till att verksamhetsobjektet i fråga byter tillstånd, det vill säga en tillståndsövergång.Till exempel kan händelsen vara att vi avslutar en kundrelation och då blir kunden tidigare kund.

Orsaker till händelser

En och samma händelse kan ha olika orsaker. Ofta vill vi logga orsaken till en händelse. Om vi till exempel avslutar en kund kan det bero på en mängd olika orsaker. Kunden har kanske; inte uppfyllt sina skyldigheter, avvecklat sin verksamhet, avlidit, blivit dömd för olaglig verksamhet etcetera. Eller kanske har vi en gräns, så att vi automatiskt avför kunder som inte hörts av på ett par år.

Skilj på tillstånd, händelse, tillståndsövergång och händelseorsak

Vi ser ofta att man med sina statuskoder blandat ihop dessa saker. Så fort det kommit behov av att man vill följa något för mätetal och rapportering har man bara lagt till en kod till befintligt status-attribut. Vi hamnar ofta i situationer där vi behöver reda ut detta.

Vad är då ett tillstånd?

Med tillstånd menar vi ett läge som ett verksamhetsobjekt hamnat i vilket medför ett visst beteende och oberoende av hur det kom till detta läge. Ett avslutat konto beter sig på samma sätt, lyder under samma regler oberoende av orsaken till att det avslutades.

Tillståndsdiagram

För att modellera tillstånd, händelser, tillståndsövergångar och händelseorsaker räcker det inte med ER-diagram. Då behöver vi komplettera vår informationsmodell med en annan typ av diagram som heter tillståndsdiagram (Statechart eller Harel Statechart). Det är en diagramtyp som alla ingenjörer och programmerare som utvecklar inbyggda system är förtrogna med, men som är mer eller mindre okänd bland informationsmodellerare utan denna bakgrund.

På mina kurser brukar jag fråga hur många av eleverna som känner till och har använt tillståndsdiagram. Det brukar vara omkring hälften, vanligen de med en ingenjörsteknisk bakgrund. Sedan frågar jag hur många av dessa som har använt tillståndsdiagram för någon typ av verksamhetsmodellering. Då åker nästan alla händer ner. De har tydligen trott att tillståndsdiagram inte har sin användning annat än i rent tekniska sammanhang. Inget kan vara mer fel.

Tillstånd, händelser och händelseorsaker är viktiga företeelser i varje verksamhet. Det är grundläggande för att hålla reda på saker och ting, och är därför en viktig del av en informationsmodell. Då är det lämpligt att vi som informationsmodellerare utökar vår verktygslåda till att omfatta även tillståndsdiagram.

Men är det inte det vi har processmodellen till?

Det finns en viss likhet mellan å ena sidan ett tillståndsdiagram och å andra sidan en processmodell eller flödesschema. Båda visar det dynamiska beteendet hos något verksamhetsobjekt. Men skillnaderna är följande:

  1. En processmodell visar en viss process, det vill säga på ett visst flöde. Ett tillståndsdiagram visar alla flöden som är möjliga.
  2. En processmodell visar sällan tillstånd och händelser, utan vad som utförs för att åstadkomma ett resultat. Ett tillståndsdiagram ger reglerna för hur ett objekt kan och inte kan uppträda, genom alla processer det deltar i.
  3. I processmodellen sker det som sker i symbolerna (processfiskarna). Händelserna och tillstånden finns på strecket mellan symbolerna. I tillståndsdiagrammet händer det däremot inget i symbolerna (tillståndssymbolerna). Det är först i strecken mellan som det sker saker som ändrar tillstånd.
  4. Processmodellen är ofta inte heltäckande. Den visar de vanligaste scenarierna, inte allt som kan hända med ett verksamhetsobjekt. Ett tillståndsdiagram ska visa alla tillåtna tillstånd och händelser. Tillståndsdiagram beskriver reglerna för transformationer medan processer beskriver olika vanliga scenarier för transformationerna.

Sambandet mellan en processmodell och ett tillståndsdiagram

En processmodell och ett tillståndsdiagram har ett samband så till vida att allt som sker i processmodellerna bör täckas av tillståndsdiagrammet för samma verksamhetsobjekt.

Här förutsätter jag att vi talar om en processmodell som inte bara visar en serie arbetssteg i största allmänhet utan som är ren i den bemärkelse att processen beskriver hur ett och samma verksamhetsobjekt förädlas eller på annat sätt ändras genom en serie transformationer.

Sambandet mellan ett ER-diagram och ett tillståndsdiagram

Ett ER-diagram och ett tillståndsdiagram har ett samband så till vida att varje möjligt tillstånd, varje händelse och varje tillståndsövergång och händelseorsak som vi behöver hålla reda på behöver representeras i ER-diagrammet, som förekomster till entiteter. Jag brukar lista dessa i själva diagrammet med både namn och definition.
Tillståndsdiagrammet hjälper oss sålunda att undersöka och illustrera det dynamiska beteendet hos ett verksamhetsobjekt. Själva definitionen av tillstånd, händelser och orsaker finns i ER-diagrammet eller i textdelarna av modellen.

Var i informationsmodellen placerar jag tillståndsdiagrammet?

Det beror på i vilket sammanhang tillståndscykeln är viktig att beskriva, vilket varierar något. Jag brukar växla mellan tre olika placeringar.

  1. I textdelen av den allmänna beskrivningen av entiteten i fråga. Det gör jag när det handlar om en livscykel som är central för att förstå entiteten ifråga.
  2. I textdelen för beskrivning av attributet som representerar tillståndet, det vill säga det som brukar heta ”status”. Det gör jag när det inte handlar om en livscykel för objektet utan någon annan mindre central cykel av tillstånd.
  3. I ER-diagrammet tillsammans med de entiteter som representerar tillstånd, händelser och orsaker. Det gör jag i så fall i kombination med någon av beskrivningarna i textdelen ovan.  

Exempel på användning av tillståndsdiagram

Vi på IRM byggde för en tid sedan ett Data Warehouse hos en bank som köpt upp flera andra bankföretag. Bankföretagen hade liknande betalningsprodukter men det hade utvecklats olika avtalsstrukturer. Alla hade någon form av avtal för sina kunder. Alla system hade någon form av status för sina avtal, men man hade över åren bara lagt till nya statuskoder för allt möjligt som man ville hålla reda på.

Systemen behövde nu kunna rapportera in sina data i samma format så att vi i Data Warehouse kunde skapa översikter oberoende av hur de olika systemen såg ut internt. Vi var alltså tvungna att skapa ett ”lingua franca”, ett gemensamt språk för tillstånd, händelser och händelseorsaker. Vi samlade de som visste mest om detta och var mest beroende av att tolka dessa koder, det vill säga marknads- och riskanalytikerna. Sedan ritade vi upp en första version av ett tillståndsdiagram med de tillstånd och händelser vi trodde på.

Därefter fick analytikerna gå igenom en mängd olika händelsekedjor och se hur de passade in i livscykeln. Vi ändrade många gånger tills alla var nöjda. Vi jobbade mycket med namn och definitioner. Sedan fick de som var ansvariga för respektive system bygga översättningar från sina lokala språk till vårt nu gemensamma språk. Det hade varit svårt att åstadkomma detta på ett annat sätt än med tillståndsdiagram.

När behöver man ett tillståndsdiagram?

Man behöver kanske inte tillståndsdiagram för linjära cykler då ett objekt bara kan gå en rak väg längs en serie av tillstånd. Men man behöver i vilket fall lista tillstånden, se till att de har bra namn och definitioner, samt definiera händelser och orsaker till tillståndsförändringarna. Och för att vara alldeles säker på att ett objekt inte kan gå tillbaka till tidigare tillstånd bör man gå igenom alla tänkbara scenarion. Ett effektivt sätt är att undersöka befintligt data. Har det hänt att en avslutad kund har återöppnats? Eller blir denne definitionsmässigt en ny kund då?

Vad är en informationsmodell egentligen?

Jag menar att en informationsmodell inte måste vara samma sak som ett ER-diagram. Det behöver alltid finnas ett eller flera ER-diagram som bas i informationsmodellen, men vi behöver fler diagramtyper för att komplettera, då ER-diagram inte lämpar sig för att gestalta det vi behöver gestalta. Tillståndsdiagram är ett exempel på ett sådant komplement.  

Vi behöver helt enkelt utveckla vår verktygslåda, bruka de verktyg som gör jobbet. Inte bara bli operatörer av de oss givna verktygen. Många som informationsmodellerar känner bara till ER-diagram. Du är säkert bekant med liknelsen att om man bara har en hammare så ser man bara spikar, och bankar ner både spikar och skruvar.

Hur lär jag mig mer om tillståndsdiagram?  

Det finns gott om material om tillståndsdiagram, både i böcker och på webben. Googla ”Statecharts”. Har du använt tillståndsdiagram till informationsmodellering?

/Peter Tallungs, IRM

Nästa artikel i ämnet informationsarkitektur publiceras torsdag 10 juni. Då handlar det fortsatt om notationer för informationsmodellering, men vi går närmare in på notationer för tillståndsdiagram.
Vill du prenumerera på denna artikelserie? Registrera din mailadress här.